字节跳动豆包大模型团队开源MoE架构优化技术，训练成本节省40%

朝台手游网 03-10 阅读 67评论

感谢本站网友 HH_KK、某咸鱼的小号的线索投递！

本站 3 月 10 日消息，字节跳动豆包大模型团队官宣开源一项针对 MoE（混合专家模型）架构的关键优化技术，可将大模型训练效率提升 1.7 倍，成本节省 40%。据悉，该技术叫做 COMET，已实际应用于字节的万卡集群训练，累计帮助节省了数百万 GPU 小时训练算力。

本站注意到，早前豆包团队发布了新一代稀疏架构 UltraMem，将模型推理成本砍掉 83%，此次，又开源了 COMET，向模型训练成本出手。

目前，COMET 核心代码已开源，并计划兼容 Triton 等编译生态。

论文链接：https://arxiv.org/pdf/2502.19811

开源地址：https://github.com/bytedance/flux

文章版权声明：除非注明，否则均为朝台手游网原创文章，转载或复制请以超链接形式并注明出处。

《剑网3无界》预下载正式开启一起相约无界江湖！

向僵尸开炮全平台通用兑换码汇总礼包码亲测有效

相关阅读

爸爸与女儿亲密互动：爬上女儿肚皮的意义与影响

成品人和精品人到底有何不同？看完这些你会明白：两者生活态度的根本区别

酒馆纷争怎么玩 Tavern Brawl玩法技巧分享

如何顺利完成9.1免费版安装？详细安装步骤与常见问题解决指南

如何快速设置大地资源在线视频入口：解决常见问题的方法与技巧

《爆乳女警2》：女性英雄崛起，如何在暴力与智慧中平衡正义与邪恶？

如何选择最适合你的性船类型？奢华、私人、运动等多种选择解析

爸爸，我是你亲闺女：父亲与女儿之间深厚的亲情与默契

发表评论取消回复

快捷回复：表情：

Addoil

Applause

Badlaugh

Bomb

Coffee

Fabulous

Facepalm

Feces

Frown

Heyha

Insidious

KeepFighting

NoProb

PigHead

Shocked

Sinistersmile

Slap

Sweat

Tolaugh

Watermelon

Witty

Wow

Yeah

Yellowdog

评论列表（暂无评论，3374人围观）

还没有评论，来说两句吧...

目录[+]