首页 › 热点 › 正文

字节跳动豆包大模型团队开源一项MoE架构优化技术

fengjun 热点 5小时前 5

字节跳动豆包大模型团队近日开源一项名为COMET的MoE架构优化技术，可将大模型训练效率提升1.7倍。论文显示，该技术已实际应用于字节的万卡集群训练，实现数百万GPU小时训练算力的节省。