国产大模型DeepSeek-V3一夜火爆全球,671B的MoE,训练成本仅558万美元

机器之心 2024-12-27 11:03
DeepSeek-V3出技术报告了。
推荐阅读