搜索

浪潮信息发布源2.0基础大模型，千亿参数全面开源

浪潮信息

2023-11-27 19:30 12905

北京2023年11月27日 /美通社/ -- 11月27日，浪潮信息发布"源2.0"基础大模型，并宣布全面开源。源2.0基础大模型包括1026亿、518亿、21亿等三种参数规模的模型，在编程、推理、逻辑等方面展示出了先进的能力。

当前，大模型技术正在推动生成式人工智能产业迅猛发展，而基础大模型的关键能力则是大模型在行业和应用落地能力表现的核心支撑，但基础大模型的发展也面临着在算法、数据和算力等方面的诸多挑战。源2.0基础大模型则针对性地提出了新的改进方法并获得了能力的提升。

算法方面，源2.0提出并采用了一种新型的注意力算法结构：局部注意力过滤增强机制(LFA：Localized Filtering-based Attention)。LFA通过先学习相邻词之间的关联性，然后再计算全局关联性的方法，能够更好地学习到自然语言的局部和全局的语言特征，对于自然语言的关联语义理解更准确、更人性，提升了模型的自然语言表达能力，进而提升了模型精度。

数据方面，源2.0通过使用中英文书籍、百科、论文等高质量中英文资料，降低了互联网语料内容占比，结合高效的数据清洗流程，为大模型训练提供了高质量的专业数据集和逻辑推理数据集。为了获取中文数学数据，我们清洗了从2018年至今约12PB的互联网数据，但仅获取到了约10GB的数学数据，投入巨大，收益较小。为了更高效地获得相对匮乏的高质量中文数学及代码数据集，源2.0采用了基于大模型的数据生产及过滤方法，在保证数据的多样性的同时也在每一个类别上提升数据质量，获取了一批高质量的数学与代码预训练数据。

算力方面，源2.0采用了非均匀流水并行的方法，综合运用流水线并行+优化器参数并行+数据并行的策略，让模型在流水并行各阶段的显存占用量分布更均衡，避免出现显存瓶颈导致的训练效率降低的问题，该方法显著降低了大模型对芯片间P2P带宽的需求，为硬件差异较大训练环境提供了一种高性能的训练方法。

源2.0作为千亿级基础大模型，在业界公开的评测上进行了代码生成、数学问题求解、事实问答方面的能力测试，测试结果显示，源2.0在多项模型评测中，展示出了较为先进的能力表现。

源2.0采用全面开源策略，全系列模型参数和代码均可免费下载使用。

代码开源链接

https://github.com/IEIT-Yuan/Yuan-2.0

论文链接

https://github.com/IEIT-Yuan/Yuan-2.0/blob/main/docs/Yuan2.0_paper.pdf

消息来源：浪潮信息

全球TMT

微信公众号“全球TMT”发布全球互联网、科技、媒体、通讯企业的经营动态、财报信息、企业并购消息。扫描二维码，立即订阅！

关键词：电脑软件电脑/电子互联网技术电信业人工智能云计算/物联网

企业新闻室更多

携手元脑伙伴共创"伙伴主导"合作新模式！浪潮信息增值渠道精英俱乐部正式成立

2026-05-26 10:42

2949

智能体发布前不能遗漏的一步！元脑企智EPAI：用量化评估补齐上线前关键环节

2026-05-11 10:58

5328

浪潮信息AIStation推出企业Token服务平台！

2026-04-28 17:11

4881

浪潮信息直播发布业界首个企业级OpenClaw方案"企千虾"

2026-04-03 20:11

9271

浪潮信息AIStation 5.4发布：打造企业级Agent算力底座，已支持OpenClaw

2026-03-04 17:15

8749

跑通 "产研用" 闭环，佛山南海构建 "AI+ 医疗卫生" 新生态，加速基层实践推广

2026-01-29 16:09

7932

相关新闻

源2.0大模型适配LLaMA-Factory框架微调训练快捷高效

2024-01-18 18:01

6856

浪潮信息发布 "源2.0-M32" 开源大模型，大幅提升模算效率

2024-05-30 17:52

5186

Figure1-& 基于注意力机制的门控网络（Attention Router）

源2.0适配FastChat框架，企业快速本地化部署大模型对话平台

2024-02-28 15:36

5969

源大模型AIPC助手YuanChat焕新！支持12种文档构建知识库+联网检索

2024-08-28 18:17

5549

让M32大模型在您的本地PC上完成任务，无需担心数据泄露风险

浪潮信息刘军：智算力系统创新加速生成式AI产业发展

2023-12-06 11:11

5928

浪潮信息刘军：智算力系统创新加速生成式AI产业发展

大模型开发生态加速进化，源2.0全面适配百度PaddleNLP

2024-10-13 15:38

13587

行业新闻

引领2030演进，WBBA正式发布数通领域全球权威评估体系AI-Net认证

2026-07-15 19:10

1053

AI-Net认证

深耕拉美，智联全球：移远马瑙斯研发中心正式启用

2026-07-15 10:40

962

蓝沃 AI 开源发布行业首个非标机加工工艺大模型「沃土」LevelField-1，工业 AI 从"数据智能"迈向"理解工业"

2026-07-16 12:09

622

行业首个开源机加工工艺大模型——沃土LevelField-1

ThinkingAI Agentic SDK 正式发布，支持鸿蒙 HMAF 2.0 生态

2026-07-14 12:30

2060

ThinkingAI Agentic SDK 正式发布

宜鼎将于WAIC 2026展出全栈生态系统解决方案，加速边缘AI规模化落地

2026-07-14 12:05

1661

宜鼎参展 WAIC 2026 世界人工智能大会

OpenAI GPT-5.6 Sol、Terra与Luna现已在Amazon Bedrock上正式可用

2026-07-14 11:20

963