拥有“压舱石”的中国大模型

2025-01-18

本文以公开资料为基础,仅用于信息交流,不构成任何投资建议。


新年伊始,讯飞马上召开了最新的模型发布会,距离上一次重大更新还不到一个季度。在这次发布会上,讯飞带来了三个大动作:


1)推出深层推理模型讯飞星火X1,作为国内计算能力平台唯一的深层推理大模型,中文数学能力在国内排名第一,并率先应用于教育、医疗等刚需场景;


2)升级星火 4.0Turbo 提升底座能力,进一步拓展多模态边界;


三是发布同声传译模型,最快的语音同声传译延迟低于 5 秒。


讯速,让我们看到全产业化。 AI 大模型能力上升的希望之路。在当前脱钩断线的时空背景下,自主控制具有更深刻的现实意义,中国 AI 行业也有真正意义上的压舱石。未来无论形势如何变化,每个人都有信心从容应对:中国大模型技术未来发展安全可控,商业化落地路径越来越清晰。


01


从“星火发布会窗口”看全栈国产产品 AI 的成色


大多数人都非常关心基于国内芯片、算法和算法的大模型之路是否可行。长期以来,讯飞星火坚持走全产业化路线,因此其发布会也成为业内人士观察全栈国产产品的一种方式。 AI 进步的关键窗口。


在此之前,2023 年 10 每月首个国产万卡算率集群“飞星一号”平台上线,后升级为国产超大型智算平台“飞星二号”,2024 年 1 月亮,讯飞通过国内计算能力平台训练出的千亿参数模型讯飞星火 V3.5 正式发布,性能参数处于国内领先水平,初步验证了这条路的可行性。


而且这次发布会,是观察这条路能否走得好的关键。


[1]迭代速度保持领先地位


从 23 从2008年开始到最新的新闻发布会,我们观察到星火模型迭代速度非常快,不用担心国内底座成为技术发展的制约因素。接近 2 年度关键时间节点来看:


2023 年 5 月 6 日,在 AI 全世界爆红之后不到 2 本月,讯飞星火大模型正式发布,具备文本生成、语言逻辑、知识问答、逻辑判断、数学能力、代码能力、多模态能力等七大核心能力。


2023 年 10 月 24 日本,为实现完全工业化,讯飞与华为携手自主研发计算率底座,联合发布了国内首个全国计算能力平台“飞星一号”,正常支持万亿参数的大模型训练。


2024 年 1 月 30 日本,第一个基于全国计算训练的讯飞星火。 V3.5 与此同时,还发布了星火语音大模型,首批支持。 37 一种主流语言。


2024 年 6 月 27 日,科大讯飞发布了讯飞星火。 V4.0、七大核心能力正在全新升级, 8 国际主流测试集中排名第一。


2024 年 10 月 24 日本,基于“飞星一号”平台,星火大模型已经升级为 4.0 Turbo 根据真实数据的测试,该版本的七项核心能力在中文领域全面超越 GPT-4 Turbo,超越数学和代码能力 GPT-4o。


2025 年 1 月 15 日本,科大讯飞继续深入大模型产业化“无人区”,正式发布星火深度推理模型 X1,同时启动星火语音同传大模型;另外,讯飞星火 4.0Turbo 底座能力 产业能力再次升级。


讯飞大模型的迭代速度和频率与世界第一梯队制造商保持一致,直接证明了基于国产计算能力和算法的大模型之路的深度可靠性。


[2]能力堪比世界第一梯队。


经过近两年的百模大战,AI 从 2025 2008年正式进入推理时代,所以这次讯飞发布会自然是目前国内计算能力平台上唯一的深层推理模型——星火深层推理模型。 X1。


新闻发布会上,科大讯飞研究院依次展示了讯飞星火。 X1 回答高考题,AIME 高中奥赛题的竞赛题和表现,X1 不但准确地给出了这些问题的答案,而且详细地拆解了解决问题的思路和步骤。


通过做题的案例,也首次揭秘了星火。 X1 三个特点:复杂简化,可以分步拆解简化复杂问题;自我探索、反思和验证;根据答案是否正确进行训练。与一般的大模型相比,这种能力是一种更接近人类的“慢思维”方式。


这种方式是 X1 能力突出的关键。星火深层推理模型 X1 近来还参加了小初高(包括比赛)、大学(包括竞赛)、AIME、MATH 500 等待多次考试,交出一份很亮眼的“考试成绩单”:利用较少的计算率,达到行业一流效果,多项指标在国内排名第一。


此外值得注意的是,与训练相比,推理阶段更追求成本效用,便宜好用是商业化落地的最大前提。


水滴石穿非一日之功。在本次发布会上推理模型 X1 科大讯飞从成立之初就一直保持着对科大讯飞的惊艳表现。 AI 专注,以及近年来不断大手大脚加强对R&D的投入。


图片:科大讯飞研发支出


此外,讯飞的底座星火 4.0 Turbo 能力也迎来了全新的升级,之前的七大核心能力得到了全面的提升,比较或超越 OpenAI 最新版的 GPT-4o。


更重要的是,这次升级最重要的特点是提高数学能力、行业知识、图文识别、长文本能力等能力。针对行业和公司的痛点。比如数学能力,星火 X1 高质量的生成数据,让讯飞星火 4.0 Turbo 随着数学能力的提高,数学教学、金融分析、科研推演等方面的作用也越来越大。


一般而言,星火 4.0 Turbo 成为更加了解行业的通用大模式,为千行百业赋能提供有力支持。


随着地缘矛盾的加剧,掌握科技革命的底层资产是应对未知的重中之重。AI 大模型的底层资产是计算能力和算法。在奇点爆发后,讯飞星火成为现阶段唯一掌握底层资产的大模型。随着国内计算率的提高,科大讯飞逐渐成长为中国人工智能的“国家队”。


“全栈中国计算率”的意义不仅仅是为了应对偶然的地缘矛盾,更是为了证明技术不会卡在脖子上,安全可控,开发者可以继续沿着这条路努力。此外,新闻发布会的一条暗线是,星火模型正在朝着应用的方向快速完善,这意味着应用程序在未来的国内生态中可以繁荣。


02


掌握自主" know how ",是国产模型的新核心


[1]成为大型国家队的前提是 know-how


我们没有发明计算机,但我们依靠摩尔定律成为世界上最大的计算机制造商。我们没有发明互联网,但我们依靠高带宽成为世界领先的移动应用市场。


然而,过去的荣耀根植于一个渐行渐远的全球时代。那时候我们只需要完成一个产业链分工的环节。当时无论是脱钩断线还是小院高墙,都证明了全栈自主化的紧迫性和重要性。


在 AI 在大模型的竞争中,英伟达走向全球 AI 参与者依靠工程能力输出, CUDA 以及英伟达的解决方案,只要市场上所有的玩家都有钱,他们就可以建立一个100卡、1000卡甚至1000卡的计算集群。我们可以依靠英伟达做出更强的模型和更强的应用,只是底层的。 Know-how 与工业运作逻辑仍然掌握在英伟达,OpenAI 们手里。


另外,现阶段 AI 随着数据安全的发展,发展越来越受到限制。毕竟大模型的实践依赖于优秀的数据和语料材料,信息是企业的核心生产要素之一。对于国防安全和产业自主性来说,拥有一个自主可控的模型越来越重要。


计算率也就是国力的后半部分,模型安全就是国防安全。由于美国对大型出口也逐步严格控制,这层窗纸已被戳破。所以,现阶段我们国家真正需要的是掌握它。 AI 最底层的大模型 Know-how,掌握 AI 每个芯片,每一行代码,每一个数据,从基本计算率层到网络层的所有运行逻辑。


[2]只有这样,才能成为行业放心的底座。


对于国计民生的重要行业,尤其是中国国有企业阵营,我们应该是一支具有中国科技发展结晶的国家队。 AI 转型护航。


在模型之前,科大讯飞承担了国家发展和改革委员会、工业和信息化部、科技部和中国科学院的许多国家战略任务。近年来,全栈国产化的“讯飞星火”模式在速度和能力上继续领先行业,自然成为央国企转型。 AI 时的首选。


2024 年 10 月 14 日本,中国海油联合科大讯飞和中国电信打造的“海能”人工智能模型正式发布。为了解决央企垂直领域的核心痛点,共推出了具有海油特色的 5 一个专业的场景模型和 6 一个通用的场景模型 .


针对海上油田稳产增产、安全钻井、海上制造、设备维护等方面的专业场景模型,LNG(液化天然气)贸易、油气销售等场景,构建数据驱动、业务协调的新模式,进一步提升产业数量智能化水平。通用场景模型根据招标采购、员工健康、协助办公等需求推出智能应用,帮助提高业务管理和工作效率。


事实上,不只是中海油、中国移动、交通银行等行业标杆中央国有企业选择与科大讯飞合作打造大模式。到目前为止,讯飞已与央国有企业和国有企业合作 20 多行业龙头企业共同发布大型行业模式,覆盖行业 300 多个应用领域。在积累了100多个应用领域的经验之后,讯飞星火 4.0Turbo 行业能力也将再次升级,了解更多的行业 know-how,成为“最懂行业”的大模式。


第三方数据显示:是的 2024 科大讯飞年度模型招标中的中标人数(91) 个别中标项目)和中标金额(8.5 亿元)均位居第一,成为第一, 2024 年度大模型中标项目的“标王”包括通信、金融、能源、教科、政务、医疗等多个行业,以中央国有企业客户为主。


03


星火 X1 推动中国率先进入深层推理时代


以往,科大讯飞一直坚持“技术顶天,应用立地”的发展理念,推动大规模应用落地,以求尽快实现。 AI 生态闭环。公司早在 2023 在年报中,公司用一张“业务全景示意图”来描述讯飞对其的描述。 AI 生态学愿景规划:基于全栈自主化的关键 AI 技术,赋能 C 端、B 端、G 终端,最终实现双赢。


图片:业务全景示意图 来源:公司 2023 年年报


在时间维度上,应用落地的迫切性日益增加。2025 年随着 AI 正式进入推理年,整个行业都需要回答如何收回天量投资,答案是只有应用。而且星火 X1 重磅推出,正将讯飞在一年前画画的愿景描绘成一条清晰的应用落地商业化路线。


比如教育、医疗、星火等讯飞传统优势, X1 起到了点睛之笔。


去年,讯飞联合中国教育科学研究院,发布了基于“问题链”的高中数学智能教师助理,并正在为全国100个试点地区、1000名优秀教师和研究人员和教师创造数万个优秀案例。目前,星火 X1 上述试点区域已经部署,X1 在一题多解、教学知识关联、学生高阶思维拓展等方面表现突出,得到一线教师的高度认可。


在讯飞的拳头产品中,我们也不难推断。 AI 在学习机上,星火具有“慢思维能力和深度推理能力” X1,立刻成为学生和家长的左膀右臂,AI 推荐和诊断学习机会将变得更加准确,解决问题的思路和知识链将更加清晰。


讯飞星火在医疗领域 X1 模型战略已经取得了初步的验证效果,专科辅助诊断和复杂病历内涵质量控制的准确性已经达到 90%,在新闻发布会上,讯飞还宣布将于今年上半年正式发布基于讯飞星火的新闻。 X1 大型医疗模型升级版,在更大范围内为医生提供更专业、更高水平的帮助。


不只是教育和医疗,X1 讯飞得到了很大的提升 AI 引力,加快 AI 形成生态:


B 端,X1 除了提高其他垂直行业的用户体验和产品渗透率,展望更多的想象空间外,还可以加速教学、医疗、汽车等现有场景的商业价值闭环;


C 终端、学习机、文档、翻译等标准化产品更符合使用习惯,会让更多的消费者受益。


G 端和央国企侧面,X1 同时也有助于讯飞做深做透,更好地降低成本。


经过技术迭代,产品落地,并实现多端共振的正反馈,商业化路径自然会逐步清晰。


04


中国 AI 星火之旅,国家队


AI 这是一场历史性的科技创新。没有人能逃脱时代的浪潮。我们能做的就是乘势而上,踏上浪潮。从 2023 年爆发至今 AI 快速发展满打满打算不到。 2 2008年,未来只会有更多的精彩,当然风暴也会越来越大。


历史总是在动荡中前进。幸运的是,这一次,我们抓住了舵,掌握了自己的命运,也有了竞争的信心。我们已经和讯飞一起开始了星火燎原的征程。


本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。

免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com