同行谈DeepSeek破圈：有利于AI的发展，并不意味着其他模型没有机会。

2025-02-19

其他大型企业在DeepSeek破圈后如何看待？

2025全球开发者先锋大会（GDC）将于2月21日至23日在上海徐汇举行。2月17日下午，该报记者前往人工智能企业商汤科技和大型创业公司稀宇科技(以下简称MiniMax)，与两家公司相关负责人进行了交谈。

“DeepSeek的核心优势在于它的前后理解和深入思考。商汤模型在多种模式上有一定的优势。我相信不同的模型可以在不同的场景中发挥不同的优势。”商汤大设备产品总监刘叶枫认为。

谈到“同行”DeepSeek，MiniMax副总裁刘华对此赞不绝口，称DeepSeek在强化学习、计算率准备等方面都做得非常有创意。他认为，在迭代顶层R&D框架的前提下，R&D人员需要对技术变革有极致的热情。

“如果一个模型做得好，并不意味着没有其他模型的机会。很多同行认为DeepSeek做得很好，愿意主动访问和使用。这是一种非常开放的心态。我觉得挺好的。”刘华说。

商汤科技大厦内景图，位于上海淞河泾开发区。本文图片均为澎湃新闻记者俞凯摄

商汤：DeepSeek点爆，对整个AI生态和产业发展都是好消息。

本报记者在探营中了解到，2月8日，商汤大设备官方宣布将DeepSeek系列模型上架，企业客户和开发者可以在商汤大设备万象平台上快速部署DeepSeek-V3、DeepSeek-R1等模型，并且可以在3个月内享受1000万tokens的免费权益。

刘叶枫说，DeepSeek打破了这个圈子，更多的人使用它，并把它作为工作过程的一部分。未来可能会出现一系列的应用浪潮，无论是政府还是业主，未来的计算能力需求都会有更大的增长空间。

刘叶枫介绍了2025年全球开发者先锋大会商汤科技参会情况。

在商汤科技产品总监、浣熊家族产品负责人贾安亚看来，DeepSeek引发的这一波浪潮主要表现在三个方面:一是成本更低，包括一些架构的提升、实践和推理成本的降低，这对产业着陆至关重要；二是模型能力更强，主要体现在模型通过长思维链更强的推理能力上；三是多模式的结合，带来更多的实际应用场景。在医疗、金融、教育、工业等行业，以及协助编程、智能办公、智能客户服务、营销等方面，都有相当多的应用机会。

“在过去的几年里，一些新的AI技术也让每个人都觉得需要花费大量的教育成本，但是随着DeepSeek的爆炸，更多的人尝试使用它，这对整个AI生态和产业发展都是一个非常好的消息。最终落到实处还是客户价值，怎样为更多的人服务。我们也看到了一些开源模型在很多能力上的亮点，我们也希望保持产品的开放性和博主性，访问更多更好的模型。”贾安亚告诉记者。

贾安亚告诉记者，商汤将在本周末举行的全球开发者先锋会议上发布代码浣熊2.0，在协助编程和智能办公方面具有更丰富的功能，并邀请实际客户展示他们使用浣熊的实际体验。

MiniMax：如果一个模型做得好，并不意味着其他模型没有机会。

MiniMax位于上海徐汇区，是一家规模超过100人的大型创业公司，成立于2021年。该公司副总裁刘华告诉记者，今年1月，该公司还进行了一次大型开源。开源是MiniMax-01系列，这是世界上第一个实现线性注意力机制的大型机制模型。它的语音模型可以反映人类的喜怒哀乐，目前已经可以支持17种语言。

媒体记者访谈MiniMax

谈到“同行”DeepSeek，刘华毫不犹豫地称赞道：“DeepSeek在强化学习、计算率准备等方面都做得非常有创意，取得了相当大的进步和发展，因此迅速火出圈。作为AI行业的从业者，我们的感觉是，这个行业的技术迭代非常迅速，大型技术每隔几个月就保持了一个重要的突破频率，包括DeepSeek带来的创新。在接下来的两三年里，我们判断大型模型的能力将会提高数倍。”

然而，刘华也呼吁每个人都不要放松。“竞争非常激烈。不要说中国的大模式已经超越了弯道，不再需要关心和支持。我们仍然需要每个人的关心。”

以中国新能源汽车为例。中国的新能源汽车从1995年开始，到2024年，已经发展了近30年。在此期间，它经历了模仿、创新和赶上的阶段。目前基本处于超越阶段，大型企业也需要经历这样的过程。

在采访中，刘华还特别提到，这是由于大模型的开源。最近，各行各业的人都热衷于“提问”DeepSeek。在他看来，高水平大模型的开源有助于加快行业建设，让公众可以免费尝试优秀大模型的技术能力，帮助提高AI的渗透性，吸引更多的开发者参与大模型的研发。

但他还提到，问答助手还是属于AI模型初期的浅层次应用，只是解决了求知欲的问题，对提高生产力影响不大。“现在大模型的推理能力增强了，可以思考复杂的问题，给出复杂的答案，问一些特别简单的问题，其实是在浪费大模型的能力。事实上，在很多复杂的场景中，大型模型会有更多的用途，也能对生产力产生真正的立竿见影的效果。”

同时，刘华表示，在顶层R&D框架迭代的前提下，R&D人员实际上需要对技术变革有极致的热情。因此，我们可以看到，DeepSeek特别有趣的一点是，他们没有招募所谓大型行业的专家学者，而是招募了最多一两年的博士学位或者直接在行业内招聘。这些年轻人通常对技术变革有极端的热情。

“MiniMax也是如此。我们的R&D团队也很年轻，这是一个90后的世界。大多数人都不到35岁。很多医生还在读书的时候就来做见习生，然后一毕业就来公司签合同。”刘华说，在这次全球开发者先锋大会上，公司会邀请很多智能产品生产合作伙伴展示大模型的使用场景，向大家展示他们正在做的事情和创新。

“如果一个模型做得好，并不意味着没有其他模型的机会。目前很多同行认为DeepSeek做得好，愿意主动访问和使用。这是一种非常开放的心态，我觉得挺好的。”刘华说。

本文仅代表作者观点，版权归原创者所有，如需转载请在文中注明来源及作者名字。

免责声明：本文系转载编辑文章，仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布，请及时与我们联系进行审核处理或删除，您可以发送材料至邮箱：service@tojoy.com

延伸阅读

世界波35米！中超外援宝刀38岁比肩内马尔上个月刚刚结婚

黄仁勋亲信曝光：为中国设计芯片

肌肉顺滑，浓醇酸脆，香爆味蕾！

弘阳地产向发扬服务销售停车位6258个，总价约2.31亿元。

中学被曝禁止学生自带面包广东湛江多方回应

项目推荐

康小虎百岁计划・健康大使招募计划

康老板 · 氧疗堂