同行谈DeepSeek破圈:有利于AI的发展,并不意味着其他模型没有机会。
其他大型企业在DeepSeek破圈后如何看待?
2025全球开发者先锋大会(GDC)将于2月21日至23日在上海徐汇举行。2月17日下午,该报记者前往人工智能企业商汤科技和大型创业公司稀宇科技(以下简称MiniMax),与两家公司相关负责人进行了交谈。
“DeepSeek的核心优势在于它的前后理解和深入思考。商汤模型在多种模式上有一定的优势。我相信不同的模型可以在不同的场景中发挥不同的优势。”商汤大设备产品总监刘叶枫认为。
谈到“同行”DeepSeek,MiniMax副总裁刘华对此赞不绝口,称DeepSeek在强化学习、计算率准备等方面都做得非常有创意。他认为,在迭代顶层R&D框架的前提下,R&D人员需要对技术变革有极致的热情。
“如果一个模型做得好,并不意味着没有其他模型的机会。很多同行认为DeepSeek做得很好,愿意主动访问和使用。这是一种非常开放的心态。我觉得挺好的。”刘华说。
商汤科技大厦内景图,位于上海淞河泾开发区。 本文图片均为澎湃新闻记者 俞凯 摄
商汤:DeepSeek点爆,对整个AI生态和产业发展都是好消息。
本报记者在探营中了解到,2月8日,商汤大设备官方宣布将DeepSeek系列模型上架,企业客户和开发者可以在商汤大设备万象平台上快速部署DeepSeek-V3、DeepSeek-R1等模型,并且可以在3个月内享受1000万tokens的免费权益。
刘叶枫说,DeepSeek打破了这个圈子,更多的人使用它,并把它作为工作过程的一部分。未来可能会出现一系列的应用浪潮,无论是政府还是业主,未来的计算能力需求都会有更大的增长空间。
刘叶枫介绍了2025年全球开发者先锋大会商汤科技参会情况。
在商汤科技产品总监、浣熊家族产品负责人贾安亚看来,DeepSeek引发的这一波浪潮主要表现在三个方面:一是成本更低,包括一些架构的提升、实践和推理成本的降低,这对产业着陆至关重要;二是模型能力更强,主要体现在模型通过长思维链更强的推理能力上;三是多模式的结合,带来更多的实际应用场景。在医疗、金融、教育、工业等行业,以及协助编程、智能办公、智能客户服务、营销等方面,都有相当多的应用机会。
“在过去的几年里,一些新的AI技术也让每个人都觉得需要花费大量的教育成本,但是随着DeepSeek的爆炸,更多的人尝试使用它,这对整个AI生态和产业发展都是一个非常好的消息。最终落到实处还是客户价值,怎样为更多的人服务。我们也看到了一些开源模型在很多能力上的亮点,我们也希望保持产品的开放性和博主性,访问更多更好的模型。”贾安亚告诉记者。
贾安亚告诉记者,商汤将在本周末举行的全球开发者先锋会议上发布代码浣熊2.0,在协助编程和智能办公方面具有更丰富的功能,并邀请实际客户展示他们使用浣熊的实际体验。
MiniMax:如果一个模型做得好,并不意味着其他模型没有机会。
MiniMax位于上海徐汇区,是一家规模超过100人的大型创业公司,成立于2021年。该公司副总裁刘华告诉记者,今年1月,该公司还进行了一次大型开源。开源是MiniMax-01系列,这是世界上第一个实现线性注意力机制的大型机制模型。它的语音模型可以反映人类的喜怒哀乐,目前已经可以支持17种语言。
媒体记者访谈MiniMax
谈到“同行”DeepSeek,刘华毫不犹豫地称赞道:“DeepSeek在强化学习、计算率准备等方面都做得非常有创意,取得了相当大的进步和发展,因此迅速火出圈。作为AI行业的从业者,我们的感觉是,这个行业的技术迭代非常迅速,大型技术每隔几个月就保持了一个重要的突破频率,包括DeepSeek带来的创新。在接下来的两三年里,我们判断大型模型的能力将会提高数倍。”
然而,刘华也呼吁每个人都不要放松。“竞争非常激烈。不要说中国的大模式已经超越了弯道,不再需要关心和支持。我们仍然需要每个人的关心。”
以中国新能源汽车为例。中国的新能源汽车从1995年开始,到2024年,已经发展了近30年。在此期间,它经历了模仿、创新和赶上的阶段。目前基本处于超越阶段,大型企业也需要经历这样的过程。
在采访中,刘华还特别提到,这是由于大模型的开源。最近,各行各业的人都热衷于“提问”DeepSeek。在他看来,高水平大模型的开源有助于加快行业建设,让公众可以免费尝试优秀大模型的技术能力,帮助提高AI的渗透性,吸引更多的开发者参与大模型的研发。
但他还提到,问答助手还是属于AI模型初期的浅层次应用,只是解决了求知欲的问题,对提高生产力影响不大。“现在大模型的推理能力增强了,可以思考复杂的问题,给出复杂的答案,问一些特别简单的问题,其实是在浪费大模型的能力。事实上,在很多复杂的场景中,大型模型会有更多的用途,也能对生产力产生真正的立竿见影的效果。”
同时,刘华表示,在顶层R&D框架迭代的前提下,R&D人员实际上需要对技术变革有极致的热情。因此,我们可以看到,DeepSeek特别有趣的一点是,他们没有招募所谓大型行业的专家学者,而是招募了最多一两年的博士学位或者直接在行业内招聘。这些年轻人通常对技术变革有极端的热情。
“MiniMax也是如此。我们的R&D团队也很年轻,这是一个90后的世界。大多数人都不到35岁。很多医生还在读书的时候就来做见习生,然后一毕业就来公司签合同。”刘华说,在这次全球开发者先锋大会上,公司会邀请很多智能产品生产合作伙伴展示大模型的使用场景,向大家展示他们正在做的事情和创新。
“如果一个模型做得好,并不意味着没有其他模型的机会。目前很多同行认为DeepSeek做得好,愿意主动访问和使用。这是一种非常开放的心态,我觉得挺好的。”刘华说。
本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。
免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com




