国产AI六小虎已经变成了两只小猫,他们活着的原因很难找到。

04-15 09:42

四月十日,是国产的 AI 百川智能设置六小虎之一的两周年,CEO 王小川发布全员信强调公司方向:“ 减少多余的动作,专注于医疗方向。


要知道,二年前,百川智能刚刚成立的时候,它的愿景却是“ 旨在打造中国版 OpenAI 基本大模型及颠覆性上层应用 ”,非常宏伟。


无独有偶,国产 AI 六虎中零一万物的创始人李开复,今年 1 月在和媒体 “ 连线 Insight ” 对话时表示:“ 零一万物全面转换 ‘ 小而精 ’。”


但是当零一万物刚刚成立时,它的愿景是宏伟的。“ 打造 AI 2.0 全新平台,加速 AGI 来临 ”。


过去的豪情壮志和现在的战略收缩,让外界许多人调侃 “ 小虎 ” 已经成了 “ 小猫 ”,那么,在 AI 如今,大型市场正在发生变化。这些地位不稳定。 “ 虎 ",怎样才能找到生存的理由?


为了探索这个问题,知危编辑部找到了很多专家进行对话,比如大型技术专家、头部金融机构AI专家、头部医疗AI专家、一线厂商AI技术专家等。,探索大型企业面临的问题以及如何更好地生存。


表面上看,今年春节 DeepSeek 爆红后,整个大型市场开始战战兢兢。就像武松一样,几碗酒下肚给还没有完全发育的人。 “ 小虎 ” 人们打得头晕目眩,一群大型企业从最初的斗志昂扬的同场比赛,变成了现在接受现实,各自选择了不同的命运。


但是事实上,这种变化比人们认为的时间节点发生得更早。


大型技术专家,《 大型知识图谱模型 》作者王文广告知危:“ 实际上,甚至还不够 DeepSeek V3 和 R1 的发布,在 DeepSeek V2.5 和阿里的 Qwen 70B 在推出的时候,国内一些大型企业已经开始放弃大型培训模式。,费用太高了。她们觉得无论是资源还是性能都跟不上或者拉不出距离,更别说对方还是免费开源了。”


某人工智能技术服务公司专家梁贺( 化名 )然后告知危险:“ 大约 2024 每年中期,六小虎虽然还在训练大模型,但投入的力度明显不如过去。”


直到 2025 年 1 月 DeepSeek R1 大多数中小企业在发布时发现完全跟不上。


如此剧变,导致六骁龙集体从攻关 AGI,转变为现在的开始分流。


百川、零一万物放弃大型预训练模式,各自下注医疗AI及全面产业落地;MiniMax 收缩 To B 商业,并且专注 C 端视频生成等场景的国外市场;开源社区智谱、月亮暗面、阶跃星仍活跃,但是没有可以超越 DeepSeek R1 新模型;获得大量融资和政府和企业合作订单的智谱不愁生存;因为效果远不如开源,放弃了投资策略的暗面,其头号商品 Kimi 因为元宝的后来居上,在定位上显得很尴尬。


总体来看,六小虎和中国市场 “ 想象力最少 ” 的一部分即 To B SaaS 市场,交集越来越大。


那么,为何 To B 市场如此 “ 无聊 ” ?


近来,零一万物声称要全面接入。 DeepSeek,在各行各业落地企业大模型一站式平台。对于这一点,行业普遍谨慎看零一万物的未来。


某金融机构AI专家姜绍绍( 化名 )甚至评价道:“ 零一万物基本都是转B端,他们觉得什么都想做,公司团队整体上过于熟练,但是 DeepSeek 出来之后技术上也看不到差距,商业化水平特别一般。”


而王文广则告知危险:大型一站式平台的技术门槛并不高。


对此类产品技术门槛的评估,王文广是有亲身经历的,“ 去年,我花了大约半年的时间,自己开发了这样一个平台,现在也是以个人的方式出售。并且我觉得这款产品很难通过公司来赚钱,但是个人经营的方式还是可以慢慢赚钱的。


“ 现在行业里有不少 To B 公司,他们不做大模型,但还是会做大模型业务,只是缺少一个技术平台。我会和他们合作,价格可以很低。只需要4万到5万套,中大型公司肯定不会这么便宜。"


“ 目前我开发的平台,叫做 KAF,即 Knowledge-based Agent Factory,即基于知识图谱、向量数据库、搜索引擎,通过检索知识提供大模型和大模型。 Agent 应用平台。目标是通过提示词管理和模型管理,让用户无需编写任何代码,就可以构建自己想要的知识助手或者 Agent。这种平台,市场上有很多相似之处,估计可以有一千个,也很容易复制。


“ 举例来说,一家公司想做 To B 大型应用,即使创始人本身没有这种能力,如果想做出商品也很快。无非就是招两三个特别牛的人,当然带头人一定很厉害,否则可能无法开始。这一方法的成本远低于大型训练模型的成本。就算是业内的大神,年薪也差不多一千万,再加上两三个年薪百万的人,就可以组成核心团队。真的不行,还可以找外部AI公司合作。”


除上述方法外,还有 “ 公司大模型一站式平台 ” 方法,属于一体机的类型,对此类商品,平安保险技术平台组负责人张森森认为,“ 集成机具有足够的市场潜力,但是集成机销售服务,与技术关系不大。


“ 一体机是将核心硬件、软件、执行环境打包,实现开箱即用,主要面向政府、教育机构等技术布局能力较弱的机构,也有部分企业客户,关键是使用方便,技术自主。当然,它也有自己的优势,比如数据安全和隐私合规,因为这是一个私有部署,在面对监管时更容易通过安全审查。而且一体机是软硬件的深度优化,对于推理专用的芯片和端面芯片响应更快。还有一个考虑,比如一体机对国产芯片进行了深度定制,然后绕过了一些底层限制,提高了效率。有些企业倾向于一体机,因为他们对成本特别敏感,更注重ROI。一体机使用寿命更长,对于财务报表。 ROI 也许更好一点。


事实上,在过去的几年里,包括大数据、云计算、计算机视觉在内的任何具体领域,都是国内的。 SaaS 市场有非常相似的特点,或者说这是各个领域最终会发展成的固有形式,包括定制化需求高、商品偏向通用性和同质化、激烈的市场竞争、普遍的低价策略、更注重短期实现的资本等。这些 SaaS 企业用户数字化程度低,支付意愿弱。


相比之下,海外 SaaS 市场更加注重专业化分工,公司致力于特定领域,提供深度服务,以大中型企业客户为主,付费意愿更强。


大型领域也呈现出这一特点,我们可以参考近期的海外。 SaaS 重要的市场事件:


2025 年 2 月,MongoDB 以 2.2 收购1亿美元的价格 Voyage AI,后者是一个刚刚成立的家庭 17 一个月,致力于嵌入( Embedding )和重排序( Reranking )模型 AI 初创公司。


2024 2008年,亚马逊宣布成立两年。 AI Agent 初创公司 Adept 达成技术授权协议,Adept 一些成员将加入亚马逊支持。 AGI 团队。


通过专注于大模型技术的一个细分领域,这些创业公司获得了资本成功或公司发展。但是在中国,这种情况几乎为零。据了解,很多中小企业在探索自己的技术和业务时,甚至要时刻防范大厂。 “ 抢肉吃 ”。


基于自身在 To B 多年的市场经验,王文广向知危描述了这一市场的残酷:“一站式平台商品必须有市场,而且市场还很大,但会很碎片化。与中大型企业相比,我合作的这些小企业规模较小,运营成本较低,价格可以定在那里 30 到 50 万间,即便如此,也可以赚钱。由于他们不需要考虑R&D费用,只负责实施,能够覆盖人工成本。这样的话,就会把整个 To B 场景应用服务的价格非常低,更不用说我参与的市场肯定不仅仅是我。中型企业参与的市场也许只能做大型企业客户,这也将面临其他企业、传统集成商等竞争对手。就算是大厂,现在 To B 市场上的商业战略也差不多,大厂也可以有自己的大模型和品牌优势。”


“ 我也在用 DeepSeek,还有很多其他公司也在使用。 DeepSeek,那么就没有什么区别了。国内有多少云厂商,至少会有多少竞争对手。国内 To B 市场一直都是这样,想要生存,要么关系硬,要么服务好,要么价格低。”


梁贺对当前零一万物的选择和未来概率进行了简要评估:


目前,李开复将零一万物的业务完全转变为To。 B应用程序,以公司大模型一站式平台为主,这种做法在商业上肯定没有问题,但市场会很卷。


零一万物要做出比大厂更便宜的大模型商品,其实也是没有办法的,因为在应用方面没有什么区域可以保持独特的优势。


一切都变成了To B,说明它的AGI想象力较弱,做的事情不够性感。这类似于2017年以来最后一波CV浪潮的视觉公司后来的结果。


假如零一万物也做海外市场,也许还有机会。


相比之下,业界对百川智能的未来,虽然不乐观,但也不那么悲观。


一方面,百川智能进军医疗,特别是在数据方面,没有其独特的优势。


姜绍告知危险:“ 百川转向医疗,只是为自己找到了一条生路。但是与零一万物相比,百川至少是在尝试做一个目标市场。


“张森森说:”与科技公司相比,我更看好有医疗数据的公司做大型医疗模式。对于任何想做行业大模型的公司来说,这也是同样的道理。因为大医疗模型的关键难点不在于大模型,而在于数据。中国有这么多好医院,医院也可以自己用。 DeepSeek 把一个大模型微调出来自己用。


如何有效获取医疗数据?姜绍说:“AI技术创业公司在数据上没有优势。如果你想成为一个大的医疗模型,你可能需要与已经在帮助医院信息化的公司合作。”


据知危所知,六小虎中有一家公司独家与国内大型医生交流论坛合作,利用论坛中医生交流产生的大量案例对模型进行实践。


不但对目标市场相对乐观,而且业界对百川创始人王小川本人也抱有希望。


梁贺感觉到:“ 王小川是否专攻医疗取决于他是想做理想还是赚钱。如果我们想做理想,取得突破性的医学AI研究成果,那么我更乐观。从我对王小川的理解来看,他应该更喜欢前者。"


而王文广则强调这一市场的老一面:假如想在短时间内进行商业化,那么实际上医疗这条赛道也很卷, To B 整个市场状况没有本质区别。在商业化方面,很多公司都可以用知识图谱、向量搜索增加模型来做医疗。”


据悉危险与医疗 AI 专业人士的交流,医学本身也存在着巨大的知识盲点,新知识正在迅速增长。所以基于大型医学基础研究,有很大的想象空间。预测蛋白质结构 AlphaFold 就模型而言,根据梅斯医学的报道,截至 2024 年 5 月亮已经存在于世界各地 180 使用万的科学家 AlphaFold 加快研究,包括开发生物可再生材料,或促进基因研究等。


除理想和赚钱外,医疗 AI 还有一个关于创业的主要争议:是否需要,是否可以做出一般的医疗模式。


对于这一点,张森森说:“目前国内市场普通医疗模式没有明显突破,主要原因是大规模数据的收集和应用依赖于强大的医疗器械支持。很多医疗器械在国内还没有广泛普及,所以AI很难做出准确的诊断。但是一些综合实力较强的医院,如海外梅森医疗中心等,已经开始探索推出自己的大模型。尽管短期内很难看到盈利机会,但从长远来看,这一大模式可能会对医疗行业产生深远的影响。”


“ 医疗行业也面临着全自动诊断的挑战,尤其是在国内设备不足的情况下,AI无法完全取代传统的诊断方法。一些医疗器械还没有普及,尤其是在偏远地区,医疗技术很难完全覆盖,所以全自动诊断还是很难的。"


“由于医疗行业有严格的许可证和合规性要求,大模型进入医疗领域时必须解决合规性问题。未来 C 通过结合医生技术和AI技术,终端医疗服务可以提高诊断和治疗效率,尤其是面向医生。 80 后、90 后、00 等待年轻人。”


最后,即使抛开国内 To B 单从大模型应用竞争的角度来看,市场本身的特点,To B 这个市场也很难生存。王文广说:“ 虽然整体上是大模型 To B 产品设计方法还在探索中,但最终还是会趋同。这个方面不仅在国内,在硅谷科技公司也是如此,比如 OpenAI、Anthropic、谷歌等,如果模型本身的性能无法拉开差距,在这一行业中一定不能赚钱,最终会卷到每个人都处于同一水平。


那就是为什么 DeepSeek R1 事实上,最大的影响不在国内,而在国外,特别是硅谷科技公司。美股就是从 R1 发布开始持续高位震荡,然后开始下跌。背后的核心逻辑很简单,就是硅谷的大模型被中国追上了。不能说超越了,但是被追上之后,硅谷就无法在这里拉开差距,所以无法支撑这么高的估值,所以股价下跌了。"


当然,To B 还有一种市场吸引客户的方式,那就是开源。公司开源的主要盈利模式包括额外的收费功能、云托管、基于开源技术的企业咨询、培训等增值服务。


张森森说,开源大模型最直观的作用就是推动技术的普及:“ DeepSeek 开源后,对企业使用大模型起到了很大的加速作用。公司高层非常支持大模型的应用。随着大模型在实际应用中的优异表现,特别是在减少人工控制、提高效率等方面的优势逐渐显现,支持力度将继续增加。"


“ 作为数据质量最好的行业,金融业在AI方面一直拥有丰富的技术积累,自然能迅速跟上。无论有没有 DeepSeek,所有的金融都将落地 AI 技术。但有了 DeepSeek 之后,除了过去 AI 授权的金融主营业务,现在也将把 AI 使用一些日常办公、过去比较难做的运维等服务。


“ 运营成本本来就很高,例如对于根因分析,之前需要基于传统的运营监控和 AIOps 来做,还需要专门训练一些小模型来做,现在可以用了, DeepSeek 结合知识库生成应用程序,处理监控、报警、自助分析、追溯、自动化处理、稳定性提升等工作。 AIOps 更加灵活。”


“ 第二,对于运维工作,AI的覆盖范围也越来越广,现在将更多地考虑交互和主动,主动也就是让步。 AI 主动进行运维。从过去依靠规则、劳动力甚至个人经验来看,人的经验水平决定了运维能力的水平,现在可以使用更轻的水平。 AI 直接实现模型。”


“ 虽然 DeepSeek 幻觉仍然很高,甚至与其他类似模型的表现相差不大。但是与其他类似模型相比,DeepSeek 推理和实践应用能力足以抵消幻觉带来的负面影响。我们将通过微调和优化来选择。 RAG 等待相关技术,逐步改善这个问题。


阿里大模型技术专家高鹏( 化名 )则认为,DeepSeek 对大企业和中小企业的影响是不同的:


“ 在阿里内部使用的大型模型一直是业界最先进的,所以 DeepSeek 出来之后,对我们的影响并不大。我们会拿 DeepSeek 对阿里来说,做性能评估和比较,更多的是技术启发。DeepSeek 在 Reasoning 世界上的落地比较快,而且技术细节还是相当普遍的,DeepSeek 还必须受到千问的影响。”


相比之下,DeepSeek 对中小企业的影响比较大,因为以前没有一个模型能够实现。 DeepSeek 在这种效果的同时,实现了低成本的私有部署。DeepSeek 出来之后,也是出现了大量的销售 DeepSeek 一体机公司。实际上,与许多开源模型一体机相比,DeepSeek 而且不是最便宜的,要看具体的标准。”


无论如何,现阶段国内开源模式蓬勃发展,并已能够参与全球竞争。但是,从平安保险本身落地大模型的情况来看,张森森认为开源大模型仍然存在着不可克服的局限性。


“ 对我们来说,DeepSeek 主要是成本上的巨大优势。在能力方面,比如运维场景,在推理、泛化能力、前后理解等方面可能比其他模型好。但是在金融风险控制等比较复杂的场景下,DeepSeek 性能不突出。这是因为需要更详细的微调,甚至结合其他模型进行优化。因此,有必要根据具体的应用领域进行相应的微调,以进一步提高模型性能。"


“ 安全性自主研发的大型模型,主要分为双层,底层是重点大型模型,再往上是分别负责银行、保险等业务等领域的模型。在专业知识领域,我们内部使用的大型模型的表现确实超越了 DeepSeek,尤其在金融、医疗等特定领域,模型表现更为精确。但是,在推理能力方面,DeepSeek 仍有很强的优势。还有一些情景,我们希望先用。 DeepSeek 做个小规模的尝试,看看能不能跑通。”


“对于阿里千问、百度文心和智谱, ChatGLM 这些大型开源模型,他们在这方面和 DeepSeek 这种差别并不明显。判断的依据是,这些模型在推理能力和知识库结构上 DeepSeek 没有太大区别。”


总而言之,目前开源大模型的影响力仍然有限,而且它们之间的节奏紧张。


但 To B 激烈的竞争并不意味着 To C 这条路线更有希望。


大模型的 To C 产品竞争也很残酷,但是与产品相比, To B 市场,又有很大的不同。


另一方面,市场结构变幻莫测。


以国外市场为例, a16z 发布的 “ Top 100 Gen AI Consumer Apps ” 最新报告( 第四期 ),自 2024 年 8 月( 第三期 )到目前为止,还有多达 17 一家新公司进入了生成式 AI Web 产品的 Top 50 排行榜,例如国内 Kimi、海螺AI、DeepSeek 等,其中 DeepSeek 尤其亮眼。



DeepSeek 强势崛起在很短的时间内,其月活人数从几乎默默无闻到大大超越。 Claude、Perplexity,只有一个月的时间。



移动终端的使用时间方面( 基于每个用户平均每周的对话数和每个用户的分钟数。 ),DeepSeek 它也比Perplexity稍微高一点 和 Claude,但目前和 ChatGPT 相比之下还有很大的差距。



另一方面,To C 变现非常困难。


最为流行的应用并不一定能带来最多的收益。例如 ChatGPT 收益最高,OpenAI 却依旧年亏 50 亿美元,而大量 ChatGPT 的 “ 山寨 ” 应用程序很有可能完成快速盈利。;DeepSeek 火灾发生后,模仿者、假冒者也排山倒海。


从 C 对六小虎的情况进行了分析,其实并不乐观。综合知危与业内人士的交流,广泛认为大厂将带来巨大的生存压力。


姜绍说:“姜绍说:“ 在消费市场方面,六小虎里边做得比较好的是月之暗面。 Kimi。但是现在排名第一的是腾讯的元宝,第二的是DeepSeek,第三的是豆包,前三家公司几乎占据了大部分的市场份额。凭借微信生态圈,腾讯的元宝获得了大量的客户流量, DeepSeek 在许多场景中,凭借其技术创新和卓越的表现脱颖而出。


梁贺说:“Kimi 大模型技术与竞争者没有太大区别,那么只能免费使用,这使得月之暗面商业化变得特别困难。作为一个 To C 应用中,我们看不出它和元宝和豆包有什么区别。而且豆包可以用字节的其他业务来养,元宝可以用腾讯的其他业务来养,可以投资。 1000 亿来养育这些应用。


姜绍补充道:“对于 C 终端用户,更注重商品的易用性,腾讯和字节在这方面做得更好。当然,阿里也有机会孵化它的名字。 ‘AI听声 ’ 应用程序,该应用程序通过 AI 聊天与互动,目的是取代抖音在短视频平台上的地位。虽然抖音吸引了大批创作者生成高质量的内容, AI 通过提供更个性化、更互动的感觉,聊天应用有潜力在一定程度上吸引用户。两者的区别主要在于内容创作和互动方式。假如阿里能突破这一块,也有机会翻盘,当然如果腾讯跟进模仿,那就不好说了。”


对于 MiniMax,这个行业的观点略有不同。


梁贺感觉到:“MiniMax 海螺AI现在是相当赚钱的,它算是找到了自己的一条路,但是这条路能不能让它变得更好? MiniMax 估值做得足够大,还是个未知数。由于偏爱应用,MiniMax 在 DeepSeek 如果他们都用完了,出来后就更容易了。 DeepSeek 模型,反而节省了模型研发的成本,而且它的应用程序可以继续赚钱,甚至赚得更多。


“姜绍则认为:” MiniMax 假如以后能做出爆款的话 APP 这是一个机会,但是阿里可能会超过它先做爆款。 APP,因此 MiniMax 即使有机会也不太可能。”


究其根源,产品差异化仍然是 C 终端应用的突破口。


根据 a16z 的 “ Top 100 Gen AI Consumer Apps ” 根据最新报告,许多低利用率的应用实际上实现了更好的收入。与一般产品相比,一些实用性差的产品,如植物识别和营养,吸引付费用户的能力更大。


做通用的 AI 商品,难以打多样化,顾客付费意愿低,盈利周期长,所以无法忍受大公司。


而且做多样化如果垂直深度不够,也很容易被底座大模型通过能力升级所内在。例如,近期 GPT-4o 生图能力就对了 Midjourney 等待文生图创企带来降维攻击。这种覆盖能力往往是随机的、不可预测的,这就是所谓的。“ 摧毁你,和你做什么。”


竞争者的像素级模仿,底座大模型的快速升级,让 C 端 AI 创业公司的风景几乎总是只维持很短的时间。


关于如何抓住这个极低概率的爆炸机会,业内人士一致认为, “ 基本上没有经验可循。 ”。


六小虎进入了今天的困境,很大一部分是因为当初在底座大模型上下注太多,低估了在这条赛道上生存和拔尖所需的人力、资金和物力,使得现在很难在跑道上多样化。


现在六小虎对攻破 AGI 决心越来越弱,李开复最近也公开直言,国内大型底座模型最终只剩下一个。 DeepSeek、阿里,字节三家。


对于这一点,与知危交流的业内人士基本同意这一观点。


姜绍说:“姜绍说:“ 现在继续坚持大模型技术的创业公司基本都要死了。最有希望的一定是 DeepSeek,第二个是阿里巴巴,第三个是字节跳动,第一个估计可以分到。 50%-80% 后面两个人可能会分到流量。 10% 流量。核心在于谁先把流量放在第一位 AGI 做到了,谁就是最后的赢家。”


“ DeepSeek 目前在模型领域最具竞争力,其技术创新和在实际应用中的表现无可挑剔。阿里巴巴和字节跳动也有很强的竞争力,尤其是在跨平台应用和数据方面。排名主要是基于各公司在基础技术、计算率、数据资源和实际应用中的创新能力。"


“ 智谱和 Kimi 团队坚信,未来的出路是继续提升基础模型的能力。相比之下,我认为随着市场需求的变化和应用场景的多样化,单纯强化基础模型的路线可能会受到限制,更灵活、更适应的模型发展路线可能会更具市场竞争力。"


“大型技术竞争异常激烈,投资巨大的公司必须在创新、计算率、数据和优化方面取得明显突破,才能保持竞争力。其他跟不上技术进步或无法应对市场需求的公司将逐步被淘汰。”


梁贺说:“未来只剩下国内基础大模型公司了。 DeepSeek、阿里、字节三家公司,就是这三家公司能够有实力和决心投入巨大的资源进行研发。对字节来说,这次不可能错过大模型的机会,否则对它的整体影响会很大。而且DeepSeek的技术对字节来说并没有什么大的堡垒,更多的是DeepSeek在R&D效率上目前更有优势。在DeepSeek火起来之前,阿里的千问开源模型本身就有很高的水平,千问和Llama基本上都处于一种追逐的状态。对阿里来说,千问模型可以不赚钱,但是相关的云业务可以赚钱,字节也差不多,大模型技术可以不断用来增强抖音等App的感受。对于AI创业公司来说,如果模型本身不赚钱,就会触及生存的基础。


“王文广说:”DeepSeek 其优点主要在于技术理想主义。春节前后两三个月内,DeepSeek 流量巨大,若要进行商业化,很快就能达到世界第一,豆包等其它大型模型根本没有机会。只需 DeepSeek 基础设施相关的优化方法不会在最近的开源周开源,之后它就可以靠这个赚钱了,这样别人就没有机会了。DeepSeek 不需要受到投资者的影响,也不需要融资。最大的堡垒是技术理想主义和人才。对比 OpenAI,OpenAI 现在看到的结果基本上都在那里。 Altman 和 Ilya 在发生争执之前,至少创新点已经确定了研究成果,现在最初那些有理想的人才离开后,OpenAI 几乎没有自己的创新。目前 OpenAI 在应用方面,创新更多,比如, Deep Research,应用创新没有堡垒,所以它也要跟着竞争对手一起卷起来。”


某大厂AI技术 术专家王牧( 化名 )告知知危:“ 除非你有钱,有人才,有硬件,否则没有必要在大型预训练模型上浪费时间,DeepSeek 起码在 2021 每年都有万卡集群,也不差钱。另一方面,其他中小企业,基本上不能满足这一条件。”


高鹏说:“AI创业公司要想生存,还是要转向应用。一两年前,我也这么认为。现在可能太晚了。接下来,第一批将被淘汰。 AI 企业是做基础大模型的企业。大模练习,其实有许多复杂的细节,很大程度上取决于经验的积累。Transformer 建筑内部的细节一般都比较清楚,但是几乎没有一篇论文会告诉你信息是怎么准备的,数据细节是什么,数据规模有多大,数据质量如何等等。行业内没有统一的标准。


“ 开源开一半 ” 模型跑道一直是典型的做法。目前,只有极少数大模型会公开代码、权重、数据和训练过程。知名的有 OLMo、BLOOM 等。


但是,即使转化为应用程序也能生存吗?从前面面对 To B 跑道和 To C 通过赛道分析,AI创业公司在应用中几乎很难建立自己的行业壁垒。对于这一点,高鹏说: 如果你想建立自己的行业壁垒,关键在于你拥有什么数据,任何人都可以使用模型。数据分为两个方面,一方面是创业者的领域经验,另一方面是手头的数据。"


高鹏认为,从企业文化的角度来看,研发底座大模型需要的是一种试验型、工程型的艰苦探索精神,“之前很长一段时间,国内很多AI创业公司都太高调了,做技术本来应该先低调做,做好了再高调宣传。一些团队在学术界的构成比较重要,但是学术界的研究技术有时候过于理论化。在人才和团队方面,一个大模型团队能否成功,主要取决于老板是否理解大模型。假如老板不懂大模型技术,或者没有信心坚持下去,因为不赚钱就放弃,这是完全不可行的。DeepSeek 能够成功更多的是靠自上而下的组织模式,老板对技术细节非常了解,带大家一起去做。国内符合这一模式的太少了。”


高鹏认为,对于业界热议的国内底座大模型的最终赢家预测,这一观点还为时过早。 对于能够参与竞争的玩家来说,技术路线上没有太大的差别, Transformer 做细节提升的架构就行了,Mamba 和 RWKV 也有希望。关键是要脚踏实地地做事,时间会证明一切。很难说最后的赢家和前三名。大型技术栈是一个非常复杂的物品,谁知道有没有很多人在默默做一件事,只是时间还没到。”


目前,数据已经成为模型赢家难以判断的最重要的环城河。Konstantinee红杉资本合作伙伴。 Buhler 曾表示,OpenAI 在 ChatGPT 上面犯的一个错误就是无法编辑回复,而且这本来可以在反馈循环中提供更高质量的数据,建立更深层次的环城河。


张森森说:“数据能否使某一行业借助AI进一步发展,或者带来新的商机,这一点非常重要。 AI 落地成熟度更接近金融和互联网两个行业,我更看好。 AI 办公、AI 政务、AI 电子商务。这主要是基于其高数字化程度和高确定性的表现。”


尽管电子商务已相对完善,但AI将继续提高电子商务的效率,尤其是在商品推荐、客户服务、物流优化等方面。AI 通过更准确的市场分析和决策改进,可以提高电子商务平台的效率。这种效率的提高不仅会继续线下零售,还会带来新的电子商务形式,尤其是在跨境电子商务领域。AI 这将有助于它的爆发式增长。


“ 相比之下,金融业还在 2024 2025年有一次业绩爆发,2025年。 2008年,随着AI业务的深入,业绩仍有很大的提升空间。


另一方面,那些AI落地不成熟的行业,尤其是智能制造,有大量的定制产品。每个企业生产的产品都不一样,没有统一的标准。因此企业想要推广 AI 工作自动化难度大,数据价格高,精度要求高。虽然工业软件基本上是智能制造落地最早的处理方向,但效果更好。但是制造业 AI 化学升级是有历史负担的,大多数制造业的数据和信息化水平都不够,导致他们在做这件事。 AI 化学时缺乏数据,特别是异常样本的收集几乎没有。复杂性也很高,比如设备种类繁多,数据标准不统一,导致算法迁移性差,温度、材料或一些不可预测的变量等一些关键因素的影响往往被忽视。并且,公司对传感器数据的关注是有偏差的。对于各种传感器故障数据,企业主要关注会影响生产结果的数据,但实际上,那些边缘传感器数据很可能会成为我们未来煽动整个制造业创新和商业化的支点。AI 通过对这些数据的分析,我们可以发现潜在的优化机会,从而促进整个行业的进步。


“ 而且制造业的能力要求和其他行业有些不同。它要求问题必须实时处理,这里很难接受大模型的延迟。因此,智能制造在短期内没有投资回报率。当然,中国肯定会帮助这个行业的AI化。未来五年,可能会出现大规模增长、机器人化和机器人化。 AI 化会是一种双重结合。”


归根结底,对于创业公司来说,无论是做基础大模型还是做基础大模型? To B 或是 To C,如果没有多年积累的数据或技术经验,你很难找到一条坚固的环城河,也无法形成竞争壁垒。


所以,创业公司一旦在小有名气的时候把雪球滚了起来,很容易就会渐渐孤独,最后找不到活下去的理由。


当他们在某个时刻摘下金苹果时,只是命运女神短暂地打了个盹。


本文来自微信微信官方账号“知危”,作者:流大古,编辑:大饼,36氪经授权发布。


本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。

免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com