“顶流群聊”中国大模型笔记
在国内科技创新的历史上,从来没有像大模型技术那样,短短几个月就建立起“科技界共识”。
我 1998 2008年进入科技圈,见证了 PC 时代、互联网时代和移动互联网时代的变化,从未见过如此迅速的“共识达成率”。以极客公园的企业家社区为例。 Founder Park 因为大模型领域的技术变化比较早,所以在短时间内就受到了重视。 4 一个月的时间增加了 15 万关注者,社区成员已扩大到七八千人。
就在昨天,第一批国产大模型通过备案点燃了大家的热情。备案管理代表了大模型发展的宽松政策,这也意味着国内大模型的商业化和产业化将真正开放。
但是,如果“共识”达成得太快,就会有一些令人担忧的地方,因为这项技术还处于发展初期,不可能像“水银泻地”一样落地到普遍领域。
客观地说,如果你认为大模型技术已经带来了 AGI 黎明,那么我们应该坦诚地看到它真正的实用性,并成为生产力,现在我们开始探索。那些在一线创业公司经历过的人。 KnowHow 而且问题,正是最值得聚集的星火燎原。
基于这一理念,阿里云联合 Founder Park 邀请了 20 在杭州西溪湿地,多位中国大模型领域的模型层、工具层、网络层等优秀企业家进行了面对面的闭门交流。
阿里云董事长张勇也给这次闭门会取了个好名字——“西溪论道”。在这次近五个小时的闭门会上,张勇坐在我旁边,参与了企业家的群聊。我看到他的笔记里全是几页。
8 月 23 号码,西溪论道参与者合影
可见,阿里巴巴云作为计算率基础设施层,应该如何与这些方面连接和共同创造,如何支持各方面的企业家使用大模型,这是张勇最关心的话题。这说明阿里巴巴云和国内其他企业的态度完全不同,如何促进大模型生态繁荣是阿里巴巴云最关心的事情。
这些是中国大型模型领域最积极、最活跃的力量。从下午2点到晚上9点,他们从行业的很多方面进行了立体的交流和冲击,也从各自的最新实践中谈到了很多有洞察力的观点。根据他们的说法,我们在这里一起讨论,听到了很多真相和“真诚”。
在这篇文章中,我整理了一些令人印象深刻的要点,并与大家分享。
注重大模型,更要注意大模型。 infra
现在世界上任何地方,做大型模型,除了人才,最稀缺的资源就是 GPU。
百川智能创始人&CEO 王小川和朋友们分享了他去硅谷的事情,英伟达一年了。 GPU 出货量在 100 万颗,但 OpenAI 说要设计 1000 万颗 GPU 连接在一起的超算。
因此 GPU 到底有多少算够了,有限的算率有解吗?
创新工场董事长、零一万物创始人李开复表示,尽管数千万张张 GPU 天方夜谈,但“大力创造奇迹”的暴力美学是有背景的。加强鼻祖的学习 Richard Sutton 在《The Bitter Lesson》(《痛苦的教训》)提到:在过去的70年里, AI 在里面放一点知识,想要增加一点能力,想要调整模型架构,最后发现几乎没有价值。在过去的70年里,唯一的推动 AI 前进的力量,是一种通用且可扩展的计算能力。增强了计算能力,相应地促进了算法,促进了数据的进步,这是大力创造奇迹的背景。
所以,在这波大模型浪潮中跑出来的企业,首先要有算率,选择几个人、几十张卡的“禀赋”,或者调用集中的大模型,可能更务实。
“当计算率相对足够的时候,在这个前提下,我们可以充分利用计算率,做出很多今天只使用开源,只调整。 Llama2(Meta 大语言模型)做不到的东西。前有 OpenAI 不惜任何代价开设模型新标杆,之后有 Meta 开源为大家铺平了道路,这是李开复对大模型公司新目标和新实践的探索,在动荡不安、高度不确定的大模型创业环境中。
什么是这款游戏?如何让一块 GPU 发挥两块,甚至三块的能力?这一问题可能需要更多地关注团队的构成。李开复认为,Infra(硬件底层)团队必须比较 Modelling(模型)团队也更加强大。他说大家很快就会发现,做过大模型。 Infra 人比做大模型的人更贵,更稀缺;而且可以做到 Scaling Law(扩展规律,模型能力随着训练计算量的增加而提高)的人会比较大模型。 Infra 人们更加稀缺。
由于出色的 Scaling 团队可以避免徒劳的练习。作为一种训练,他们很有可能会成功。一旦失败,他们也有能力立即停下来,并且有足够的数学能力去做。此外,还有很多微妙的细节和经验。比如读完论文,你会少走很多弯路,因为有些论文是故意写出无效的东西,不会读很容易偏颇。
事实上,客观地看,GPU 这个问题的短缺不仅是中国企业家的问题,也是全世界企业家的问题。因此,如何做好有限的计算率将成为大型公司竞争的关键。
对此,李开复提出了一个明确的看法:大型团队的每个位置都需要人才,Pre Train(预训练)、Post Train(训练后)、Multi-Modal(多模态),Scaling Up(可扩展性),Inference(推理)等都有其重要性。其中,Infra 这个团队的人才比较稀缺,需要更多的关注。
事实上,除了企业家自己对大模型有更深入的了解之外,他们还需要更多维度的技术创新,比如一个现场。 infra 层层企业家,墨芯创始人&CEO 在计算中,王维分享了一个解决方案——稀疏计算。使我看到了云端和终端 AI 通过优化计算模式,芯片加速方案可以全面稀疏神经网络开发,提供超高计算能力和超低功耗的通用性。 AI 计算平台的概率。
ChatGPT 点燃热情,Llama2 让人脚踏实地
假如说 ChatGPT 点燃了许多企业家的热情,那么Meta 开源的 LLaMA和 LIama2让绝大多数企业家在基础模型的起跑线上“众生平等”。然而,根据自身的资源优势和能力结构,企业家在未来的发展方向上显然有不同的使命和愿景。
对仍然选择做底座大模型的企业家来说,开源的底座只是起点。尽管在和和和,李开复指出 GPT-3、GPT-3.5 等 SOTA(state of the art,在各种模型评价中,Llama2 差别不大。可以实际使用,今天, Llama2 的能力跟 GPT-4,以及 Bard下一个版本(谷歌的大语言模型),差别很大。
这似乎也给了大模型公司腾出了一些空间。未来,“真有钱”、“真有能力”的大模型企业家将有机会转化为一个 New Bard 或是 New GPT-4 的打法。
另外一方面,许多企业家表示,Meta “今天,开源给业界带来了极大的印象,” xxx 也许是中国最好的模式,但是明天它可能会被超越。甚至有一天,你会发现你原来练习的模型几乎没有用。当技术替代或更强的开源模型出现时,过去的投资可能会完全“浪费水”。比如开源模型在预训练中看到了1万亿英语。 Token,您自己的模型必须再看一遍,也许毫无价值。"出去问创始人&CEO 李志飞认为,要充分看清开源带来的深刻影响。
他说:“虽然每个人都有伟大的理想和抱负,但这取决于他们是否有足够的资金来支持那一天。所以要脚踏实地,活着也许比什么都重要。”澜舟科技 CEO 周明也认为,很多原本想做“最好的大模型”的公司,其实需要重新思考创业的生态位置,选择拥抱开源,在开源的底座上做“为自己所用”的事情。举例来说,英语开源模型在中文能力方面较弱,并未在行业场景、信息等方面进行打磨,这恰好是创业团队的机会。
此时,澜舟科技将开源模型当作开源模型。 L0 底座,在这上面,做 L1 语言模型,L2 产业模型,L3 场景模型。周明觉得,这样一层一层做好,通过客户跟客户走。 AI Agents(代理)通过互动获得反馈,模型一点一点的迭代,会慢慢建立堡垒。即使未来出现更好的开源模型,也有办法在此基础上重新训练或继续迭代。"开源模型"节节攀升",你会随着比你优秀的人的发展而成长。”
使用好的开源模型,也是一个堡垒和门槛。这可能和很多人想象的不一样。甚至有人可能会问,基于开源模型还是大模型吗?另一方面,很多企业也避免谈论使用开源模型的话题。
事实上,基于开源模型,后续投资门槛并不低,能力要求也不低。使用开源只能有效降低冷启动成本,对企业家来说并不可耻。举例来说,李志飞分析说,一个开源模型可能已经看到了。 1 万亿 Token 数据,帮助您节省数百万美元,模型制造商需要再次向下训练模型。最终要做到模型 State of the art(SOTA,指的是领先的大模型)的水平。每一步都不能少于数据清洗、预训练、微调和学习。每年的计算率可能是1000万美元,不一定一下子就没有门槛,更不用说使用开源模型了。
从这个角度来看,开源模型是更务实的选择,但也是提升和训练实用模型的真本事。基于开源,我们有机会做出一个好的大模型。核心是拥有相对领先的认知和持续迭代模型的能力。
大模型 ToB 现状与实践
模型化能力的提升是一方面,落入客户场景,另一方面。
从顾客的角度来看,大模型、“大”并不是唯一的追求,甚至完全不一定是顾客想要的。
一些企业家分享了一个特别现实的用户场景:真正跟随 B 客户谈话,客户只需要语言逻辑,多轮对话,一定的推理能力,其他的 AGI(通用人工智能)不需要任何能力。
顾客告诉他,其他功能反而带来了麻烦,“幻觉”(Hallucination)这个问题无法解决,而且顾客本来就有很多 AI 1.0 模型,原本用得很好,为什么要丢掉不用,AI2.0 无需覆盖 1.0 能力,能够合理调用就好。这也解释了为什么在国内外? RPA 大模型的引入是领域最积极的。来也科技创始人&CEO 汪冠春今年在国内市场也证实了客户在这方面有明确的需求。
在这种情况下,只要你清楚地理解自然语言,并调用参数。 AI 1.0 模型和外部数据库,结果是可靠的,成本也比较低,最后用大模型将结果组装起来,形成一份报告。这里的模型起到了任务分配的作用:分为子任务,每个子任务调用什么。在子任务中,有些大模型支持,有些是原来的统计模型,有些甚至不是自己的,而是第三方模型。客户最终想要的只要能达到目标。
试着找到这个 PMF(Product Market Fit,在产品市场匹配之后,如果只是这样做的话 To B,它的模型能力包括语言逻辑、多轮对话和少量推理。这个模型不需要太多,100。 亿到 1000 十亿的模型,相对来说就够了。相应地,要在数百张卡片的基础上,做好语言逻辑、多轮对话,并具备一定的推理能力,再加上 AI Agents,基本上可以满足用户在很多场景中的需求。
一种通用的大模式,并不意味着所有的问题都能得到解决。B 客户的很多场景,一般的大模型都没有效果。这意味着需要越来越多的模型和越来越多可收敛的场景,也意味着需要更多的力量来帮助技术和场景的对齐,而不是适应所有场景的万能技术。
澜舟科技 CEO 周明认为,在模型中继续训练用户信息、行业数据,甚至地图或规则是行业大模型存在的重要性。在通用大模型无法覆盖的部分行业,加入这样的数据可以很好的解决行业问题,克服很多幻想问题。
记得李志飞也补充了这个角度,他认为,通用大模型和竖直大模型,各尽其用,鱼和熊掌不可兼得。这个模型很大,意味着推理成本很高。而且,一个做ic设计的大模型,去回答电影、明星等娱乐内容,也是毫无意义的。他认为,To B更多的是垂直和可靠,而通用在于智力,具有很强的推理能力,逻辑能力,知识丰富。这不一定是 To B 现阶段需要的。
同时,国内各行各业对于在业务中加入大型模型的需求也十分强烈。蓝湖创始人&CEO 任洋辉,和 Moka 创始人&CEO 这两个家庭,李国兴 SaaS 企业商品接入大模型后,已得到客户的认可,真正收到了钱。
通过从这两个企业家身上走出来 2、3 月份到 7、8 对月份状态变化的分析,我发现了SaaS 在这个领域,我们越早看到大模型带来的技术变化是“重新定义软件”的水平,我们就越敢用“死而生”的思维去实践这个“重新定义”的过程。基本上几个月就会摆脱焦虑,让人看到希望。
因此,手握客户和场景的企业家,可能会成为那些大型企业家,成为更早获得技术红利的受益者。
因为落入了特定的场景,大模型实际上会有不同的追求。比如华深智药创始人&CEO 彭健说,大模型带来的幻像(Hallucination)这样的药物设计 AI for Science 这个领域可能是有益的,在某种程度上,所谓的幻觉在某些领域就是智力的意义所在,因为它可以帮助设计出意想不到的蛋白质组合方案。
如同智谱 AI 它是我国大型落地案例中跑得最快的一个, CSO 在实践中,张阔认为,对于未来大模型的价值,“20% 也许是中心化,80% 这将是非中心化的”,换句话说,用更丰富、更多类型的大模型在客户场景中产生价值,而不仅仅是解决所有问题的大模型的无限泛化能力,这是必然趋势。这也得到了很多一起交流的企业家的认可。
AGI 值得牺牲,但也不要“玩命”
大模型是 AI 这是一个分界点。过去,人工智能在一个封闭的系统中追求确定的目标。例如,人脸识别系统追求100%的准确性,但现在,大模型带来的“出现”是一种开放的智能,产生了各种概率。这是智能的真正特征,也是60年或70年来人工智能最大的变化。
在这样一个新的智能系统出现之后,未来每个人都可以像电力革命一样方便、低成本地获得智商。
智源人工智能研究院院长黄铁军认为,从大厂到创业公司,这种技术变化迅速传递下去,这是新时代的开始。在这个时代什么都不做,好像对不起这个时代和技术的发展。
而 4 月底的百川智能被认为是目前我国最“卷”的大模型之一,维持平均水平。 28 天发模型节奏,百川智能创始人&CEO 虽然王小川不承认自己在“卷”,但他分享了快速落地的方法:比如搜索技术积累的团队,对数据处理有很大帮助。并引入搜索增强,增强学习,以及其他配套的全栈技术,的确能帮助模型做得更好。“如果你看看现在技术公司的高层背景,你会发现很多技术做得好的人都有搜索背景,这反映了一些技术思路正在逐渐被看到。”
然而,黄铁军认为,从科学研究的角度来看,我们仍然只是进入一个伟大时代的早期阶段。如果我们比较电力时代,今天这样的智商时代实际上是法拉第发电机的时候。一旦转动,电流就产生了。现在是用大数据训练智力的阶段。我们还需要一个人——麦克斯韦。由于电磁学的建立,电力开始在人类社会可靠可用,促进工业革命的前提是电力。
今日的大模型还有许多东西是黑匣子,另一方面,大模型的“上限”也有很大的提升空间,AIGC 许多时候可以带来巨大的惊喜,另一方面,大模型的“下限”仍然不能保持足够稳定。,在这个时候,有必要了解技术的边界,合理地设定目标,解决问题。有些人要处理上限的探索,有些人要处理下限的稳定。
对于企业家来说,AGI(通用人工智能)曙光已经出现,这是一个值得投身的职业,但也不要“玩命”。
另外,除了等待大模型技术进一步发展之外,很多中间层的企业家都在改善让大模型落地到应用的环境。
BentoML 亚太区负责人刘聪表示,与之前的传统机器学习相比,海外客户基本上可以获得一些预算来制造与大模型相关的产品原型或产品。 Demo。但是现在还没有进入工作环境,为公司创造商业价值,而且很多做中层的企业家都看到了这个机会。
Dify.ai 创始人&CEO 张路宇对创业的洞察也源于此,他表示,从开发者的角度来看,获得模型是不够的。他分享了一个数据。在分析了6万多个使用的样本后,他发现现在生产或接近生产。这个比例几乎是 5%。有些人对模型技术不太满意,有些人还没有适应团队工作流程。 AI 应用开发。相应地,张路宇团队针对当今投产概率较高的应用,做了一些关键能力。举例来说,他们有一个指标,就是改善客户的摩擦程度。 AI 这个问题能提供多少价值,提供相应的能力。
Zilliz 创始人&CEO 从这个角度来看,星爵认为一个极其简单的开发栈是AI民主的前提。基于这个判断,他提出了 CVP(大模型 向量数据库 提示工程)这种开发栈。
怎样通往 AI native?
什么叫 AI 时代的 Killer App(杀手级应用),今年 3 月微软发布 Copilot 那时,很多人的好奇心被瞬间点燃。但是在这次闭门会上,李开复提出了不同的观点,Copilot 不算是 all in 大型商品。
在他看来,放弃移动互联网最成功的产品之一微信 compatibility(兼容性)非常重要。最早的工作是 MSN、QQ,不过胜出的是微信,因为张小龙做了决定,既然是移动互联网时代,就不要了, PC 当初微信专注于移动互联网的特点,100%下注于新技术平台。
从这个角度来看,AI native(AI 原生应用程序可能有这样一个特点:如果大型模型被移除,应用程序将会崩溃。这是一个完全依赖大型模型能力的应用程序。但是去掉 Copilot,Office 软件还是 Office,AI 只是锦上添花。
这种观点得到了现场企业家最多的认可,也引发了大家对此的定义, AI native 应用的讨论。
前不久流行的商品妙鸭,其产品负责人张月光认为,没有大模型,就没有妙鸭,这与李开复对。 AI first,AI native 探索是一致的。
他认为,妙鸭作为第一个应用,最重要的是解决可控性。妙鸭团队一开始并不想做底层模型,而是更注重如何利用现有生态开源爱好者开发的各种插件和小模型进行可控制。最重要的是可控性。妙鸭将照片质量平均分配 90 分数以上,也迎来了快速的成功。
他说:“我们特别关注网络层如何使模型更加可控,发现在图像跑道上,已经有了一些相对可控的技术。也许在语言跑道上,如果出现这种情况,对于上层应用创业者来说,将是一个质变的时刻。张月光的实践给使用大模型的企业带来了一些启发,可控性可能是 AI native 应用诞生条件。Stability. AI China Lead 在开源社区推动者处理可控性之后,郑屹州也观察到了这一趋势,并出现了大量的应用。
元石科技创始人李岩在实践新一代应用方面指出,大型模型所带来的推理能力,是新一代商品的本质差异。
而社交 Agent 这是一个被看好的机会,而且肯定会是第一批。 AI native 商品,但是这很可能要求创业者具备从大模型到产品“端到端”的构建能力。举例来说,李志飞分享和分享。 Character.ai 当讨论后者为什么要做自己的大模型时,对方说他们不会回答“调情”的问题,因为他们不会回答像OpenAI或谷歌这样的集中大模型。这是 Character.ai 寻找独特的空间,也是可以逐步积累的堡垒。
在社交模式的应用中,同一领域的倾心智能发现了独特的场景。倾心智能 CEO 张逸嘉分享了他们看到的和预期的区别。如今,大模型可以落地的社交场景不是陪伴。每个人都需要时间来接受虚拟形象的陪伴。现在落地的社交场景是角色扮演,用户画像是网络小说的粉丝,角色扮演是网络小说的新方式。
对今天最新的一个 AI Agent 大模式是否“全村希望”,甚至最终带来交互革命、终端革命、商业模式革命,很可能取决于多模式能力的发展。
思想宇宙创始人&CEO 陶芳波解释说,起初,每个人都对 Agent 期望值很高,但是在现有的技术环境中发现,Agent 如何比 ChatGPT 解决了更多的问题,难以解释。他认为,如果真的要的话 Agent 发挥作用,不要把那么多软件放在软件上 API 给予,因为连接软件, API 本质上是做兼容,是新瓶装的旧酒。
Agent 有没有更多的东西? Native 以形式完成最后一英里。有很多事情要做,数字栩生创始人&CEO 宋震所说的空间感知能力和多模态能力。当这些条件成熟后,可能会出现 Killer Case。
李志飞坚定地认为,现在看来,多模态是 C 位置,不是花瓶。因为Agent 输入和输出都取决于多模态的能力,没有多模态就没有多模态。 Agent,只是今天的 Agent 更多的是通过语言模型,通过文本原始反馈,但最终还是 Agent 这将是一个多模式的分析、感知和行动。他预测,跨模式知识的迁移,再过两三年,将是大语言模型最大的贡献。
大型时代,服务大 B 还是小 B
几个月前,我正好赶上旧金山的数据公司。 Databricks 开发者大会。这是一家专门从事“数据湖”的数据平台公司,可以算是一家在云计算平台上成长起来的“中间层”企业。就是这样一家企业,估值几年就达到了几百亿美元,而且还在持续增长。Databricks 既有大型企业,也有小型创业公司,大小通吃。
今年,该公司迅速访问了大型模型,并收购了大型模型公司。 Mosaic ML,开始帮助客户落地大模型进入业务,这个风口让它看到了一路狂奔千亿美元的价值。
当时我很好奇,为什么这样一个基于云计算的“中间层”企业在中国似乎没有成长起来,而这波浪潮 AI 技术进步的变量能否在中国催生出这样一批将云计算率转化为商业竞争力,为更多行业带来数字化进步的“中层”知名企业?
阿里巴巴云董事长张勇认为,“中层”企业的出现肯定是可能的,云计算企业乐于看到。但这些公司需要解决的仍然是一个关键问题。——定义清楚要解决谁的问题,定义越清晰,能力越到位,所做的事情就能真正“收敛”,真正具有商业“穿透力”。
同时也引起了企业家的讨论,比如大型技术刚刚开始进入行业,但是企业服务“不收敛”、项目化问题开始出现。例如给 B 终端用户进行大模型培训,但由于信息是对方的,他们的团队很难“闭环”——数据没有飞轮,收入和毛利都很低。他们不小心成了“高科技施工队”,技术公司面对面。 B 端一个通病。一些企业家甚至开始怀疑大模型。 To B 土壤可能天生缺乏。
但是加入企业家群聊一直在做笔记的张勇,正是在这里非常系统地表达了不同的观点:“To B 事实上,还有一种可能,那就是“小” B",即那些中小企业,他们看起来不起眼,但数量众多,仅仅为他们服务,就能造就现在的互联网大佬。"
比如阿里早期的“黄页”,让中小卖家被外国客户看到,带来了跨境贸易的繁荣;淘宝解决了信息和物流的流通问题,创造了电子商务的大类。
并且,与大企业相比,这些小企业 B 公司不关心技术和愿景,谁能帮助他们解决成长问题,就会为此付出代价。
目前大公司数据化的主要目的之一是“降低成本”,归根结底是“节流”。然而,效率提升的空间总是有尽头的,但增长和发展的“开源”空间相对无限。张勇认为,公司服务中的“开源”远比“节流”重要,每个人都愿意为发展买单。
他甚至认为,过去数字企业服务过于重视“降低成本”可能是一种误解,因为通常是大企业愿意为提高百分之几的效率付费,而且体积大,符合投入产出率。然后让大家围绕大企业做项目。另一方面,小企业很难通过“降低成本”来启动自己的需求,他们想要的是成长和发展的能力。
其实,小 B 顾客也有一个双重的特点,那就是如果使用“订阅”的方法,那么它实际上可以被视为“C 端用户”。
此时张勇的观点也得到了与会企业家的认可,比如出去问问题的李志飞曾经在语音识别领域做过。 To B 生意,被同行卷得很痛苦。后来他做了什么。 AI 配音工具“魔音工作坊”,服务内容创作者,收敛到真正解决小问题。 B 一般问题商品,这些“小” B相反,让他真正把它放在一边 AI 技术已经成为健康成长的业务。
张勇还建议创业公司需要从一开始就明确自己想要服务的用户, C 还是 B,是小 B 还是大 B,一定要定义好。张勇甚至认为, AI 如果既做了企业 To 大 B 又做 To 小 B 甚至 To C 这是行不通的。
尽管 AI 技术的发展带来了许多变化,将会越来越具有通用性,但在技术层面之外,还有组织“DNA “问题”,“在你的公司做大客户和互联网用户的团队,工作的着装和说话方式可能会有所不同。”张勇认为他应该定义他服务谁,处理什么问题,而不是去任何地方。
大型模型对云意味着什么?
几年前的最后一波 AI 在浪潮中,很多创业公司也获得了大量的融资,出现了很多知名公司和企业家,但几年后,他们仍然努力工作。我一直和很多企业家保持沟通,很多次约好聊天,看到他们看起来很累,嗓子嘶哑。当我问的时候,我通常会在前一天和一个大客户一起喝酒,但是我没有恢复。
这一次,很多企业家也目睹了“高级人力外包”和“高科技施工队”,因为技术无法形成标准化产品,只能接手项目。他们都认为我们不能再犯错了。
同时,大家也很关心阿里云这样的云计算平台在模型时代会面临什么变化。大家也问张勇,在模型时代,他觉得云本身是技术还是商品?
“云本身应该是一种商品,而不是一种商品,而是一系列的商品,”张勇的回应非常直接。”在模型和 AI 在潮流的推动下,有一件事是肯定的,那就是行业和客户对算率提出了全新的要求。如何满足用户对计算能力的进一步需求,成为阿里云的基本出发点。张勇认为这里一定有技术要解决的问题,但阿里云也应该思考如何“收敛”到真正解决工业生态问题的产品,而不仅仅是导出计算率本身。
有趣的是,尽管这次交流活动是有趣的。 FounderPark 社区和阿里巴巴云联合邀请,但没有安排任何关于“通义千问”的分享。当然,企业家也非常关心云平台本身的大模型目的。张勇的观点是:这很容易发生 Hyper Scaler跨技术时代(超大型玩家),肯定没人敢掉队,不可能不去触摸技术本身。但是他觉得,在这样一个巨变的时代,阿里云要把握还是更核心的角色,就是Cloud。 Service Provider(云计算服务提供商)。
“要做好这个角色,不了解大模型肯定是不可能的。”张勇说:“如果我们不问通义,我们可能不知道如何帮助今天参加会议的企业家。”
事实上,让张勇更加兴奋的是,他十分确定,未来人类社会对计算能力的需求是无限的,对其效率的要求也会越来越高。所以张勇说,阿里云绝对希望“模型越多越好,场景越多越好”。两者越多,对计算能力的需求和技术标准就越高,这意味着云有了新的问题需要面对和解决。而且只有不断地解决“难题”,才能带动云的价值有更大的发展空间。
“云计算平台需要前所未有的生态,而不是自己做任何事情。目前还没有一家公司能够使用自己的芯片、云计算、数据平台、机器学习框架和大模型,产生所谓的“闭环”,这在物理上几乎是不可能的。”
张勇觉得,AI 随着技术的发展,生态学有了新的可能性。在过去的十年里,他有一个缺点,那就是中国云计算的快速发展,但是中国 SaaS 由于基础设施的快速发展,行业并没有得到实质性的改善。而且美国的 SaaS 公司,目前正在探索的公司 AI 嵌入平台升级,走一条与国内公司不同的道路。
他认为,在 AI 在时代,中国有可能出现新一代。 SaaS,这将是一项全新的智能服务,以及以前。 SaaS 不同的流程驱动程序,这种新的服务将由数据和智能驱动,也可能不叫 SaaS。
面壁智能董事&CEO 在国内,李大海指出 To B 这个市场很碎片化, SaaS 服务起不来的原因。但是现在有了大模型这样的技术变量,能不能有一些变化是值得期待的。同时,他也期待着像阿里巴巴云这样的云厂商在这里有一些好的解决方案和基础,带大家一起走得更平。
对张勇来说,过去中国有很多。 SaaS 到目前为止,公司还不能安全。 Cloud Native(云原生),而对于一个自然生长在云上的人来说, Intelligent Native新的服务(智能原生),有机会“平替”以前的非原生商品。
许多时候我们感慨,去年十年的中国 SaaS 行业增长并不令人满意,但现在大模型为创业公司在全新的数字生态中塑造新格局提供了新的机遇。张勇的结论是:这样的机遇和挑战对所有的企业家来说都是一样的,他们必须在未来找到自己的位置,共同创造生态伙伴关系和财富。
好了,上面是我的长达。 7 一些在小时交流中选择的笔记。今天大模型技术带来的时代变化,我最强烈的感觉就是刚刚拉开帷幕。经过上半年的极度兴奋和“过度想象”,一个可能接近 10 今年的技术革命,才真正开启了“万里长征”。真正的共识是在疯狂期过后真正进入拓荒期,在这里经过足够的时间磨练和付出坚实的代价才能得到的。
希望企业家和产业生态之间有更多坦诚的交流和带有“开源精神”的思考冲击。事实上,张勇给这次交流起来的“西溪论道”这个名字相当不错。坐着说话,你应该采取行动。
我认为,这个“道”应该是 AGI 时代从技术到产品, vision 让我们来看看价值的“创新之道”。
本文来自微信微信官方账号:极客公园(ID:geekpark),作者:张鹏
本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。
免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com




