大型时代,没有超级应用,只有超级智能,为什么?

01-02 06:28

画画,写文章,创作视频之后,AGI 另外一个应用场景是:编程。


以前大家都认为编程有很高的门槛,但是在 AGI 时至今日,它正在成为大家触手可及的技术,越来越多 AI 编程工具,让不会代码的普通人也可以轻松制作。 App。


如何摆脱基于移动互联网时代的想象,实现大模型时代的新概率?未来,每个人都能成为吗? AI 程序员,创建自己的程序员「个性化应用」?


对这些问题,AIGCode 极客公园创始人宿文 IF2025 在创新大会上,给出了自己的答案。


宿文认为,是的 AGI 的赋能下,AGI 代码能带入更多的应用程序。「个性化」在这个时期,每个用户都可以实现自己的小众但准确的需求,小团队也可以降低成本,快速迭代。这是宿文眼中编程的终极场景。


就宿文而言:


互联网时代创造的应用、平台,不生产任何内容,只完成内容的汇集和分发。


在模型时代,大模型只有一个主要功能:帮助你在底层生成内容。


大模型时代刚刚开始。大模型的链条会是什么样子?每个从业者还在探索,但这个链条可能不会长成上个时代的样子。


AI 编程将重塑软件开发行业,软件开发「又好又快又便宜」能同时实现。


没有超级应用的模型时代,只有超级智能。



以下是 AIGCode 极客公园创始人宿文 IF2025 现场演讲实录在创新大会上,由极客公园整理。



01 从 Copilot 到 Autopilot


即将过去的 2024 2008年,大型跑道引起了许多讨论,AI 程序设计是一个无法回避的话题。


每个人都会说程序员被大模型深刻地改造了,全世界有七八千万程序员,占全球人口的比例。 1% 上下。如此强大的软件代码改造技术,如何让其它软件? 99% 人们怎么用?


我们可以举个例子。今天中午,极客公园鹏总突然说这个活动做得很好。除了网上购票和网上收费,我们还能在网上直播吗?会议组的朋友崩溃了。哪里可以找到直播管理平台,哪里可以找到? SaaS,假如自己设定需求,自己去做开发,至少几个星期,几个月。


为方便大家了解 AIGCode 的商品 AutoCoder,让我们给你看看这个平台。



这个产品完全面向不会编程的群体。


另外非常重要的一点,与大家现在拿到的类似产品相比,重点是前端,但是 AIGCode 能将后端与数据库一体化交付给大家,可以交付一个完整的软件工程。


这样做的根本原因与我上一次创业有关。我上一次创业是做软件,效率是一个很大的痛点。我们通常会提出一个需求。程序员要工作几周甚至几个月。我们看到很多好的技术栈,字节和阿里都用得很好,但是我们的程序员用不上,程序员的成本很贵。


因此如何快速、好、便宜地做软件,是每个行业都面临的难题,不可能在一个维度上解决。然而,随着大模型的到来,它可以很好、快、便宜地完成。



当然,在实现过程中,目前主要有两种解决方案:一种是 Copilot,就像名字一样,帮助程序员做辅助驾驶。另外,我们想做的就是 Autopilot 这种产品。


Copilot,现在主要还是以程序员的工作场景为主。 IDE 在里面做代码补充,中国没有。 IDE,即使是世界上最重要的东西 IDE 80%、90% 所有的市场都在微软手中,作为初创企业在生态中是不可能的。 PK,这种巨大的生态竞争只能避免。我们在 Web 端做 IDE Free 商品,端到端去做。我们的用户将完全不同,我们把用户群从 1% 放大到 10%、20% 都可能会。


现在大家使用的模型和模型 Copilot 商品,主模型可以使用最好的基模,不管是国外还是国内,大家都在使用。 Deepseek 这个级别的基本模型。要把代码链提升得足够好,核心技术都卡在模型上,所以自研模型不会套壳,不能使用。 Llama 要做到这一点,我们将有自己的模型结构来解决这个问题。


同样重要的是,传统的软件架构不同于生成式软件架构。两大支柱在算法和软件架构上进行了创新,这是我们的两大工作。



右边是模型上的工作,核心处理有两点:大、准、大「大前后文」,而非后半段 4K 窗口串联。另外,新的网络结构带来的好处,还有一个软件结构的创新。


ChatGPT 就在两年多的时间里,我们实际上站在今天这个节点上,我们非常期待大模型能够解决很多问题。


今天能解决的问题主要有两个场景:写作和绘画。数学、编程等很多理科生的问题还没有处理好。我们遇到了很多其他的问题,比如训练成本、资金、模型本身的泛化能力、训练效率等等。


当前的网络架构 Transformer 去年上半年提出的向前迭代 MOE 这一结构也在对整个大模型进行改造, MOE 之后还有 MMOE 等待很多技术迭代。


我是第一个使用的 PLE 结构的核心是我们可以让专家或大模型在网络结构层面更有结构地深入研究人类的优质样本。其实不会出现样本不够的问题,因为我们有很多优质的样本,比如论文和代码,还没有完全学会。


为了让整个模型支持完整的代码生成,模型底层需要强大的算法,所以我们自己做改进,包括整合不同的计算能力平台,加快整合平台上的计算率,解决我们看到的所有技术卡点。


我们不会捏任何国内软柿子来比较自己的模型成果。我们仍然使用世界顶级团队的最新版本和最大参数。在泛化指标方面,我们是与主流模型基本对齐的水平。


在接下来的三个季度,我们将 13B 和 33B 还发布出来,供有模型使用能力的团队使用。



这个句子是我们公司的愿景,刚刚主要解释了前一句,Auto-coding is AGI,看起来我们在处理代码编程的问题,但核心问题是:能否将端到端代替程序员完成代码。


02 Auto-coding 加快「个性化」


这问题由 AGI 模型本身决定,我们发现无论是处理前后文本、网络架构、底层优化器、计算速度加快等问题,都是目前的问题。 AGI 最大的痛点,这两个问题几乎是等价的,AGI 和 Auto-coding 基本上同一时间点就要到了。


底层逻辑有两种:一是代码本身就是一种高质量的语言,对模型训练非常重要。另外,我们认为 AGI 自己从一项新技术的出现,到两年前。 ChatGPT 当我们进入公众视野时,我们对它有很多期待,但它不成熟地处理各行各业的问题。所以各行各业的专家或者用户都会骂街,说这个工具不成熟,解决不了问题。


但对代码赛道来说,更令人高兴的是:95%的算法工程师, 都是程序员出身,所以思维闭环很快,自己做得好不好,我们自己心中有数。


其次,就是这样 Auto-coding 准备好之后,解决问题的时候,怎样端到端,要打什么需求点?


用户体验的关键点:第一点是准确性。我们所有的需求,如何在底层商品链中达到准确性?今天用了很多。 Agent 类别产品,第一个生成版本很好,但是细微的需求点无法实现。


第二点是灵活性。在一个应用程序的形成过程中,最重要的是要满足各种个性化的要求,比如一个输入框是否足够灵活,能否与所有功能逻辑串通。


第三点是完整性,这是软件工程的工作,需要解决工程的安全问题和部署问题。这些工作完成后,这个方案将成为一个基础设施,所有程序员的工作都可以通过推理和计算成本来解决。我们想做什么 Personal App(个性化应用)可以实现。


当你看到这一幕时,你可能会说:「我们手机里装的都是通用应用,我要一个。 Personal App 做什么呢?」还有很多人问我:「你们要 ToB 还是 ToC?」



事实上,当一种新的生产力工具出现时,这些问题并不重要,举两个非常有趣的例子:


上周,我去云南的一个城市参加了一个会议。会议组织者带我们去了景区。许多人排着长队买票,但他们旁边有几台自动售票设备。当我走近时,我打开了机器。机器里装满了 Windows 系统,在这个时候,如果一个管理者能够提出一个售票系统的需求,他就不需要在当地找程序员,他可以使用它。 Windows 在里面安排了一套售票管理软件,排队购票的问题很容易解决。


另外一个例子,我和一个朋友讨论了播客,我们听到的很多播客都依赖于像小宇宙这样的播客客户端。在美国,许多主播会来。 YouTube 有视频播客的频道,国内很少有视频播客。这位朋友说我们不想出现。如果有卡通形象体出现,做视频播客,主播自然会舒服很多。


所以每个人都会发现,我们的场景需要很多个性化的应用,即使是基于一个通用的平台,也可以添加很多个性化的功能,可以在编程的最终场景中实现。


当我们想在小红书、知乎或百度上搜索一个软件来解决我们的一些问题时,我们本质上是在提出需求。如果这种需求可以通过自动生成的代码和应用来实现,而不需要客户找到各种应用程序,那么在找到之后就要克制自己的需求。这两种感觉完全不同。


03 大型模型的核心功能,究竟是什么?


关于代码生成和我们公司要做的事情,介绍到此结束。下一步,我有三个真相要说:


每个人都在追求 AGI 或是处理 AGI 问题,非常分离。比如很多老板会说,整个大模型还处于婴儿期,但从现在开始, 2024 从年初到现在,大家都说今年是 Agent 第一年,但是婴儿期的工具怎么解决这么多问题呢?


人们常听到这样的话 Scaling Law 到了最后,可是囤卡乐在其中,H100、B200,1 万张,10 一万张,几十万张卡片,现在大厂甚至开始从事核电厂,包括 Ilay 最近提到预训练期结束了。其实里面没有干货,主要是学完样本,但是高质量的样本还是很多的,需要结构化输入到整个网络架构中。


所以有什么资源,每个人都会依赖什么路径?,对我们这样的公司来说,我们看到更多的是网络架构层带来了很大的收益。由此可见。 Transformer 出现了。在过去的几十年里,每个人对通用人工智能的向往都无法避免网络架构的环节。这一层获得了更多的收益和需要解决的问题。



第二,互联网或移动互联网给每个人留下了太多的思维惯性。无论是投资者、企业家还是产业分析师,一个分析框架很快就出现在模型出现的第一天。这个框架链有一个基本模型。OS、Agent、应用...但是这些分类的基础是从上一个时代复制出来的。我们不知道大模型时代的链条会是什么样子。很有可能不会长成上一个时代。


在做的过程中,我们发现, Infra 这一层,做基本模型,做应用,每个环节的基本链条都不成熟。不成熟的时候,如果等待链条的完善,或者自己找一段时间来完善,这个商业渠道很难运行,因为很难直接向客户传达价值。对我们来说,我们有能力把这些链条放在一起,而不是停留在过去的技术思维中。


第三,从模型出现的第一天起,很多人就提到了超级应用,这也是网络时代留给我们的想象。在移动互联网中,我们可以看到这个超级应用本身并没有产生内容,而是做了一个数据嫁接平台或者一个中间平台,让我们搜索内容的速度越来越快,推荐信息越来越准确,交易效率越来越高,但是这个平台本身不会提供内容服务。


可是在大模型时代,这些互联网项目的特点基本消失了,大模型只有一个主要功能:帮助大家在底层生成内容。


这种竞争力必须是最低的。不清楚未来超级应用会是什么样子,甚至不会存在。但是超级应用的底层是对超级智能的支持,这是必然的,也是最核心的竞争力。


看起来我们在做 AICoding,但是事实上,我们正在这样一个商业场景中解决问题。 AGI 我们面对自己的问题, AGI 一路狂奔,也希望有更多像我们这样的朋友,向上卷,向核心技术卷,最后在产品上沉淀这些技术,提供给我们的用户。


谢谢大家。


本文来自微信微信官方账号“极客公园”(ID:geekpark),作者:Moonshot,编辑:靖宇,36氪经授权发布。


本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。

免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com