DeepSeek:“边缘革命” 的概率

05-08 10:24

杭州深度求索人工智能基础技术研究有限公司(以下简称DeepSeek)是一家专注于通用人工智能的中国科技企业,最近在世界人工智能跑道上掀起了一股飓风。


DeepSeek的开源推理模型从产品的角度来看是免费的,直接面向用户,并且可以支持具体的研发, 提供相关应用场景模式服务,支持网络搜索和深度思维模式的网络实现;DeepSeek擅长处理复杂的任务,具有强大的应用模式科学设计和二次开发特点,包括文本生成、自然语言理解和分析、编程和代码相关功能。


DeepSeek最显著的影响是推动开源AI模型的选择。DeepSeek的成功证明,开源战略可以带来更快的创新和广泛的应用,这被认为是AI产业的“开源时刻”。


DeepSeek的成功也显示了一种“边缘革命” 也就是说,边缘者可以通过自己的努力进入中心。对AI玩家而言,DeepSeek是一个闯入者,其总部从量化金融开始。对世界而言, 它还包含着新的机遇。以前人工智能的发展,似乎构成了某种霸权。通过垄断算率,美国高科技公司垄断创新的概率,发展中国家无法获得足够的算率,也难以获得相应的人才,因此几乎错过了大模型的发展。DeepSeek的成功让发展中国家看到了AI真正包容的概率。如今,只要每个国家的参与者跟踪这些新知识,他们就可能再次上牌。当然,随着AI的进一步发展,其联动的全球治理问题将变得更加重要。当大型模型的参数值变大时,大型模型可能会失控。一方面,关于大型模型是否会产生自我意识有很多争议;另一方面,恶意用户可能会使用它进行一些破坏性的活动。


开源启示录


DeepSeek产业运行模式的成功,我们认为, 对于中国特色AI产业平台的建设和推广,有以下启示:


(1)在全球网络产业平台上,中国企业并非必须占据最低层次的基础研究开发。这次深度追求(DeepSeek)二次开发平台的成功表明,掌握底层技术的国家,并不能完全控制网络产业平台的价值传播和利益流向。二次开发与传播模式的合理规划,使其符合具体的技术场景和国家地区特征, 可以打造具有中国特色的人工智能技术平台。通过这个应用平台,可以促进资本的合理流动,进一步促进基础技术的发展。


中美AI差距正在缩小。自ChatGPT发布以来,中美人工智能的差距似乎一直在扩大。特别是在OpenAI发布GPT-4和o1之后。但是,DeepSeekV3和V3-0324的发布,使得这种发展差距似乎缩小到几个月以内。它让我们再一次看到了中国人工智能发展的新机遇和新潜力。


(3)真正的AI产业化时代即将到来。这个正是中国最擅长的。同时,我们拥有广阔的产业和应用领域,能够更好地与人工智能相结合。DeepSeek的成本革命将加速这一产业应用进程。大多数大型服务供应商已将原有的收费模式转变为免费,因此人工智能的发展将进入低成本AI运行时代。此外, 大型语言模型应用程序接口(API)价格也在下降, 而且最后可能接近免费。这当然也不是没有成本。它的成本仍然由大型服务供应商承担,但是这种成本的降低最终会使消费者获利,从而大大加快产业应用的发展。


(4)小团队带动大团队。DeepSeek代表了一个小团队的胜利,类似于OpenAI最初产生的效果。大型企业有更多的计算能力和更多的资源,但他们非常关心股价,所以大型企业很难做出基本的创新。真正的创新往往是由小团队驱动的。这样,DeepSeek再次诠释了小团队驱动大公司的逻辑。


(5)国内产业内循环模式设计和国际国内产业整体循环模式设计,需要合理定位相关产业的内外循环方式接口政策体系。另一方面,从平台底层控制的角度来看,要保证“技术国界”的安全, 与科学设计相关的国家技术导向机制;另一方面,要避免冷战初期美苏技术平台在抵御环境下的不合理技术竞争,防止不惜任何代价和方向定位不准确。在建设中国“技术国界”的基础上,相关部门要在信息技术、网络技术、智能技术底层平台国家投资和控制的基础上,设计出具有中国特色的国际平台产业生态的合理模式和有效方向。


(6)相关产业政策研究部门要通过政策引导资本支持科技企业创新,合理分析产业运行数据。要鼓励国内资本参与以国家利益为最终目标的国际竞争。但是资本是有利润需求的,而且通常是中短期需求。近年来,相关部门陆续出台了一些政策文件,对风险投资基金颁布了差异化扶持政策,利用风险投资基金加强对行业科技龙头企业、科技创新转型和产业链上下游中小企业的投资,鼓励投资早、投资小、投资长期、投资硬科技。除了国有资产模式中对技术平台的长期定向投资外,建议相关管理部门合理引导民间投资成为长期资本和耐心资本,让更多的民间投资参与中国特色智能产业平台的底层建设。


在加速应用之后,需要关注社会风险。之前, 当我们还没有走向世界的前沿时,我们不需要过多考虑这个问题,因为其他先锋会探索各种可能性。当我们真正走向世界创新的前沿时,我们需要考虑各种综合性的事情,这样才能保证人工智能的健康发展,最终保证人工智能的积极社会效益。



教育变革在大模型时代的教育变革


教育也需要在模型时代发生根本性的变化。


以前的教育体系是为工业时代准备的,培训的基础是每个人对知识的记忆和一些知识和技能的掌握。然而,如今,大模型作为一种强大的知识辅助工具,对于这种过于强调记忆功能的培养模式来说,将是一个巨大的挑战。未来教育的重点应该是创新和实践。过去大多数学习者只能学到一小块人类知识的限制,而且很难实现真正的创新, 因为他们所学的知识比较少,所以有限的创新大多是在前人的基础上做一点细微的调整。此前, 在创新的最前沿,只有少数天才能到来。大部分的创新都是针对少数天才或精英。大多数普通学习者,一生中,大多数工作都是重复性的。如今,在模型支持的背景下,创新需求成为不可避免的选择。这种创新需求是基于大量的知识,因为大型模型本身就包含了大量的知识。


未来教育转型的一个重点应该是面对更扎实的通识教育。需要在求知者求知欲最强的阶段(如中学)以某种方式向学习者传递科技的前沿,在学习者心中种下这些知识的种子。 而且不要像现在这样反复训练一些可能已经过时的计算技能或者记忆技能。


在这个时代,大模型已成为一种辅助通才。对人类个体而言,大模型产生的内容, 大多数已远远超出了普通学习者的能力。因此, 对于教育来说,一个基本的要求是,我们现在需要迅速地提高个人知识的储备。在数量的基础上,增加其对知识的理解深度,从而与大模型强大的知识理解和生成能力相匹配。由于大型模型产生的内容是需要诱发的,这实际上非常依赖于提问者的知识能力。假如提问者对此一无所知,那么他(她) 大型模型的高质量内容产生是不可能的。因此, 学习者需要大量扩大他们的知识基础。同时,只有在大量知识的基础上,学习者才能产生“理解时刻”,蕴含着涌现效应。(Aha Moment)。


知识开源“明牌时代”


从历史上看,知识通常掌握在知识精英手中, 通过长期的学习,个人可以接近这些高级知识。而且,个人常常以一种“爬台阶”的方式学习。但是,在今天的“明牌时代”,只要问大模型问题, 个体可以获得最前沿的知识,这实际上是一种越迁式的知识获取。以前的知识获取需要一点一点地逐步推进。换句话说,如果一个人缺乏前面的知识储备和理解,他就不能在后面理解新的知识。可是, 现在借助模型,只要掌握了合适的提问方法,个人学习就能加速。这儿还有一些学习技巧。有的时候,用“一目十行”或“半知半解” 这样做的方法,可能会加速这样的学习。从这个角度来看, 学习者可以加速、越来越多地获得大量的高端知识。这样,我们的知识就进入了“明牌时代”。


大型模型起到了一种作用知识权或知识平权功效。那么,知识由“暗知识”转变为“明知识”。甚至我们人类社会中的一些默示知识(比如潜规则), 这些隐藏的知识也可以通过大模型获得,因为它们已经隐含在模型预训练的文本中。这导致个人掌握和理解这些知识的意义下降,其重点需要从理解和掌握转变为实践。在以前的时代,个人掌握了知识之后,就可以开始生产知识了。在未来,知识生产工作将逐步交给大型模型,因此个人所需要承担的最重要的功能就是从原来的知识生产转变为知识实践。


今天,我们进入了一个终身学习的时代。在此之前,我们的学习通常集中在青少年阶段。学习通常通过基础教育和高等教育来完成。今天的教育必须是一个终身学习的过程,因为知识在不断迭代。一旦正式学习结束,个人不再更新知识,个人的知识结构就会过时,很快就会被这个时代抛弃。因此,怎样形成长期的学习机制, 它变得尤为重要。大学是学习的最高殿堂,应该变得更加开放,允许那些毕业或没有机会进入大学的人通过各种方式进入大学——通过一个学习社区进行线上或线下学习。对于学习者来说,大学应该没有墙。


DeepSeek的开源给了我们很多启发。我们特别关注的启发之一是,即使是这样一个优秀的前沿模型也是以开源的方式呈现出来的,所以大学似乎更应该以“开源”的勇气面对大众和未来。MI·趋势


本文来源于微信公众号“复旦商业知识”(ID:BKfudan),作家:高奇琦 36氪经授权发布汪激。


本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。

免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com