OpenAI o3模型出现,人类离AGI更近了一步。
The following article is from RimeData 来觅数据 Author 来觅研究院
导读:2024 年 12 月 20 日,OpenAI 下一代推理模型已经发布 o3,这就是它的存在 9 月发布的 o1 最新版本的模型。OpenAI 表示,在某些环境下 o3 模型可以接近实现 AGI(通用人工智能)。o3 模型的特点是什么?国内 AI 大型模型进展如何?投资和融资情况如何?本文试图对其进行分析和探讨。
01 o3 模型特点
2024 年 9 月 13 日凌晨,OpenAI 发布了 o1 模型,这个模型包含两个版本, o1-mini 和 o1-preview。OpenAI 表示,在复杂的推理任务中,新模型代表着新模型。 AI 新的水平,所以把它的记数重置为 1,而非持续" GPT-4 “系列命名。o1 该模型的主要特点是具有较高的理解能力和深度思考能力,推理能力的显著提高也标志着 AI 进入一个新的时期。
自 12 月 6 日起,OpenAI 打开历时 12 天空产品发布会,并于发布会第一天发布。 o1 模型完整版本。o1与预览版相比。 更快、更智能的完整版本支持多模式推理,同时其差错率降低了约错率 思维速度提高约34%。 50%。
在为期 12 天堂发布会的最后 1 天,OpenAI 新一代推理模型系列已经发布。 o3(因为一家英国通信运营商称之为英国通信运营商 O2,考虑到商标权益问题,OpenAI 把新模型命名为 o3),这个系列包含两个模型, o3 和 o3-mini,前一种高性能推理模式,后一种是较小的精简模式,提高性能和成本,同时保证智能。
就 o3 模型方面,在性能方面,o3 软件基准测试模型(SWE-bench Verified)上面的准确率是 71.7%,较 o1 提高超 20%;在 Codeforces 在比赛编程中达到评分 2727,接近 OpenAI 顶级程序员内部水平; AIME 数学比赛的准确性达到 96.7%,超越 o1 的 83.3%。
此外,o3 模型在 ARC-AGI 在测试中,第一次突破了人类水平的门槛(85%) 87.5%,这是 OpenAI 在推进 AGI(通过人工智能)征程的另一个关键进展,也意味着人类离开了人类。 AGI 再近一步。但 o3 模型使用费用昂贵,o3 在高计算模式下,每个模型任务的成本可以超过1000美元, o1 每一个模型的任务费用只是 5 美金,o1-mini 只需几元。高昂的成本,使 o3 目前还不能大规模推广模型。
图表 1:OpenAI 模型性能概述
信息来源:OpenAI、RimeData 来寻找数据整理
02 国内 AI 大模型进展
回放国内,现阶段 AI 大型互联网领域呈现大型互联网 / 科技企业占主导地位,创业公司崛起,科研院所和大学助力的局面:
(1)大型因特网 / 科技企业:以百度、阿里、腾讯、字节跳动、华为、科大讯飞为代表,凭借雄厚的资金实力、行业领先的技术、丰富的计算能力和数据, AI 大型市场占有重要地位,例如百度文心大型日均模型 tokens 调用量已超 1.5 十亿个豆包,字节跳动。 AI 大模型累积客户规模超大 1.6 亿;
(2)AI 创业公司:智谱,月亮的暗面,MiniMax、百川智能等 AI 创业公司受到资本的青睐,业务发展迅速。例如,智谱在 12 每月完成最新一轮融资,达到 30 一亿元,同时存在 2024 年前 11 月度商业化收益同比增长超过 100%,C 端产品智谱清言 App 用户数超 2,500 万;
(3)科研院所和高校积极参与北京智源研究院、上海人工智能研究院、清华大学、复旦大学、中国科学院等多所科研院所和高校。 AI 大型模型,促进行业技术研发与创新。
智源研究院(2018年)在实际大模型性能方面 近年来,在科技部和北京市的支持下,联合北京人工智能领域优势单位建成)最新一期发布的大模型评估列表显示,在语言模型方面,字节跳动旗下的豆包通用模型 pro ( Doubao-pro-32k-preview ) 在视觉语言模型方面排名第一,豆包 · 视觉理解模型(Doubao-Pro-Vision-排名第二的32k-241028,仅次于 GPT-4o;就文生图而言,腾讯的 Hunyuan-Image、字节跳动的 Doubao Image v2.1 在文生视频中排名第一、第二,快手的可灵 1.5「高质量版」、豆包视频生成模型字节跳动(即梦 P2.0 pro)各自排名第一、第二。
图表 2:评价各种大型模型 TOP3
资料来源:智源研究所,RimeData 来寻找数据整理
与此同时,幻方量化旗下的 DeepSeek(深度追求)企业最近上线了 DeepSeek V3 模型。DeepSeek V3 性能优越,现在 Aider 在多语言编程检测排行榜上,DeepSeek V3 超越了 Claude 3.5 Sonnet,仅次于 o1,排名第二;在国际权威名单中 LiveBench 测评中,DeepSeek V3 这是目前最强的开源 LLM(大语言模型),而且仅次于非推理模型 gemeni-exp-1206。DeepSeek V3 性价比高,依据 DeepSeek 技术报告公布,DeepSeek V3 总训练费用为 557.6 一万美元,前面 OpenAI 研究副总裁,现任 Anthropic CEO 的 Dario Amodei 近日透露,目前的大型模型如 GPT-4o 等等,训练费用约 1 亿美金,但是他预计这些大模型的练习费用是多少? 3 可以在年内实现 10 亿美金甚至 1,000 亿美金。这意味着,DeepSeek V3 最大限度地提高了资源有限的效率。
但是也有一些争议,因为 DeepSeek V3 其优化是针对特定架构或任务而设计的,实用性还有待提高, DeepSeek V3 这次公布的费用只涵盖了一次培训的费用,还没有包括前期研究或精简测试的费用,这些费用与结构、算法或数据有关。即便如此,DeepSeek V3 它的出现,也说明了国内大型企业可以通过更具成本效益的方式来探索模型的极限能力。总的来说,在各个企业中不断增加对比。 AI 在大型模型投资的背景下,国内大型模型的能力已经迅速提高,在某些领域不断接近甚至超越世界领先的大型模型。
在产业落地方面,在模型性能不断提升的背景下,大模型已经在金融、医疗、政务、工业等各个行业得到了更深入的应用,比如豆包 AI 大型汽车已经与多个主流汽车品牌达成合作,并且接入了多个手机,PC 等待智能终端,覆盖智能终端 3 同时,智能终端的十亿台豆包 AI 在半年内,大型调用量增加了 100 倍。根据公开资料,从项目中标的角度来看,2024 年前 11 国内大型中标项目每月中标。 728 个,总中标金额为 17.1 一亿元,分别是 2023 年 3.6 倍、2.6 倍。这说明市场对大型模型的需求迅速增长,也反映出来 AI 中央国企技术渗透水平不断加深。
AI 根据《全球数字经济白皮书》,大模型竞争激烈。 ( 2024 年 ) 》统计数据显示,全球已有基本大模型 1,328 个,中国的大模型是 478 个,大约占全球数量 36%,可见大型产品的诞生速度如此之快。许多企业涌入大模型领域,市场竞争不可避免。自 2024 年 5 到目前为止,国内公司已经开始了大模型价格战,比如阿里云在 5 月 21 通义千问主力模型每日宣布。 Qwen-Long 进行减价,API 输入价格从 0.02 元 / 千 tokens 下降到 0.0005 元 / 千 tokens,减幅达 97%;字节跳动在 12 月 18 每天宣布豆包视觉理解模型每千个 tokens 输入价格是 0.003 元,也就是用户费用 1 元钱可处理 284 张 720P(像素)照片,比行业平均水平便宜 85%,进一步降低企业使用多模态大模型的成本。
伴随着行业的快速发展,AI 大型马太效应已经逐渐显现。大型模型的稳定发展需要企业不断投入资金等各方资源,不断开发更强大的大型模型,保持领先优势,达到足够规模的终端用户进行商业实现。所以,尽管以前很多企业都参与过大型互联网业务,但是只有少数大型互联网。 / 技术型企业(如百度、阿里、腾讯、字节跳动等),以及融资能力强的企业。 AI 创业公司(如智谱、月亮暗面、MiniMax 等等,至今仍是大型市场的活跃参与者。为实现商业价值,AI 大型模型也在逐步向广大用户和开发者迈进,通过各种服务获得收益。将来,AI 各行各业大模型的实用价值将进一步显现。
03 AI 大型投融动态模型
就融资而言,2024 年至今,AI 大型融资金额在10亿元以上的事件已经发生。 10 起步,融资总额超过 820 亿元。AI 大模型仍然是市场关注的焦点,但由于整体一级市场的受欢迎程度降低,投资机构更加谨慎,技术水平和品牌影响力强的公司获得了更多的融资,呈现出一定的头部效应。例如,智谱在 12 月完成了 30 融资亿元,此前其在 9 月份还完成了数十亿元的融资;百川智能 7 月也完成了 50 融资亿元。
参与投资机构方面, AI 大型机构包括君联资本、红杉中国、达晨财智等知名专业投资机构。与此同时,国有资产机构也加强了对 AI 北京国管参与爱诗科技、面壁智能融资等大型领域的支持,北京中关村科学城参与智谱融资等。另外,因特网巨头也深度参与其中,如阿里巴巴、腾讯投资智谱、百川智能、月亮暗面等。由此可见,市场对这一关键技术领域的发展给予了更多的关注和支持,许多投资者的参与也将为 AI 大型领域带来了更丰富的资源,进一步推动 AI 大型技术创新与产业生态的完善。
图表 3:2024 年全球 AI 大型跑道10亿元以上投融事件。
信息来源:RimeData 来觅数据
本文的内容是基于寻找可靠的公开数据或实地调查数据。我们力求本文内容的客观性和公正性,但不保证或隐含本文中提到的信息、观点和数据的真实性、可靠性、时效性和完整性,也不承担相关法律责任。受研究方法和数据获取资源的限制,本报告的所有内容仅供参考,对任何人的投资、商业决策、法律等操作都不构成任何建议。任何时候,对于因参考本报告而产生的任何影响和后果,寻找数据都不承担任何责任。
2024 投融市场报告第三季度报告
本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。
免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com




