一口气看完OpenAI前四天的内容。

2024-12-12

OpenAI发布了12天的成长“Shipmas”。

Shipmas，是「ship」和「Christmas」搭配。简而言之，在特殊时期，推出了许多产品更新，不仅给用户带来惊喜，而且像庆祝节日一样。

刚开始发布的时候，我也跟朋友说，国内的大模型公司都在召开发布会，应该和Open谈谈。 Ai取经。

冬天这么冷，去现场听演讲，结果内容不多。大家都在台下，有的看手机，有的只是打卡。说实话，花了这么多钱，最后只换了几篇报道和几个朋友圈，对客户和沟通的影响非常有限。

OpenAI的做法有些不同。

她们只需要一间小黑屋，一张桌子，两台电脑，四个人，就可以完成一切。 虽然更新速度有点像挤牙膏，但是这样可以让顾客和顾客清楚地知道他们在做什么。

有些人认为这种渐进式发布会缺乏吸引力，但事实上，它给了客户和关注者更深入地了解背后的模型和技术理念，同时传播信息。

比如说：

关于技术微调的细节。假如在各种新闻发布会上简单提到，也许两三句就带过来了，大家都不会有深刻的印象。

但是，如果我们单独用一天的时间进行深入的讲解，我们可以展示更多的例子和演示，让技术人员和客户更直观地了解这些技术细节，从而实现更现实、更深刻的理解。

所以，这种方法非常适合经济实用的企业尝试。 新闻发布会已经进行到第四天了，我连续熬了三个大夜。假如你错过了前几天的内容，我来帮你补上。

在活动的第一天，OpenAI推出了o1完整版和o1。 pro模式。

o1模型完整版是什么？

目前的版本已经在之前的o1预览版本中得到了全面的改进。现在不仅可以处理文本，还可以处理截图、照片、网页、上传文档等。功能更强大。

而且，它还采用了新的推理方法。就像人的思维方式一样，o1模型的完整版本会一步一步推理出来，这样在回答专业问题的时候会更准确。

与预览版相比，这个版本的o1模型思维问题更简单，速度提高了50%，在回答问题时，出错的概率也降低了34%。

身为个人博主，我当然无法检测到这些信息，但是我可以告诉你官方的例子。

在新闻发布会上，o1模型负责人画了一幅草图。该草图是为了收集太阳能，供应给太空数据中心而设计的。

因为太空中不能使用水冷系统，所以必须依靠一个巨大的散热器来排出热量；研究人员问o1模型，如果要给数据中心提供1吉瓦的电力，GPU正常运行需要多大区域的散热器？

通过分析和运算，o1模型对草图进行了准确的识别，得出结论：需要242万平方米的散热器来满足排热要求。

别的不说，至少从演示的角度来看，确实很厉害。

然而，强大就是强大，大家之前说的那个。「有点贵」这个版本，第一天就出现了，他们推出了ChatGPT。 Pro。

这项服务每月需要200美元，可以随意使用他们最先进的模型和工具，包括OpenAIo1。、o1-mini、GPT-Advanced4o和 Voice，对于需要解决特别复杂计算问题的人来说，主要是准备的。

在我看来，这种服务可能更适合需要进行高级数据分析和处理的研究人员、工程师和其他专业人员，可以帮助他们提高工作效率，跟上人工智能的最新技术。

有些专家测试说o1 在处理复杂的数据科学、编程和案例分析问题时，pro方法确实可以给出比以前模型更准确的答案；在数学、科学和编程领域的机器学习测试中，o1 pro模式的性能优于o1和o1-preview模型。

但是，他们会花200美元来使用这个吗？ 我不知道。当时，我还在朋友圈开玩笑说，如果预算这么多，不如用集合工具Monica，一个月不到20块钱，可以用十几个模型。不是更划算吗？

open的第二天什么是AI推出的？

总结一句话： 引入强化微调能力（Reinforcement Fine-Tuning）。 强化微调是什么意思？简而言之：给AI模型一个“专业培训内容”。

通过强化微调，我们可以用几个实际案例(比如几十个例子)来教这个AI模型成为一个领域的专家。

在直播中，四个人在场，唯一的中国女研究员Julie Wang介绍了这一能力。他说，这种能力可以使小型模型“从高中水平跳到专家水平”。

在实践阶段，他们举了两个例子。

一种是与汤森路透社合作，为法律专业人士打造的AI模型。在许多行业中，尽管专家有着深厚的理论知识和丰富的经验，但是在处理了大量的数据和复杂的任务之后，由于时间和精力的限制，他们认为。

比如：在法律领域，律师要处理很多法律规定和案例。

他们可以用专业知识进行分析，但如果使用加强微调的AI模型，可以更快地找到相关案例，匹配初步的法律规定，为律师提供决策参考，提高工作效率。

但是这个例子是一个展示，似乎没有什么感染力。 另外一个例子是， 实验生物医学任务 。

Justinninn伯克利大学罕见遗传病研究员 Reese，通过API将大量临床病例数据输入到o1 在mini模型中。

这些数据包括患者的相关信息和疾病描述。例如，一名51岁的女性有眼距过宽、眼睑开裂狭窄、软腭咽闭合不全、甲状旁腺功能减退、全身发育迟缓、精神听力障碍等症状。

随后，加强微调技术训练o1 Mini模型的医疗诊断任务。 在训练过程中，模型要根据疾病的描述找出可能的基因，并且排序。

评分模型会对答案进行评分，分数从0到1不等。0表示模型导出中没有正确答案，1表示正确答案处于输出的第一位。通过性能监控，可以看到模型指标在微调过程中的变化。

结果表明，加强微调的o1 在特定任务中，mini模型的性能超过了更强大的o1模型，在top@1、top@以及top@max这些指标，o1 mini模型显然超过了o1模型。

在OpenAI官网上可以看到这个案例。 然而，两种能力都是「期货」，明年才正式推出，主要针对潜在用户，如公司或科研机构。

永远不要低估微调技术，说实话，现在的大型语言模型（LLM）还没有做到复杂的创造性活动，比如：批判性思维和深度头脑风暴。

那既是坏事，也是好事， 正因为如此，我们可以在琐碎、重复、无聊、不需要创造性的任务中使用模型，这样他们就可以慢慢提高自己的准确性。

那就是，第二天的内容，总结一个词：微调技术。

Open sora是AI第三天推出的。 鸽子期货来了一年多，但是因为之前连续熬夜，12:30睡不着。第二天醒来想试试Sora，但是登录的时候发现暂时不能用，因为用户太多了。

没关系，我看了Sora的新闻发布会。

OpenAI团队在会上展示了这个工具的实力，教你如何使用它。他们教我们如何生成视频，包括设置分镜、输入视频指令、选择风格、画面比例、时间等等。通过演示，每个人都对Sora有了更深的了解。

使用Sora的过程相当灵活，您可以使用分镜功能看到不同角度的图片，然后输入您想要的视频。OpenAI说：指令越简单，Sora自己玩得越多；指令越详细，它就越听你的。

在直播间，Sora将两个不相连的视频短片合成了一个有故事感的视频。虽然细节有些不一样，但整体效果真的很惊人。

Sora还可以让你上传照片或者视频，然后生成后续视频的文字描述。你可以随意更改指令，在时间线上调整，决定视频什么时候播放。这个功能相当有创意。

此外，在生成视频之后，还可以使用remix工具进行更改。

这个工具看起来很流畅，可以改编视频的各种创意。怎么改？可以调整强度，从1级到8级，想改变多少就改变多少。

还有一个预设选项，比如柔软、适中或者强烈。有了这个工具，你可以保留视频中想要的部分，其他的可以随心所欲地改变，比如用机器人代替猛犸象，或者改变人物的表情等等。

在我看来，Sora不仅仅是一个视频工具，它将视频生成与工作流程相结合，这对于OpenAI来说非常重要；因为Sam 在直播中，Altman表示，他们希望AI理解视频，改变我们使用计算机的方式。

要做到这一点，在通往AGI的道路上，必须做很多改进，而将工作流与视频生成相结合，是一个很好的方法。

不过，Sora看起来不错，但是价格有点高。举例来说：

如果选择Plus会员，一个月要花20块钱，最多可以做50个视频。视频质量一般，最高可达720p，每个视频最长可达5秒。

如果你想要更好的，你必须选择Pro会员，每月获得200美元，最高清晰度可以达到1080p，每个视频可以产生20秒，而Sora还没有在欧盟、瑞士和英国推出。

第三天就是关于Sora的内容，感慨又期待，你会付钱吗？

在OpenAI直播的第四天，他们的首席产品官Kevin Weil主持人。重点是什么？也就是说，Canvas正式上线。

在此之前，Canvas的一些功能已经在ChatGPT中显示出来，但是在那个时候，它是一个独立的模型。现在，它已经和其他模型结合在一起了。

那Canvas这次和以前有什么不同呢？有三种：

现在可以直接了 从首页的输入框跳转到Canvas ；第二，整合了一个网络。 Python模拟器，Assembly， 可以直接运行Python代码，也可以在线修复bug ；第三，Canvas功能 整合到GPTs中。

OpenAI的工程师Lee和Alexey也做了现场演示，以便让大家更清楚地看到Canvas的新功能。Lee教我们如何用Canvas写一个儿童圣诞故事。

在ChatGPT的输入框中，您可以通过点击新的工具按钮转换到Canvas。无论是更改标题、添加表情，还是调整文章的长度和阅读难度，你都可以和ChatGPT一起编辑文档。

就像百度的自由画板一样，用户和ChatGPT可以一起创作，写作和修改的过程非常自然。

在新闻发布会上，Alexey还展示了Canvas如何帮助我们改变文章。 在ChatGPT上贴了一篇关于“圣诞老人、暗能量和驯鹿推动力”的物理论文，然后用Canvas打开。

ChatGPT不仅可以给出专业的修改建议，还可以直接在文章中添加评论，方便用户查看和修改。用户可以根据自己的想法修改文章，并且可以随时复制最终版本。

Alexey还展示了如何通过Canvas调整Python代码和生成图表。 一个WebAssembly在Canvas内置 Python模拟器可以快速输入大多数Python库，运行代码，并且可以立即反馈，这真的有助于提高编程效率。

另外，Canvas的功能也融入到GPTs中。举例来说：

为了帮助圣诞老人回复孩子们的信件，Lee创建了一个名为“圣诞老人助手”的GPT。

只需在定制GPT的解释中加入“使用Canvas工具”的指令，然后检查Canvas功能，定制GPT就可以在Canvas中自动生成信函稿，圣诞老人可以根据实际情况修改稿件，用自己的风格和语气回复孩子。

以前我一直在使用Canvas，还想要，国内厂商什么时候也可以引入Canvas这样的功能。 在我看来，Canvas(画板)是大家一起工作更聪明的关键一步。

因为无论是自己用还是大家一起用，总有三个人一起做事的地方。在此之前，可能会使用类似在线文档的工具来实现共同编辑的动作。之后，画板可能是首选合作之一。

关于Canvas，这是今天发布会的内容。

好了，总结一下下面四天的内容，分别是：推出完整版o1和o1。 pro、推出增强微调能力，推出新产品sora、并对Canvas进行全新升级。

在接下来的八天里，还有哪些新产品？值得期待。

本文来自微信微信官方账号 “王智远”（ID：作者：王智远，36氪经授权发布，Z201440)。

本文仅代表作者观点，版权归原创者所有，如需转载请在文中注明来源及作者名字。

免责声明：本文系转载编辑文章，仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布，请及时与我们联系进行审核处理或删除，您可以发送材料至邮箱：service@tojoy.com

延伸阅读

从五菱调任名爵，周邈能否重塑“神车”？

在过去的两年里，资本更加关注阿里系AI创业者的背景是什么？

工作场所，千万不要做一个思维混乱的人。

近20个月的准备工作，雅运股份重组计划破产

这波楼市升温被“以质争量”改善，“以价取胜”刚需支撑。

项目推荐

梯影传媒

AI云印侠

宾果智能