一口气看完OpenAI前四天的内容。
OpenAI发布了12天的成长“Shipmas”。
Shipmas,是「ship」和「Christmas」搭配。简而言之,在特殊时期,推出了许多产品更新,不仅给用户带来惊喜,而且像庆祝节日一样。
刚开始发布的时候,我也跟朋友说,国内的大模型公司都在召开发布会,应该和Open谈谈。 Ai取经。
冬天这么冷,去现场听演讲,结果内容不多。大家都在台下,有的看手机,有的只是打卡。说实话,花了这么多钱,最后只换了几篇报道和几个朋友圈,对客户和沟通的影响非常有限。
OpenAI的做法有些不同。
她们只需要一间小黑屋,一张桌子,两台电脑,四个人,就可以完成一切。 虽然更新速度有点像挤牙膏,但是这样可以让顾客和顾客清楚地知道他们在做什么。
有些人认为这种渐进式发布会缺乏吸引力,但事实上,它给了客户和关注者更深入地了解背后的模型和技术理念,同时传播信息。
比如说:
关于技术微调的细节。假如在各种新闻发布会上简单提到,也许两三句就带过来了,大家都不会有深刻的印象。
但是,如果我们单独用一天的时间进行深入的讲解,我们可以展示更多的例子和演示,让技术人员和客户更直观地了解这些技术细节,从而实现更现实、更深刻的理解。
所以,这种方法非常适合经济实用的企业尝试。 新闻发布会已经进行到第四天了,我连续熬了三个大夜。假如你错过了前几天的内容,我来帮你补上。
在活动的第一天,OpenAI推出了o1完整版和o1。 pro模式。
o1模型完整版是什么?
目前的版本已经在之前的o1预览版本中得到了全面的改进。现在不仅可以处理文本,还可以处理截图、照片、网页、上传文档等。功能更强大。
而且,它还采用了新的推理方法。就像人的思维方式一样,o1模型的完整版本会一步一步推理出来,这样在回答专业问题的时候会更准确。
与预览版相比,这个版本的o1模型思维问题更简单,速度提高了50%,在回答问题时,出错的概率也降低了34%。
身为个人博主,我当然无法检测到这些信息,但是我可以告诉你官方的例子。
在新闻发布会上,o1模型负责人画了一幅草图。该草图是为了收集太阳能,供应给太空数据中心而设计的。
因为太空中不能使用水冷系统,所以必须依靠一个巨大的散热器来排出热量;研究人员问o1模型,如果要给数据中心提供1吉瓦的电力,GPU正常运行需要多大区域的散热器?
通过分析和运算,o1模型对草图进行了准确的识别,得出结论:需要242万平方米的散热器来满足排热要求。

别的不说,至少从演示的角度来看,确实很厉害。
然而,强大就是强大,大家之前说的那个。「有点贵」这个版本,第一天就出现了,他们推出了ChatGPT。 Pro。
这项服务每月需要200美元,可以随意使用他们最先进的模型和工具,包括OpenAIo1。、o1-mini、GPT-Advanced4o和 Voice,对于需要解决特别复杂计算问题的人来说,主要是准备的。
在我看来,这种服务可能更适合需要进行高级数据分析和处理的研究人员、工程师和其他专业人员,可以帮助他们提高工作效率,跟上人工智能的最新技术。
有些专家测试说o1 在处理复杂的数据科学、编程和案例分析问题时,pro方法确实可以给出比以前模型更准确的答案;在数学、科学和编程领域的机器学习测试中,o1 pro模式的性能优于o1和o1-preview模型。
但是,他们会花200美元来使用这个吗? 我不知道。 当时, 我还在朋友圈开玩笑说,如果预算这么多,不如用集合工具Monica,一个月不到20块钱,可以用十几个模型。不是更划算吗?
open的第二天 什么是AI推出的?
总结一句话: 引入强化微调能力(Reinforcement Fine-Tuning)。 强化微调是什么意思?简而言之:给AI模型一个“专业培训内容”。
通过强化微调,我们可以用几个实际案例(比如几十个例子)来教这个AI模型成为一个领域的专家。
在直播中,四个人在场,唯一的中国女研究员Julie Wang介绍了这一能力。他说,这种能力可以使小型模型“从高中水平跳到专家水平”。
在实践阶段,他们举了两个例子。
一种是与汤森路透社合作,为法律专业人士打造的AI模型。在许多行业中,尽管专家有着深厚的理论知识和丰富的经验,但是在处理了大量的数据和复杂的任务之后,由于时间和精力的限制,他们认为。
比如:在法律领域,律师要处理很多法律规定和案例。
他们可以用专业知识进行分析,但如果使用加强微调的AI模型,可以更快地找到相关案例,匹配初步的法律规定,为律师提供决策参考,提高工作效率。

但是这个例子是一个展示,似乎没有什么感染力。 另外一个例子是, 实验生物医学任务 。
Justinninn伯克利大学罕见遗传病研究员 Reese,通过API将大量临床病例数据输入到o1 在mini模型中。
这些数据包括患者的相关信息和疾病描述。例如,一名51岁的女性有眼距过宽、眼睑开裂狭窄、软腭咽闭合不全、甲状旁腺功能减退、全身发育迟缓、精神听力障碍等症状。
随后,加强微调技术训练o1 Mini模型的医疗诊断任务。 在训练过程中,模型要根据疾病的描述找出可能的基因,并且排序。
评分模型会对答案进行评分,分数从0到1不等。0表示模型导出中没有正确答案,1表示正确答案处于输出的第一位。通过性能监控,可以看到模型指标在微调过程中的变化。
结果表明,加强微调的o1 在特定任务中,mini模型的性能超过了更强大的o1模型,在top@1、top@以及top@max这些指标,o1 mini模型显然超过了o1模型。
在OpenAI官网上可以看到这个案例。 然而,两种能力都是「期货」,明年才正式推出,主要针对潜在用户,如公司或科研机构。
永远不要低估微调技术,说实话,现在的大型语言模型(LLM)还没有做到复杂的创造性活动,比如:批判性思维和深度头脑风暴。
那既是坏事,也是好事, 正因为如此,我们可以在琐碎、重复、无聊、不需要创造性的任务中使用模型,这样他们就可以慢慢提高自己的准确性。
那就是,第二天的内容,总结一个词:微调技术。
Open sora是AI第三天推出的。 鸽子期货来了一年多,但是因为之前连续熬夜,12:30睡不着。第二天醒来想试试Sora,但是登录的时候发现暂时不能用,因为用户太多了。
没关系,我看了Sora的新闻发布会。
OpenAI团队在会上展示了这个工具的实力,教你如何使用它。他们教我们如何生成视频,包括设置分镜、输入视频指令、选择风格、画面比例、时间等等。通过演示,每个人都对Sora有了更深的了解。
使用Sora的过程相当灵活,您可以使用分镜功能看到不同角度的图片,然后输入您想要的视频。OpenAI说:指令越简单,Sora自己玩得越多;指令越详细,它就越听你的。

在直播间,Sora将两个不相连的视频短片合成了一个有故事感的视频。虽然细节有些不一样,但整体效果真的很惊人。
Sora还可以让你上传照片或者视频,然后生成后续视频的文字描述。你可以随意更改指令,在时间线上调整,决定视频什么时候播放。这个功能相当有创意。
此外,在生成视频之后,还可以使用remix工具进行更改。
这个工具看起来很流畅,可以改编视频的各种创意。怎么改?可以调整强度,从1级到8级,想改变多少就改变多少。
还有一个预设选项,比如柔软、适中或者强烈。有了这个工具,你可以保留视频中想要的部分,其他的可以随心所欲地改变,比如用机器人代替猛犸象,或者改变人物的表情等等。
在我看来,Sora不仅仅是一个视频工具,它将视频生成与工作流程相结合,这对于OpenAI来说非常重要;因为Sam 在直播中,Altman表示,他们希望AI理解视频,改变我们使用计算机的方式。
要做到这一点,在通往AGI的道路上,必须做很多改进,而将工作流与视频生成相结合,是一个很好的方法。
不过,Sora看起来不错,但是价格有点高。举例来说:
如果选择Plus会员,一个月要花20块钱,最多可以做50个视频。视频质量一般,最高可达720p,每个视频最长可达5秒。
如果你想要更好的,你必须选择Pro会员,每月获得200美元,最高清晰度可以达到1080p,每个视频可以产生20秒,而Sora还没有在欧盟、瑞士和英国推出。
第三天就是关于Sora的内容,感慨又期待,你会付钱吗?
在OpenAI直播的第四天,他们的首席产品官Kevin Weil主持人。重点是什么?也就是说,Canvas正式上线。
在此之前,Canvas的一些功能已经在ChatGPT中显示出来,但是在那个时候,它是一个独立的模型。现在,它已经和其他模型结合在一起了。
那Canvas这次和以前有什么不同呢?有三种:
现在可以直接了 从首页的输入框跳转到Canvas ; 第二,整合了一个网络。 Python模拟器,Assembly, 可以直接运行Python代码,也可以在线修复bug ; 第三,Canvas功能 整合到GPTs中。
OpenAI的工程师Lee和Alexey也做了现场演示,以便让大家更清楚地看到Canvas的新功能。Lee教我们如何用Canvas写一个儿童圣诞故事。
在ChatGPT的输入框中,您可以通过点击新的工具按钮转换到Canvas。无论是更改标题、添加表情,还是调整文章的长度和阅读难度,你都可以和ChatGPT一起编辑文档。
就像百度的自由画板一样,用户和ChatGPT可以一起创作,写作和修改的过程非常自然。

在新闻发布会上,Alexey还展示了Canvas如何帮助我们改变文章。 在ChatGPT上贴了一篇关于“圣诞老人、暗能量和驯鹿推动力”的物理论文,然后用Canvas打开。
ChatGPT不仅可以给出专业的修改建议,还可以直接在文章中添加评论,方便用户查看和修改。用户可以根据自己的想法修改文章,并且可以随时复制最终版本。
Alexey还展示了如何通过Canvas调整Python代码和生成图表。 一个WebAssembly在Canvas内置 Python模拟器可以快速输入大多数Python库,运行代码,并且可以立即反馈,这真的有助于提高编程效率。
另外,Canvas的功能也融入到GPTs中。举例来说:
为了帮助圣诞老人回复孩子们的信件,Lee创建了一个名为“圣诞老人助手”的GPT。
只需在定制GPT的解释中加入“使用Canvas工具”的指令,然后检查Canvas功能,定制GPT就可以在Canvas中自动生成信函稿,圣诞老人可以根据实际情况修改稿件,用自己的风格和语气回复孩子。
以前我一直在使用Canvas,还想要,国内厂商什么时候也可以引入Canvas这样的功能。 在我看来,Canvas(画板)是大家一起工作更聪明的关键一步。
因为无论是自己用还是大家一起用,总有三个人一起做事的地方。在此之前,可能会使用类似在线文档的工具来实现共同编辑的动作。之后,画板可能是首选合作之一。
关于Canvas,这是今天发布会的内容。
好了,总结一下下面四天的内容,分别是:推出完整版o1和o1。 pro、推出增强微调能力,推出新产品sora、并对Canvas进行全新升级。
在接下来的八天里,还有哪些新产品?值得期待。
本文来自微信微信官方账号 “王智远”(ID:作者:王智远,36氪经授权发布,Z201440)。
本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。
免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com




