OpenAI 12天直播活动Shipmas圆满结束,科技圈热议产品更新与节日惊喜

   日期:2024-12-23     来源:网络整理    作者:二手钢材网    浏览:222    评论:0    
核心提示:科技圈博主和KOL们终于可以松一口气,对于Sam团队而言,这场马拉松式的直播无疑是一次巨大挑战,估计他们累得够呛。如果你错过了前几天的内容,我来帮你补上。Weil在直播里说,现在可以把熟悉的ChatGPT功能都整合到项目里,或者,只单独使用项目功能。

科技博主和 KOL 终于可以松一口气了。对于山姆的团队来说,这场马拉松直播无疑是一个巨大的挑战,他们恐怕已经精疲力尽了。

为期12天的活动被命名为“”。

,是“船”和“”的组合。简单来说,特殊时期推出很多产品更新,不仅给用户带来惊喜,而且有种庆祝节日的感觉。

刚推出的时候,我在开发布会的时候就跟朋友们说,我们应该向Open AI学习。

冬天这么冷。我去听了讲座,但讲的不多。台下的人有的在玩手机,有的只是过来打卡的。说实话,花了那么多钱,最后只得到了几条报道。而几个朋友圈,对客户和宣传的效果非常有限。

方法有些不同。

他们所需要的只是一个小暗室、一张桌子、两台电脑和四个人来完成所有事情。虽然更新速度有点像挤牙膏,但这让关注其产品的客户和用户清楚地知道自己在做什么。

有人觉得这种渐进式的推出没有吸引力,但事实上,它在传播信息的同时,让关注的人有机会更深入地了解其背后的模型和技术概念。

例如:

有关微调技术的详细信息。如果在大型发布会上简单提及,可能三言两语就涵盖了,大家印象并不深刻。

但如果单独花一天的时间来深入讲解,就可以展示更多的例子和演示,让技术人员和用户更直观地理解这些技术细节,从而达到更实际、更深刻的理解。

因此,这种方法适合尝试。发布会已经进入第四天了,我连续熬了三个晚上。如果你错过了这几天的内容,让我来补给你。

活动首日,推出o1完整版和o1专业版。

o1模型的完整版是什么?

该版本较之前的o1预览版进行了全面改进。现在它不仅可以处理文本,还可以处理屏幕截图、照片、网页、上传的文件等,使其更加强大。

此外,它使用了新的推理方式。就像人们思考的方式一样,完整版的o1模型会一步步推理,这样在回答专业问题时能够更加准确。

与预览版相比,该版本的o1模型思维更加简洁,速度提高了50%,回答困难问题时出错的可能性降低了34%。

作为个人博主,我肯定无法测试这些数据,但我可以告诉你官方的例子。

发布会上,o1模型负责人画了一张草图。该草图是关于收集太阳能并将其提供给空间数据中心的系统。

由于在太空中无法用水来冷却系统,因此必须依靠巨大的散热器来散热。研究人员询问o1模型,如果要给数据中心提供1吉瓦的功率,需要多大的散热器才能保证GPU的正常运行?

o1模型准确识别草图,经过分析计算,得出需要242万平方米的散热器才能满足散热需求。

马拉松直播平台有哪些_马拉松现场直播视频在哪里有_

如果不出意外的话,至少从演示来看,确实是非常强大的。

然而,尽管功能强大,但之前大家提到的“有点贵”的版本在第一天就出现了,他们推出了Pro。

这项服务的费用为每月 200 美元。您可以随意使用他们最先进的模型和工具,包括o1、o1-mini、GPT-4o和Voice。它主要是为需要解决特别复杂的计算问题的人准备的。

我认为这种服务可能更适合研究人员、工程师和其他需要从事高级数据分析和处理的专业人士。它可以帮助他们提高工作效率,让他们跟上人工智能的最新技术。

专家测试表明,在处理复杂的数据科学、编程和案例分析问题时,o1 pro模型确实能够比之前的模型给出更准确的答案;在数学、科学和编程领域的机器学习测试中,o1 pro 模式的表现优于 o1 和 o1- 模型。

马拉松直播平台有哪些__马拉松现场直播视频在哪里有

但他们会花 200 美元来使用这个吗?我不知道。当时我什至在朋友圈开玩笑说,这么大的预算,还不如用一个采集工具,一个月不到20美元,可以用十几个型号。难道不是更划算吗?

open AI 第二天推出了什么?

一言以蔽之:引入增强的微调能力(Fine-)。什么是增强微调?简单来说:给AI模型上一堂“专业培训课”。

通过密集的微调,这个AI模型可以在实际案例很少(例如:几十个例子)的情况下被教导成为某个领域的专家。

直播时有四人在场,唯一的华人女研究员Julie Wang介绍了这个能力。她说,这种能力可以让小型模型“从高中水平跃升至专家水平”。

在实践环节中,他们举了两个例子。

其中之一是与汤森路透合作为法律专业人士构建的人工智能模型。他们觉得,在很多行业,专家虽然拥有深厚的专业知识和丰富的经验,但在处理大量数据和复杂任务时可能会受到时间和精力的限制。

例如:在法律领域,律师必须处理许多法律条款和案件。

他们可以用专业知识进行分析,但如果使用增强和微调的人工智能模型,可以更快地找到相关案例,进行法律条文的初步匹配,为律师提供决策参考,提高工作效率。

马拉松直播平台有哪些_马拉松现场直播视频在哪里有_

但这个例子只是演示,似乎缺乏说服力。另一个例子是生物医学任务的实验。

伯克利大学罕见遗传病研究员Reese通过API将大量临床病例数据输入到o1 mini模型中。

该数据包括患者基本信息和症状描述。例如:一名51岁女性,患有眼距过远、睑裂狭窄、软腭和咽部功能不全、甲状旁腺功能低下、全身发育迟缓和感音神经性听力障碍等症状。

然后,利用增强的微调技术训练o1 mini模型来执行医疗诊断任务。在训练过程中,模型必须根据症状描述找到可能的基因并对它们进行排序。

评分模型会对答案进行评分,评分范围为0到1。0表示模型输出中没有正确答案,1表示正确答案位于输出的第一个位置。通过性能监控,可以看到微调过程中模型指标的变化。

结果表明,增强和微调的 o1 mini 模型在特定任务上优于更强大的 o1 模型。在top@1、top@5和top@max方面,o1 mini模型显着超过了o1模型。

这个案例可以在官网看到。不过,这两项能力都是“未来”,要到明年才会正式推出,主要面向企业或科研机构等潜在客户。

不要低估微调技术。老实说,大型语言模型(LLM)尚不具备复杂的创造性活动的能力,例如批判性思维和深度头脑风暴。

这既是一件坏事,也是一件好事,因为这样我们就可以将模型用于那些琐碎、重复、无聊、不需要创造力的任务上,并且在这样做的过程中,它们可以慢慢提高其准确性。

这就是第二天的内容,概括起来就是一个字:微调技术。

Open AI 在第三天推出了 sora。一年多的鸽子期货都在这里了。不过因为熬了一夜,实在是坚持不住了,所以12点30分就睡觉了。第二天醒来,想试试Sora,但是登录后发现暂时无法使用,因为用户太多。

没关系,我看了Sora的新闻发布会。

团队在会议上展示了这个工具的强大功能,并教大家如何使用;他们教我们如何生成视频,包括设置故事板、输入视频命令、选择风格、长宽比、时长等。通过演示,大家可以对Sora有更深入的了解。

Sora的使用过程相当灵活。您可以使用故事板功能从不同角度查看图像,然后输入您想要的视频效果。曰:教导愈简单,空愈能发挥;指令越详细,它就越会听你的。

马拉松现场直播视频在哪里有__马拉松直播平台有哪些

在直播过程中,空将两个不连贯的视频片段组合成一个讲故事的视频。虽然细节上有些许不同,但整体效果确实令人惊喜。

Sora 还允许您上传图像或视频,然后为后续视频生成文本描述。您可以随意更改说明,调整时间轴,并决定何时播放视频。这个功能还是蛮有创意的。

还有一点是,视频生成后,还可以使用remix工具进行修改。

马拉松现场直播视频在哪里有__马拉松直播平台有哪些

该工具看起来如丝般光滑,可用于为您的视频创建各种创意改编。如何改变呢?您可以根据需要调整强度,从 1 级到 8 级。

还有预设选项,例如:轻度、中度或强。使用这个工具,您可以保留视频中您想要的部分,并根据需要更改其余部分,例如将猛犸象更改为机器人,或者更改角色的表情等。

我认为Sora不仅仅是一个视频工具,它结合了视频生成和工作流程,这一点非常重要;因为Sam在直播中表示,他们希望AI能够理解视频,改变我们使用计算机的方式。

要实现这一点,在AGI的道路上必须做大量的优化,而将工作流和视频生成结合起来就是一个很好的方法。

不过Sora看起来不错,但是价格有点高。例如:

如果选择Plus会员,每月要花费20美元,最多可以制作50个视频。视频质量一般,最高720p,每个视频的最大长度为5秒。

如果想要更好的话,就得选择Pro会员,每月200美元。最高分辨率可以达到1080p,每个视频只能生成20秒,而且Sora尚未在欧盟、瑞士和英国推出。

这是第三天关于Sora的内容。我感叹又期待。你会付钱吗?

今天,直播进入第四天,由他们的首席产品官 Kevin Weil 主持。有什么意义?即:正式启动。

此前,一些功能已经被展示过,但当时它是一个单独的模型。现在它已与其他模型集成。

那么,这次和之前有什么不同呢?有以下三种:

首先,现在可以直接从首页的输入框跳转;其次,集成了Web模拟器,可以直接运行代码并在线修复bug;第三,该功能集成到GPT中。

为了让大家更清楚地看到新功能,我和Lee工程师还进行了现场演示。李教我们如何写儿童圣诞故事。

在输入框中,点击新添加的工具按钮即可切换到该工具。您可以一起编辑文档。无论是更改标题、添加表情符号,还是调整文章的长度和阅读难度,都非常简单。

这就像百度的免费画布。用户和用户可以一起创作,编写和修改的过程非常自然。

马拉松直播平台有哪些__马拉松现场直播视频在哪里有

发布会上,他们还展示了如何帮助我们修改文章。他发表了一篇关于“圣诞老人、暗能量和驯鹿推进力”的物理论文,并以 开头。

不仅可以给出专业的修改建议,还可以直接在文章中添加评论,方便用户轻松查看和修改。用户可以根据自己的想法修改文章,如果愿意也可以随时复制最终版本。

它还演示了如何使用调试代码和生成图表。有一个内置的模拟器,可以快速加载几乎所有的库,运行代码,并提供即时反馈,这对提高编程效率确实有帮助。

此外,其功能也被集成到GPT中。例如:

Lee创建了一个名为“圣诞老人助手”的GPT来帮助圣诞老人回复孩子们的信件。

只要在自定义GPT的描述中添加“使用工具”指令,然后勾选该功能,自定义GPT就会自动生成信件的草稿。圣诞老人可以根据实际情况修改草稿,用自己的风格和语气回复孩子。他们。

我之前也一直在使用,也想过国内厂商什么时候能推出这样的功能。我觉得()是让每个人更聪明地一起工作的关键一步。

因为无论是自己用还是大家一起用,都必须有一个可以三个人一起做事的地方。过去,可能会使用类似于在线文档的工具来实现联合编辑。未来,可能是协作的首选之一。

这就是今天会议的主题。

好了,我们总结一下这四天的内容,分别是:推出o1和o1 pro完整版、推出增强微调功能、推出新产品sora、进行全新升级。

第五天:

Sam 说:嗨,欢迎来到我们“12 天”系列的第五天。今天我想介绍一些使其更易于使用的新功能。

马拉松现场直播视频在哪里有_马拉松直播平台有哪些_

我们苹果的朋友正在努力将其集成到iPad的iOS系统和macOS系统中;我们的目标是使其在各种平台上都能轻松流畅地使用。

我们都喜欢 Apple 设备,因此我们对这种集成感到非常自豪,因此您无需登录即可使用它,但如果您有帐户,体验会更好。

接下来,正式开始。 Dave 和他的工程团队伙伴花了半个小时演示了所有功能。

简单来说,核心内容有五个:第一,苹果将其整合到iPad的iOS系统和macOS系统中,让用户更方便地使用这些设备。

其次,当Siri认为自己可以更好地解决问题时,可以直接将请求移交。第三,苹果的书写工具现在可以帮助用户从头开始起草文档。

第四,在16上,用户可以通过相机控制功能调动视觉智能,并用它来了解自己在镜头中看到的东西。

第五,Siri可以直接询问有关预览状态下调用文档的能力的问题。用户可以选择是否仅共享当前屏幕截图或文档的全部内容。

这就是第五天的内容,一句话概括:苹果宣布将整合到iOS和macOS系统中,用户可以直接通过Siri访问,即使没有账户。

第六天,你说什么?

首先发布了两项新功能:高级视频对话和屏幕共享。用户现在可以实时共享他们的屏幕。

其次,新增了圣诞老人语音模式。只要用户打开语音模式,然后说“”,就可以激活该模式。

在案例展示环节,团队展示了水壶和滴头的实时视频。在团队的指导下,他们一步一步完成了咖啡的制作;给出了一些分步提示,例如:

将滤纸放入滴头中,将咖啡粉加入过滤器中,缓慢倒入热水,以打圈的方式等。

该团队还宣布这些新功能将支持最新的移动应用程序、桌面应用程序、Web 平台和 Teams 集成。他们计划明年初向企业和教育用户开放这些功能。

因此,第六天的重点是推出先进的视频对话和屏幕共享功能,以及全新的圣诞老人语音模式。这些更新主要展示了多模态交互能力。

不知道第七天的内容算不算杀招:上线。

什么是?

简单来说,它是一个可以集成所有功能的工具,或者只使用它而不使用其他功能。

会议由首席产品官 Kevin Weil 和他的两位同事 Drew 和 主持。 Kevin Weil在直播中表示,现在你可以将所有熟悉的功能集成到项目中,或者只单独使用项目功能。

补充一下,就像智能​​文件夹一样,该功能是基于最近推出的对话搜索功能开发的,可以查看和搜索以前的聊天内容,全部都是文本形式。

方法很简单,可以分为三步:

1、点击界面上的“创建项目”按钮; 2、项目中添加聊天记录; 3. 尝试搜索功能。还有一个免费的画布工具可以使用,但您不必执行所有这些步骤。每一步都有很多可以用到的地方。

它可以用来做什么?

Kevin Weil 和他的团队在直播中展示了几个案例。

他们创建了一个圣诞老人项目,上传了群组的聊天记录和每个人的需求,然后随机分配任务,并要求助手给群组写一封电子邮件。

再比如,上传一些家电的笔记,然后问:“冰箱的滤水器什么时候需要更换?”如果您经常在家记录重要信息,此功能特别有用。

总的来说,主要有以下三个功能:

首先,它帮助我管理项目,并将聊天记录和文件放在一起,以便于组织;第二,它有搜索功能,所以即使项目中有很多东西,我也可以很快找到我需要的东西。

马拉松直播平台有哪些__马拉松现场直播视频在哪里有

第三,集成了免费的画布工具,这个功能可以让我更直观地看到项目的内容,并更清晰地组织它。这个功能是免费的,对我来说感觉有点像模仿。

这就是第七天的内容,一句话概括。

第八天,他们给我们带来了几个新消息;首先,他们宣布现在向所有登录的免费用户开放,无论是使用网页版、iOS 还是手机版。

产品负责人Kevin Wheel表示,这个搜索功能尤为重要;它可以帮助在线查找最新信息并解答问题。他自己每天都在使用它,很高兴现在每个人都可以使用它。

其次,它还可以与高级语音模式一起使用。这样,在使用语音聊天的同时,还可以搜索信息,让语音交流更加强大、便捷。

此外,它现在还与苹果地图合作。

如果您在 iOS 应用程序中找到一家餐厅,只需单击它并使用 Apple 地图即可导航到那里。这表明它与苹果地图的合作密切。

此外,在移动应用程序中,您可以使用语音模式和聊天。它将把您的语音问题与在线信息结合起来,为您提供答案。例如,如果您询问圣诞市场,它会告诉您何时开放以及开放日期。

最后,可以将其添加到浏览器中,并且可以将其设置为默认搜索引擎,以便您可以更快地进行在线搜索并获得智能搜索建议。

总之,第八天的重点是功能的扩展和增强。包括全球用户可用性、与苹果地图的合作、移动应用程序中的语音模式以及浏览器集成,这些更新使搜索功能变得更加强大。

活动第九天被称为“对开发者最有用的一天”。

这一天,他们推出了o1模型的官方API;这个新版本的o1模型速度更快、成本更低,并且增加了视觉识别和函数调用等新功能。这使得开发人员更容易构建应用程序。

在现场演示中,我和 Brian John 展示了 o1 型号的新功能。它们引入了函数调用、结构化输出、开发人员消息、推理参数和可视化输入等功能。

特别是,他们演示了如何使用 o1 模型的视觉输入功能来解析税表,展示该模型如何识别表单中的错误并输出更正的结果。

接下来,实时API也全面升级。推出的支持极大地简化了实时语音应用程序的开发过程。同时,相关服务的价格也大幅降低,其中GPT-4o的音频处理成本降低了60%。

它介绍了集成的新功能,展示了如何自动处理音频流、管理网络拥塞、实时噪声抑制和音频编码,并且还支持本机浏览器 API。

最后,他们推出了“偏好微调”功能;该技术允许开发者根据用户的喜好定制AI模型的回答风格和内容。比如,使用该功能后,AI助手的准确率提升了5个百分点以上。

提到该技术具有成对比较学习机制、人工注释和A/B测试支持,还可以生成合成数据。他们展示了该技术在财务分析助手中的应用案例,并讲解了如何通过优化来提高查询的准确性。

因此,这一天有三个亮点:o1模型API正式上线、实时API升级调价、偏好微调功能上线。

第十天是什么日子?

活动第10天,采取了两项新行动:

一,他们有热线服务。就像打电话给朋友一样,您可以拨打 1-800-CHAT-GPT(即 1-800-242-8478)并聊天;这项服务每月为您提供 15 分钟的免费通话时间,对于那些想快点想提出问题或尝试新功能的人来说非常方便。

第二,它们允许集成到系统中。这样,您就可以直接在互联网上聊天,而无需更改应用程序或打开计算机,使聊天变得更加轻松。

但是,此功能有两个限制:

目前只对美国用户开放,因为号码是美国的;其次,每月免费通话时间仅为15分钟。如果聊多了,可能就得想别的办法了。

而且聊天时不支持在线搜索信息,只能根据了解到的情况进行回答。因此,如果你已经有Plus,那么使用App中的高级语音模式可能更合适。今天的功能主要是给大家多一种选择。

我感觉第十天的活动并没有那么精彩。说白了,你可以打电话。其实国内的豆宝、文晓燕、Kimi很早就能做到了。

第十一天的内容是关于“桌面应用程序”。

马拉松直播平台有哪些__马拉松现场直播视频在哪里有

产品负责人 Kevin Wheel 和团队成员 John 介绍了一些新的桌面应用程序功能。这些功能旨在帮助每个人在 Mac 和计算机上更快更好地工作。

那么,桌面应用程序有哪些好处呢?

变得更有能力,不仅回答问题,还能自动帮你完成任务;该应用程序可以查看您的屏幕,帮助您自动化工作流程,并使您的工作更加高效。

展示如何使用 Warp 终端。

例如:统计代码在Git存储库中提交了多少次并生成图表。 John 演示了如何使用 Xcode 来帮助编程、实时编写代码和调试。

现在您还可以与 Apple Notes 和 Quip 等应用程序进行交互。您可以直接在这些应用程序中编写和编辑;新增高级语音模式,让您说话交流并立即得到回复,使用起来更愉快。

所有新功能将在直播后上线。您只需更新到最新版本的 Mac 应用程序即可使用。通过新功能,希望大家能够更好的掌握和自动化自己的工作流程,提高工作效率。

简单来说就是三点:

首先是“增强自动化能力”。桌面应用程序可以查看您的屏幕、自动化您的工作流程并提高工作效率。

二是“跨应用协作”,可以与Warp终端、Xcode、Apple Notes、Quip等应用进行交互。无论您是编程、记笔记还是项目管理,它都可以实时为您提供帮助。

三是“语音交互功能”。新增的高级语音模式让您通过说话和交流实现更自然、便捷的交互体验,进一步提高您的工作和操作效率。

今天是直播的最后一天,也是第十二天,重点是o3和o3 mini的预告。为什么跳过o2?为了避免版权问题,直接使用了o3这个名字。

如果让我用一句话来形容 o3,我会说——它非常强大,可能会让程序员感到震惊。

为什么这么说?

我们先来看看研究人员是怎么说的。 o1是第一个大规模推理模型,简单来说就是用强化学习(RL)训练的大型语言模型(LLM)。 o3在o1的基础上进一步扩展了RL的应用,结果非常令人印象深刻。

简单来说,o1只是证明了LLM加RL是可行的,但我们并没有全力以赴; o3全力以赴,通过扩大规模,真正释放了LLM+RL的潜力。

这也验证了一件事——对于编程、数学这样能够明确定义任务奖励、轻松获取过程数据的任务,通过强化学习,可以不断挖掘其潜力,直至达到世界顶尖水平。

那么,o3的核心能力有哪些呢?官方展示了一些数据。

首先,o3模型在编程竞赛中获得了2727分,这个分数达到了国际特级大师的水平,大约进入了全球人类编码竞赛前200名。这个分数比 o1 模型的 1891 分数高出 44%。

注:(是一个在线编程竞赛平台,可以让世界各地的程序员在有限的时间内解决算法问题,以测试和提高自己的编程技能)。

其次,在2024年美国数学邀请赛(AIME)中,o3模型得分高达96.7%,仅做错一题。这个分数显着超过了o1模型的83.3%,相当于顶级数学家的水平。从竞赛数学角度来看,o3的准确率比o1正式版高出15%,比o1预览版高出近71%。

这些结果证明了o3模型在编程和数学领域的优越性能,标志着人工智能在这些领域的进步。

简单来说,o3的三大亮点是:

首先是推理能力的大幅提升;二是数学和逻辑考试成绩优异;三是编程能力的突破。

因此,o3在实践中证明,对于编程这样可以明确定义任务奖励、轻松获取过程数据的任务,通过强化学习的扩展,可以不断挖掘其潜力,直至成为世界顶级程序。成员之一。

最令人兴奋的消息是o3 mini预计将于明年1月底发布!还得再等一个月! o3 mini上线后,很快就会开放API调用,并且会自带o1的所有API功能。

好了,以上就是Open AI 12天发布活动的全部内容了。您认为哪一天的发布会被载入AGI的历史?

 
打赏
 
更多>同类资讯

0相关评论
推荐热播视讯

推荐视频

    Copyright © 2017-2020  二手钢材网  版权所有  
    Powered By DESTOON 皖ICP备20008326号-2