“没有一个模型可以包揽一切。”这一被亚马逊频繁强调的概念也逐渐深入人心。在今年云计算行业年度盛会re:上,亚马逊云科技意外发布了全新大机型系列Nova的6款前沿机型,并透露了明年将发布的两款特别机型——voice-to-voice、Any-to -任何。

这意味着,亚马逊云科技在大力押注大型美国独角兽的同时,也没有放松自研模式。
re:期间,亚马逊云技术全球副总裁兼生成AI总经理Vasi就这些问题与知动态等多家媒体进行了深入交流。他谈到了目前文本模型的需求,语音转语音也很流行(比如实时同声传译),而any-to-any是更远的未来。
Any-to-any模型属于多模态到多模态。用户可以输入文本、语音、图像或视频等多种形式的内容,并相应地输出文本、语音、图像或视频。
Vasi 向我们解释说,any-to-any 模型适用于变化较大的情况,例如不确定类型是图像还是视频的情况。 “你不能将任意到任意模型用作文本到文本模型,”他强调道。 “这可能会很昂贵,但效果不会很好。”

最强的不一定是最好的方案,易用才是硬道理。
整个re:大会不断传递出一个信号——亚马逊云技术的生成式AI竞争力是全面的,拥有令人眼花缭乱的大模型类别,以及加速从训练到推理的各种工具“包”。以及围绕平台、存储、网络、数据库的一系列升级……所有的改变都指向一个目标,那就是让云客户能够更快、更便捷地利用生成式AI产生价值。
1、新大型号上架:不偏不倚,提供试用机会
新发布的Nova基础型号包括Micro、Lite、Pro、Model。 Micro是纯文本模型,后三者是多模态模型,还有图片模型和视频模型Reel。这些模型都支持微调和蒸馏,并且还与知识库深度集成,可用于检索增强生成(RAG)。

Vasi告诉智东智,亚马逊云技术的每一个新模式、新服务在上线前都会经过内部讨论流程,意为“基石”,Nova意为“新”。他表示,亚马逊云技术不会公布模型参数,选择取决于客户希望拥有多大的灵活性。
“我们平等对待所有模特。”作为负责人,瓦西表示,他的团队非常中立,不会偏袒一种模式。
定价是由模型提供商制定的,不同情况下有很多不同的考虑。亚马逊云技术不绑定特定型号,始终为客户提供选择的空间。
大型模型只是生成式人工智能应用创新的一部分。亚马逊云技术的全托管AI平台除了提供各种大型模型外,还设有专门的试用服务。客户试用后可以根据效果和价格综合考虑。

此外,亚马逊云技术提供了模型版本政策,在模型生命周期结束时(即新产品不再使用时),将给予客户另外6个月的时间。在瓦西看来,更换一些新旧版本会占用计算资源,从成本和效率的角度来看可能并不划算。更换新的可能会更便宜。
亚马逊云技术对 Nova 型号的成本效益充满信心,称它们比中国其他领先型号便宜约 75%。

2.五个功能:选择模型、组合数据、构建Agent
在 re: 会议上,亚马逊首席执行官安迪·贾西 (Andy Jassy) 分享了在亚马逊内部构建近 1,000 个生成式 AI 应用程序时获得的三个经验教训:
1、当生成式AI应用达到一定规模时,计算成本的重要性就凸显出来。客户通常希望物有所值。
2. 构建真正高质量的生成式人工智能应用程序相当困难。除了有一个好的模型之外,还需要设置适当的“护栏”来保证消息传输的顺畅,并有一个合适的用户界面,让用户使用起来不卡顿。具有合理的成本结构。
3、永远不会出现一种工具一统天下的情况。开发者并不急于选择性能最好的模型。他们会使用不同的模型和一些自主开发的模型。
亚马逊云技术于2023年9月推出的全托管AI平台就实现了上述能力的集合。 Vasi 表示,该平台已发展成为亚马逊云技术中增长最快的服务。

亚马逊云技术首席执行官马特表示,这是目前构建和扩展生成式AI应用程序最简单的方法,并且特别擅长为客户提供将生成式AI集成到生产应用程序中所需的所有元素。
它的定位是帮助用户更好地试模。它有五个主要功能:1)选择模型; 2)在性价比和准确性之间找到平衡点; 3)整合业务数据; 4)集成业务安全; 5)构建代理。
平台的很多发布和创新也围绕这五个功能展开。

首先,在型号选择上,除了亚马逊云科技新发布的自研大型号Nova系列以及来自全球9家领先AI公司的高性能基础型号之外,这家云计算巨头还推出了专业基础型号,支持客户使用统一的API调用并利用能力构建应用。


为了让模型选择变得更容易,智能提示词路由功能可以将请求动态路由到最有可能以最低成本提供最佳响应的模型,在不影响准确性的情况下可以降低 30% 的成本。这样,开发人员就不必花费大量时间进行试验并找到适合每个用例的最佳模型。

其次,模型蒸馏有助于在业务需求、专业知识、预算和模型准确性、成本和延迟之间寻求平衡。
模型蒸馏将特定知识从大型且准确的教师模型中提炼为特定场景下较小但高效的定制模型。使用新推出的模型蒸馏,蒸馏模型的运行速度比蒸馏模型快500%,成本降低75%,并将有助于处理所有相关工作。

新发布的延迟优化推理选项和提示词缓存功能也可以进一步降低延迟,显着降低成本。

一旦有了合适的模型,下一步就是将企业数据与智能模型相结合。
将数据添加和集成到模型中的一种流行方法称为检索增强生成 (RAG),它可以帮助模型根据企业数据提供更相关、更准确和定制的响应。

亚马逊云技术今年早些时候推出了知识库功能。它是一个托管 RAG 索引,可以自动化所有数据摄取、检索和增强工作流程,从而无需用户自己完全管理这些链接。

客户只需将知识库指向他们的数据源,它就会自动将其转换为文本嵌入并将其存储到矢量数据库中。这样,客户可以随时进行自动搜索,所有搜索结果都会自动包含参考信息,让用户更容易知道信息来源,提高理解能力。
知识库已经是应用程序中最受欢迎的功能之一,并且不断添加新功能,例如对矢量数据库和结构化数据检索的支持。

GenAI Index可以为知识库提供高语义精度的托管检索解决方案,内置40多个企业数据源。


知识库支持结构化数据检索,可以查询各种来源的所有结构化数据,并自动生成知识图谱。新发布的Data函数可以自动将非结构化多模态内容转换为结构化数据,无需编写代码,从而更轻松地将多模态内容用于生成式AI。

导入自己的企业数据后,您需要考虑安全性并为您的AI应用设置功能边界。
对此,亚马逊云技术推出了护栏功能,可以轻松定义应用程序的安全性并实施负责任的人工智能检查。使用此功能,您可以限制 AI 应用程序仅回答特定区域的问题。

要解决模型幻觉问题,可行的技术之一就是自动推理,亚马逊云技术在很多后台服务中都使用了这项技术。这是人工智能的一种形式,可以从数学角度证明某些事情是正确的。通常用于验证系统是否按照既定的要求运行。特别适合覆盖范围大、无法手动一一查看的系统,并且有关于系统如何运行的知识库。场景。
最新添加的是自动推理检查功能,可以检查模型所做陈述的准确性,以防止模型幻觉引起的错误。

亚马逊云技术还发布了多模式毒性检测功能,可以筛选非结构化数据中是否存在潜在有害内容。
最后,谈到如何利用高质量的数据来采取行动。
亚马逊云技术此前推出了Agent功能,可以更轻松地构建智能代理。客户只需要用自然语言描述他们希望Agent完成的任务,就可以快速构建。内置的Agent可以处理销售订单、准备财务报告、分析客户保留率等任务。其背后使用的模型推理技术使得Agent能够分解工作流程并调用正确的API来执行操作。

在此基础上,针对涉及多智能体并行操作的任务,亚马逊云技术推出了多协作功能,可以构建、部署和编排多个任务,协同处理复杂的多步骤任务。

与之前的方法类似,客户可以创建一个专为特定的个性化任务设计的Agent,然后创建一个监督Agent。它就像复杂工作流程的“大脑”,负责协调分配并确保多个Agent之间的有效协作。它还可以设置哪些代理可以访问机密信息,使原本难以协调的工程任务变得简单轻松。
总体来说,其功能不仅是方便客户获取行业先进的模型,而且内置了很多支撑工具和工程能力,可以让实际业务与生成式AI结合的操作过程更加便捷,结果更有效。

3、下一代:数据分析和AI需求的统一接入中心
为了取得成功,生成式人工智能应用创新需要人工智能就绪的数据。因此,亚马逊云技术发布了新一代,在产品和品牌方面将其重新定位为“所有数据、分析和人工智能需求的中心”。

许多云客户在数据治理、发现、处理、分析和生成式人工智能应用创新方面的需求日益集成。对此,亚马逊云技术发布。这是一个单一的数据和人工智能开发环境,集成了亚马逊云技术中分析师和数据科学家使用的各种服务、查询编辑器和可视化工具,以便客户可以访问组织中的所有数据并使用最合适的工具来操作它们。
亚马逊云技术还针对应用程序推出了零 ETL,允许客户分析存储在许多最流行的第三方 SaaS 应用程序中的数据,而无需构建和管理数据管道。
另一项新发布的Lake House兼容性为所有结构化和非结构化数据源提供了单一接口,提供跨不同数据源的简单统一的数据访问和访问控制。客户可以轻松使用 中的所有数据,或直接从任何支持的第三方 AI 或分析工具或查询引擎访问功能。
为了一站式解决生成式AI全生命周期的问题,AI将大数据分析、机器学习、模型开发和生成式AI的经验整合到一个统一的平台中,统一数据、分析和AI工作流程,从而帮助消除机器学习和分析生命周期中的重复工作。

针对大规模参数带来的模型训练和推理挑战,亚马逊云技术推出灵活的训练计划和任务管理功能,优化计算资源管理。
灵活的培训计划基于 EC2 容量块。它根据时间和预算制定最佳训练计划,自动预留容量、设置集群、创建模型训练作业。它可以为数据科学团队节省数周的培训时间,并最大限度地提高计算资源利用率。最多可节省 40% 的成本。
任务治理功能通过自动化生成式 AI 任务的优先级划分和管理,解决跨团队和项目管理计算资源的挑战,确保最高优先级的任务按时分配和完成,从而进一步提高开发效率并降低成本。
这两个功能可以极大地提高训练和推理工作负载部署以及底层硬件资源使用的灵活性,让底层硬件资源能够更好地发挥作用。
此外,亚马逊云技术宣布合作伙伴的人工智能应用程序现已在亚马逊上提供。客户无需配置或管理基础设施,可以加速模型开发生命周期,并保证数据安全和隐私。
明年,亚马逊云技术还将为新云添加大量新功能,比如低代码体验、专业AI服务集成、流处理和搜索,以及更多来自零的服务和数据接入。 ETL。
4、生成式AI助手Q的重新进化,提高企业生产力
Q 是一款基于 的生成式 AI 助手应用程序。即使您从未编写过一行代码,您也可以简单地用自然语言陈述业务问题,它将指导您完成构建机器学习模型的过程。


其中,Q是软件开发的生成式AI助手。它最近推出了三个新的独立代理,可以帮助开发人员生成单元测试、文档和代码审查。

为了应对现代化,亚马逊云技术提供了现代化的.NET应用程序、加速的工作负载和主机迁移功能,以及第一个支持IBM z/OS的主机迁移解决方案,可以显着减少迁移时间和成本。并显着降低风险。
在操作过程中,亚马逊云技术通过提供即时Q功能帮助您更轻松地排查问题。
企业级生成式AI助手Q可以连接不同的业务系统和企业数据源,支持跨各种数据库与所有企业数据进行对话。 Q为企业数据创建索引,可以索引来自Adobe、、、、Gmail、、等来源的过去一年的数据,并保持高度的安全性和对所有数据的用户权限的控制。
最新发布的功能是将数据与Q结合并以一个视图呈现。它可以通过自然语言与Q系统对话,快速生成业务报告和数据分析,帮助客户做出更好的决策,提高业务效率。目前,绝大多数信息是通过商业智能系统访问的,超过10万客户使用商业智能系统来满足他们的分析需求。

亚马逊云技术为独立软件供应商提供了一组新的 Q API,以便在他们自己的软件中访问和集成 Q Index。
对于一些涉及多个申请、审批链接和手动输入的复杂工作流程,亚马逊云技术新发布的 Q 可以通过使用一系列高级代理来创建、编辑和维护工作,从而帮助创建跨团队和应用程序的自动化任务。过程。工作流程启动后,Q Agent会持续对其进行监控,以确保其能够及时自动调整和修复。原本需要数周或数月才能完成的事情现在只需几分钟即可完成。
结论:从服务、工具到基础设施,全栈升级为生成式AI创造价值。
正如计算机科学先驱艾伦·凯曾经说过的那样,最好的软件工程师自己构建硬件。新一波云计算和生成式人工智能将推动底层不断创新,进而加速数据和人工智能的进一步发展。与传统IT一样,生成式AI需要计算、网络和存储基础设施,而这些也正是亚马逊云技术长期积累的优势。
将商业人工智能和生成人工智能结合起来需要大量的工程能力。在生成式AI发展的早期阶段,亚马逊云技术的服务重点是提供“最优组合”,将技术能力分解为独立的构建单元()并以高性价比组件的形式提供给客户,让客户您可以根据自己想要的任意组合进行尝试和调整,从而节省开发时间并加速生成式 AI 实现的探索。
总体而言,亚马逊云技术通过提供丰富的自研和第三方大模型货架,解决大模型执行效率问题,提高资源利用和数据分析的速度,满足云客户的差异化需求。通过使用 Q 来增强每个人的能力。所有人都可以轻松快速地使用生成式AI生产工具,并通过升级底层基础设施进一步降本增效。
这些投资在为广大客户带来更大商业回报的同时,也持续巩固了云计算巨头在生成AI云服务市场的领导地位和核心竞争力。


