近日,亚马逊云科技举办2024 re:Invent中国行活动,亚马逊云科技大中华区产品部总经理陈晓建从计算、存储、数据库、数据分析、人工智能等领域分享了2024 re:Invent的最新发布,展现了亚马逊云科技作为全球云计算的领航者,致力于成为企业构建和应用生成式AI首选平台的坚定决心。
陈晓建强调,几乎所有的应用程序都可以分解成为几个核心的构建单元,亚马逊云科技所做的就是构建出非常优秀的核心单元,用户可以通过自由搭建这些核心单元,满足他们在特定场景下不同的业务需求。
同时,他指出,在行业中,企业普遍采用多模型策略以平衡性能、功能和成本。亚马逊云科技深知这一需求,因此在Amazon Bedrock等产品中推出了智能体功能,并实现了多智能体协作,以及Amazon Q中的智能体功能更新,旨在更好地将生成式AI能力融入现实世界。
此外,亚马逊云科技对生成式AI领域的重视程度极高,并且生成式AI产品发布节奏已大幅加快。以前每年主要在re:Invent发布重大特性,现在re:Invent只是发布生成式AI特性的一个窗口,亚马逊云科技在其他时间也会密集发布新特性。Amazon Bedrock在re:Invent期间就一次性发布了21个新特性,充分展示了亚马逊云科技在创新方面的强劲实力。
2024年,许多客户从思考阶段进入实践阶段,进行了大量场景试验。展望未来,陈晓建预测,2025年将有大量客户从原型验证阶段迈向生产阶段。这将对技术支持提出更高要求,不仅需要选择合适的模型,还需要一系列各种技术的支持。亚马逊云科技开发Amazon Bedrock的目的不仅是提供模型市场,更重要的是提供能让模型推理运行时所需的各种生产力工具和生产环境工具,这才是Amazon Bedrock的真正价值所在。
而针对模型在生产环境中可能出现的幻觉问题,亚马逊云科技引入了自动推理技术。通过数学验证方式,能够严密证明事实性错误是否会发生,从而有效减少幻觉问题的发生,提升模型的稳定性和可靠性。
以下为2024 re:Invent部分重要的最新发布内容:
在计算服务领域,搭载Nvidia Blackwell芯⽚的Amazon EC2 P6实例系列在亚⻢逊云科技海外区域上线,其计算性能是当前GPU的2.5倍;搭载自研芯片Amazon Trainium2的Amazon EC2 Trn2实例,相较当前⼀代基于GPU的实例,性价⽐提升了30-40%。每个Trn2实例都配备了16个Amazon Trainium2芯⽚,使单个实例能够提供⾼达20.8 Petaflops的计算性能。而Amazon EC2 Trn2 UltraServer通过NeuronLink互连技术,可将4个Trn2实例(共64个Trainium2芯⽚)连接在⼀起,令单个计算节点的峰值计算性能超过83.2 Petaflops。这不仅能为超⼤规模模型提供更好的推理性能,还能让构建超⼤规模训练集群的过程更加⾼效。
据介绍,亚⻢逊云科技与Anthropic正在合作打造⼀个名为Rainier项⽬的Trn2 UltraServer集群,该集群将使用数十万个Trainium2芯片,规模是其之前集群的五倍以上。而Amazon Trainium3将于明年后期推出,这是⾸款采⽤3纳⽶制程⼯艺的芯⽚,计算速度可提⾼到2倍,能效最⾼提升40%,让客户以更低的成本构建规模更⼤、性能更强的应⽤。
在存储服务领域,Amazon S3 Tables正式可用,这种专为Iceberg表设计的全新存储桶类型,查询速度提⾼到3倍,与常规Amazon S3存储桶相⽐,每秒可处理事务数量提升到10倍。新发布的Amazon S3 Metadata元数据服务则是⼀项全新服务,能帮助客户即时发现和理解Amazon S3中的数据,⾃动为客户创建可查询的元数据,并且⼏乎实时进⾏更新。
在数据库服务领域,亚马逊云科技提供了从关系型数据库,到图数据库到⽂档数据库,让用户在每种使⽤场景都能找到合适的数据库⼯具。在完全兼容MySQL和PostgreSQL的数据库服务Amazon Aurora发布10周年之际,新发布的Amazon Aurora DSQL作为一款全新的无服务器分布式SQL数据库,与其他的流行分布式SQL数据库相比,读写速度提升了4倍。Amazon DynamoDB global tables已⽀持主动-主动的多区域部署,同时具备强⼀致性、低延迟和⾼可⽤性。
在数据分析服务领域,新发布的新⼀代Amazon SageMaker,旨在打造满⾜客户所有数据、分析和AI需求的统⼀平台,全部功能都可以通过统⼀的企业数据视图实现。Amazon SageMaker Unified Studio一站式数据和AI开发平台已开放预览,支持创建包含AI或分析资源的共享项目,方便数据科学家、分析师和机器学习专家开展协同工作。Amazon SageMaker Lakehouse为所有数据源提供简单统一的访问方式,兼容Apache Iceberg,也可以通过任何支持Apache Iceberg API的第三方AI或分析工具、查询引擎直接访问SageMaker数据湖仓。全新Zero-ETL与领先的软件即服务(SaaS)应用程序的集成,让客户无需复杂的数据管道,即可在Amazon SageMaker Lakehouse和Amazon Redshift中访问第三方SaaS应用程序的数据,并进行分析或机器学习。
大家原本熟悉的Amazon SageMaker现在更名为Amazon SageMaker AI,并推出数项重要更新:包括Amazon SageMaker HyperPod 新训练配方功能,现能提供30多个精选的模型训练配方。Amazon SageMaker HyperPod 灵活训练计划,会根据用户的时间安排和预算,利用EC2容量块制定最优的训练计划。Amazon SageMaker HyperPod任务治理功能,可动态调配资源,确保高优先级任务准时完成,还可以监控资源使用情况,进行持续优化,将模型开发成本降低最多40%。此外,用户现在还可以在Amazon SageMaker中发现、部署和使用亚马逊云科技合作伙伴提供的AI应用。
在AI推理领域,新发布的Amazon Nova系列模型包括了多种类型:Nova Micro是文本到文本模型,能以极低成本提供低延迟响应;Nova Lite为成本极低的多模态模型,可快速处理多种输入;Nova Pro是功能强大的多模态模型,在准确性、速度和成本间平衡;即将推出的Nova Premier是其中能力最强的多模态模型,可处理复杂推理任务并指导定制模型蒸馏。
此外,新发布的新一代图像生成模型Amazon Nova Canvas,它能帮助客户生成高质量图像,还具备图像编辑功能。新一代视频生成模型Amazon Nova Reel,以先进的视频生成质量和低延迟,提供了性能和成本效益之间的平衡。
在模型合作与扩展方面,新发布的poolside、Luma AI、Stability AI的Stable Diffusion 3.5模型等将很快在Amazon Bedrock上线。其中,poolside专为软件开发流程打造,其模型在代码生成、测试、文档编写方面表现出色,基于深层次上下文实现实时代码补全;Luma在模型创新方面取得重大突破,可将文本和图像转化为高品质、逼真的视频;Stable Diffusion 3.5是基于SageMaker HyperPod训练的高级文生图模型,性能强大。新推出的Amazon Bedrock Marketplace,则令用户可以使用领先供应商提供的一百多个新兴和专业基础模型。
在AI推理构建⼯具方面,Amazon Bedrock是构建和扩展生成式AI应用的关键平台,提供了将推理功能整合到生产环境所需的工具。Amazon Bedrock新推出的功能包括:延迟优化选项、模型蒸馏功能、知识库支持GraphRAG、自动推理检查功能、多智能体协作功能,支持多个Agent协作处理复杂工作流程等。
在Amazon Q方面,系列产品包括Amazon Q Developer和 Amazon Q Business,为不同场景提供生成式AI支持。