首页 > 焦点要闻 > 全面展示亚马逊云科技最新成果,中国峰会给合作伙伴与客户更多信心

全面展示亚马逊云科技最新成果,中国峰会给合作伙伴与客户更多信心

2023-07-18 20:59  

基本信息

面向行业
应用领域

 

云服务是支持数字创新的关键生产力,亚马逊云科技一直专注于基础设施服务的持续创新,赋能用户业务发展。本届峰会期间,亚马逊云科技大中华区产品部总经理陈晓建全面分享了亚马逊云科技的最新成果。亚马逊云科技全球产品副总裁 Matt Wood也专程飞到中国,与中国的合作伙伴与客户进行了面对面的交流。

 

陈晓建全面分享亚马逊云科技最新成果

 

图:亚马逊云科技大中华区产品部总经理陈晓建

 

陈晓建首先针对算力需求井喷,介绍了亚马逊云科技通过自研芯片创新、弹性的计算存储组合以及Serverless架构,帮助客户简化运维,以更高性价比满足多样算力需求。

 

目前,算力需求井喷具有三个特点:一是需要更高性价比的软硬件解决方案以应对算力资源紧缺;二是 云服务需要提供快速高效的弹性资源供给,以应对生成式AI的迅速发展和快速变化的业务需求;三是云服务需要进一步降低使用门槛,让客户能快速上手。

 

针对算力需求紧缺,亚马逊云科技提供全面深入的基础设施能力,包括Intel、AMD、英伟达,和自研的CPU及加速芯片产品。

 

Nitro是亚马逊云科技的第一款自研芯片产品,去年推出的第五代Nitro将每瓦性能提高了40%:首先,它实现了非常轻量级的虚拟化。在此前业界经常看到的虚拟化损耗通常在20-30%之间,Nitro通过硬件虚拟化,整个性能损耗不到1%;其次,实现了网络和存储在硬件级别的隔离机制,导致在用户通信和拥有存储的数据通信的时候之间是完全隔离的,不会造成互相的干扰;第三,在硬件层面实现了硬件的加密,任何进出Nitro的数据包都会进行硬件级别的加密,最大限度保证用户数据通信的安全。

 

通用处理器Graviton芯片:Arm架构的通用处理器Graviton 3与上一代产品相比,计算性能提高多达25%,浮点性能提高多达2倍,加密工作负载性能最多加快2倍。第四代产品Gravtion3E则在针对高性能计算应用场景的向量计算性能上,再提升了35%。

 

机器学习训练芯片Trainium:以HuggingFace BERT模型作为案例来看,基于Trainium的Trn1实例和通用的GPU实例对比,在训练的吞吐率上面,单节点的吞吐率可以提升1.2倍,而多节点集群的吞吐率可以提升1.5倍,从成本考虑,单节点成本可以降低1.8倍,集群的成本更是降低了2.3倍。而增强型Trn1n实例的网络带宽跃升至1.6Tbps,可将万余个Trainium芯片构建在一个超大规模集群上,实现对超大模型进行并行训练。

 

机器学习推理芯片Inferentia:2019年,亚马逊云科技推出了第一代用于机器学习的推理芯片Inferentia,所对应的实例Inf1和同样基于通用GPU的EC2实例相比,带来了70%成本的降低;2022年又推出了第二代推理芯片Inferentia2,进一步提升了4倍吞吐量,延迟只是之前的1/10,通过优化,第二代Inferentia可以大规模部署复杂的模型,例如大型语言模型(LLM)和Diffusion类模型。

 

Inferentia在设计的时候就考虑到了吞吐率和延迟的优化,使得用户两者可以“鱼与熊掌,两者兼得”:

首先,以自然语言常见的BERT模型为例,In2实例的吞吐可以提升三倍,延迟降低了8.1倍,而成本只是通用GPU实例的1/4;其次,以开源模型OPT-30B为例,相比于通用GPU EC2的实例,In2实例吞吐率增加了65%,而推理成本则降低了52%,如果用更大的660亿参数的OPT-66B为例,通用GPU已经力不从心,但In2实例依然可以保持每秒351个token数的吞吐量;第三,视觉类模型以Stable Diffusion 2.1的版本为例,Inf2实例可实现50%的成本节约。

 

针对弹性资源供给,亚马逊云科技提供600多种不同的计算实例,从处理器、网络和存储等各种服务都能够与计算进行很好的结合,以积木的方式搭建出一个丰富灵活的计算实例的资源,满足多种不同算力的要求。

 

以存储为例,数据规模到达PB级别时存储方式变得非常重要,“热、温、冷、冻”不同类型的存储方式,成本和性能都有很大差别。Amazon S3对象存储提供8种存储层级,同时提供智能分层,自动选择最适合的存储层级。

 

针对简化算力应用,亚马逊云科技推动云服务全面迈向Serverless

 

亚马逊云科技在不断探索如何将云的弹性、敏捷性、按需付费的特性发挥到极致,在这个过程中,逐步推动着云服务全面迈向Serverless。现在,亚马逊云科技已经率先实现了全栈数据服务的Serverless化,开启了云服务全面Serverless的时代,让客户无需预置或管理基础设施,就可以运行几乎任何类型的应用程序或后端服务代码,帮助客户最大限度减轻运维工作,并增加业务敏捷性,更好地应对业务的各种不确定性。

 

“面对算力的需求井喷所带来挑战,我们通过自研芯片提供更好的性价比,通过各种丰富的计算、网络、存储等各种产品的组合应对突发的算力需求,通过Serverless有效降低运维的复杂性,从而简化算力的使用,全面满足用户的多样化的算力需求。”陈晓建总结说。

 

如今,越来越多的中国企业在全球大展拳脚,打造全球化的企业对IT架构提出更高要求。陈晓建介绍了亚马逊云科技提供从中心到边缘的多种产品的解决方案,包括覆盖全球的基础架构,以及快速部署稳定系统的能力,还有全面支持全球各个国家和地区业务合规能力,成为用户创造坚实底层架构的基石。

 

无处不在的云服务:亚马逊云科技提供的高度安全可靠的云基础架构,让创新能够快速抵达每一个角落,为客户提供支持业务创新的算力,并能很好地支持客户的全球化布局战略,希望客户无论何时何地,都可以使用相同的基础设施、服务、API和工具。如今,亚马逊云科技全球31个区域的99个可用区,可以覆盖245个国家和地区。

 

快速部署可靠系统的能力:亚马逊云科技CTO Werner Vogels说“Everything fails, all the time”。所有的功能模块都有可能出故障,不能完全避免故障的发生,但是亚马逊云科技通过努力,把风险降到最低,主要有以下几种方式:

1) 区域隔离,多可用区设计:每个区域都会有多个可用区,任何单一可用区的故障不会影响到其他可用区的业务,最大限度降低服务的中断。

 

2) 控制面和数据面解耦:更多地依靠数据面来保持服务运行、降低对控制面的依赖,能够提高整体稳定性。

 

3) 蜂窝架构:把系统分割成多个微小的、单一的、相互之间隔离的蜂窝状单元,能够在问题出现时降低爆炸半径,通过爆炸半径能够把故障控制在一个单元以内。

 

4) 随机分片:是对蜂窝架构的进一步优化。它把客户的访问随机分配到不同的单元中,说单个单元的故障并不会对整个系统造成影响,还是可以通过其他的单元完成。

 

5) 服务责任模型:通过明确定义亚马逊云科技与客户责任区间的方式,保障客户在应用的任何阶段都能享有对所写代码和程序的控制权。

 

6) 运营就绪审查:通过对亚马逊云科技大量运营案例进行分析,对过往的问题进行复盘,从而用户在整个部署的时候能够避免重现他们之前所发生的问题。

 

7) 安全的持续部署:可以最大限度减少因错误部署而对生产造成的影响。

 

8) COE纠错流程:了解问题所发生时候的系统状态,以防止类似的错误再次发生。

 

陈晓建还介绍了亚马逊云科技支持全球各个国家和地区业务合规能力:亚马逊云科技几乎满足全球所有监管机构的合规性要求,支持143项安全标准与合规认证。有超过300种安全合规服务,帮助各行各业的客户能够更方便的搭建满足全球各地安全和合规要求的架构。

 

对云技术的前沿探索,正为全球各行各业、各种类型的客户加快数字化转型和创新提供生产力。亚马逊云科技提供了全面和深入的服务和功能,拥有从计算、存储和网络到机器学习和量子技术的200多项至广至深的服务,为用户提供全方位的支持,几乎可以支持任何应用程序,无论应用程序在什么地方运行,需要什么样的合法合规,需要什么样的计算伸缩性都可以提供支持,这比任何其他云服务商都要来的更多。

 

“现今创新至关重要而云技术能更快、更高效地帮助企业创新亚马逊云科技广泛和深入的服务可以让客户摆脱基础架构的束缚,专注于创新。对于全球布局,亚马逊云科技提供从中心到边缘的多种产品的解决方案,包括覆盖全球的基础架构,以及快速部署稳定系统的能力,还有全面支持全球各个国家和地区业务合规能力,这些都能够成为用户创造坚实底层架构的基石。”陈晓建总结说。

 

 

副总裁Matt Wood专程来华,在中国峰会现场沟通分享

 

图:亚马逊云科技全球产品副总裁 Matt Wood

 

本届中国峰会期间,亚马逊云科技全球产品副总裁 Matt Wood专程来到中国,与中国的合作伙伴与客户面对面进行交流。

 

亚马逊云科技在为客户提供广泛的机器学习能力方面有着悠久的历史,过去10年间提供每一个级别的机器学习能力,包括底层芯片、Amazon SageMaker机器学习服务和开箱即用的AI服务。

 

过去6-8个月时间里看到了生成式AI的爆发,大语言模型可以接受复杂的输入,并产生复杂的输出。亚马逊云科技深信生成式AI在重塑各行各业,它可以突破以前无法突破的极限。生成式AI的典型场景包括:创意输出,如写作、设计、编码、建模等;功能增强,如搜索、总结、排序等;全新的交互式体验,可产生新的知识和想法,以及通过聊天机器人提供开放的知识;决策支持,在人工监督下自动执行复杂任务。

 

科幻作家威廉·吉布森说“未来已至,只是还没有均匀分布”,亚马逊云科技始终希望将拥有广阔前景的且令人兴奋的技术提供给每个人,在云计算时代,亚马逊云科技提供通过API访问云上应用的快捷访问,这一愿景不会因为生成式AI的出现而改变,希望将这项技术交到每一个构建者和每一个商业用户的手中。

 

如何解锁生成式AI价值

 

Matt Wood谈到,首先要提供对一流基础模型的访问,第二需要提供安全私密的环境去定制模型,第三需要通过定制芯片提供低成本和低延迟访问;第四需要搜寻机会提升使用体验。

 

1. Amazon Bedrock提供对一流的基础模型的访问:这项新服务允许用户通过 API 访问来自 AI21 Labs、Anthropic、Stability AI 和亚马逊的基础模型。Amazon Bedrock 是客户使用基础模型构建和扩展生成式AI应用程序的最简单方法,为所有开发者降低使用门槛。在 Amazon Bedrock上,用户可以通过可扩展、可靠且安全的亚马逊云科技托管服务,访问从文本到图像的一系列强大的基础模型。

 

2. 借助Amazon Titan模型库实现安全且私密的模型调优:Amazon Titan是一系列不同的模型的库,可实现文本归纳总结、搜索结果嵌入、有害内容删减等,用户可以非常安全、隐私地对这些模型做优化和微调。

 

3. 自研定制芯片提供低成本、低延迟:推理芯片Inferentia和训练芯片Trainium。

 

4. Amazon CodeWhisperer 改善体验:这是基于机器学习为开发人员提供的一个代码生成的服务,支持包括Java、JavaScript和Python等在内的15种不同的编程语言,个人用户可免费使用。在测试中,与未使用CodeWhisperer的参与者相比,使用CodeWhisperer的参与者完成任务的速度平均快57%,成功率高27%。

 

Matt Wood还介绍了云原生数据战略,指出数据是生成式AI的起点,数据也将推动生成式AI的广泛应用。

 

战略一:全面的工具集,满足现在和未来所需。亚马逊云科技推出15种专门构建的云上托管数据库服务,为各类用户的应用场景提供完美契合的数据服务;亚马逊云科技的分析服务已全面实现Serverless化,包括交互式查询服务Amazon Athena、大数据处理服务Amazon Managed Streaming for Apache Kafka (Amazon MSK)、实时分析服务Amazon Kinesis、数据仓库服务Amazon Redshift、数据集成服务Amazon Glue、商业智能服务Amazon QuickSight以及运营分析服务Amazon OpenSearch Service。

 

战略二:轻松集成,连接所有数据。亚马逊云科技提出了Zero-ETL的愿景,致力于实现无缝的数据转换和调用,而用户不用编写任何的代码。最近推出了Aurora新的服务——Amazon Aurora可以与Amazon Redshift进行Zero-ETL集成,允许使用 Amazon Redshift 对来自Aurora的PB级事务数据进行近实时分析和机器学习 (ML)。事务数据在被写入Aurora后的几秒钟内,即可用在Amazon Redshift中,因此您不必构建和维护复杂的数据管道来执行提取、转换和加载 (ETL) 操作。

 

战略三:构建端到端的数据治理。通过数据治理,加速并保障数据流通。亚马逊云科技去年推出的一项全新的数据管理服务Amazon DataZone,可以让客户更快、更轻松地对存储在亚马逊云科技、客户本地和第三方来源的数据进行编目、发现、共享和治理。借助Amazon DataZone,管理员和数据资产管理者可以使用精细的控制工具管理和治理数据访问权限,确保数据访问发生在正确的权限和正确的情境之下。

 

最后,Matt Wood给出了使用数据开启生成式AI旅程的五条建议:基于自己现有的数据战略去做构建;在组织内实现更广泛、更安全的生成式AI实验;为需求场景定制化模型;携手亚马逊云科技,探索无限可能;选择场景,即刻启程,构建未来。

 

“技术能力往往遵循S曲线。你永远不知道你在S曲线上的位置,除非你向后看。希望明年再会的时候我们能够回顾一下在S曲线的头部有哪些新的点,另外我们在未来有哪些展望,我们希望在这个曲线上渐进的推动。我们相信明年回头看的时候,我们看到我们已经达到了S曲线的顶点,达到了快速爆发式发展的点,有很多的发明和应用。”Matt Wood说。

 

无论是AI创新风潮带来的算力资源需求爆发,还是中国企业创新出海新格局下普遍的“全球化”需求,亚马逊云科技都致力于为企业提供助力。本届亚马逊云科技中国峰会全面的最新成果展示,让更多合作伙伴和行业用户对亚马逊云科技更具信心,加速携手迈进数字化转型升级之路。

赞 0个人觉得赞
logo

北京圣邦天麒科技有限公司

规模:50-200人

网站: http://www.sinptech.com

北京圣邦天麒科技有限公司成立于2005年,注册资金3050万,自有资产4800万,现有员工230余人。十余年来一直潜心专注服务教育及政府行业用户,以不断创新的思...

粉丝1

关联信息

关于我们 | 全生命周期管理 | 服务的客户 | 版权说明 | 联系我们

公司名称:北京金誉在线伙伴文化传播有限公司    备案号:京ICP备 15026202号-1

意见
反馈
返回
顶部