AIPress.com.cn报道
3月22日消息,亚马逊云服务(AWS)首次向媒体开放其Trainium芯片实验室,展示公司在自研AI训练芯片领域的最新进展。该实验室负责Trainium系列处理器的设计与测试,这类定制芯片主要用于训练大规模语言模型,被视为亚马逊在AI基础设施竞争中的关键布局。
AWS表示,Trainium芯片针对大模型训练场景进行了专门优化,包括大规模矩阵运算、混合精度计算以及分布式训练等关键任务,并通过与AWS网络架构及软件栈的深度整合,提高大规模训练集群的效率。工程团队介绍,定制互联架构可以支持数千枚芯片协同运行,以减少传统GPU集群在通信环节中的瓶颈。
亚马逊推动Trainium芯片发展的背景,是AI模型训练成本的快速上升。业内估算,训练前沿大模型的成本已达到数亿美元级别,而当前市场上AI训练硬件主要由英伟达GPU主导。AWS希望通过自研芯片降低训练成本,同时将其与云服务绑定,从而在AI基础设施市场获得更大份额。
在客户方面,AWS表示已有多家AI企业和科技公司使用或测试Trainium芯片进行模型训练。其中包括开发Claude模型的Anthropic,以及多家大型科技公司。亚马逊方面认为,随着AI模型规模持续扩大,对定制计算基础设施的需求将进一步增长。
此次实验室开放也被视为亚马逊强化AI战略的一部分。AWS此前已推出多代Graviton处理器,用于云计算通用负载,以减少对英特尔和AMD芯片的依赖。Trainium则被定位为公司在AI训练芯片领域的重要延伸,与谷歌TPU、微软AI加速器等自研芯片形成竞争。(AI普瑞斯编译)
下一篇:昌平两所社区嵌入式托育园开园