商汤分拆的AI芯片公司,为何全盘押注模型推理市场?
创始人
2025-11-25 15:06:11
0

沐曦、燧原等国产AI芯片公司希望同时抓住模型训练和推理两块市场,但从商汤分拆而来的曦望Sunrise定位明确:全盘押注AI推理芯片市场。

11月24日中国国际半导体博览会的一场论坛上,曦望Sunrise商业产品负责人阎研解释称,国产AI芯片公司若想缩短与英伟达的距离,不能空喊口号,而要拆解可行路径。曦望Sunrise选择在推理芯片上做单点突破,背后的考虑的是,模型训练和推理在计算精度、内存架构、互联方式等方面存在较大区别,一颗芯片难以兼顾训练效能与推理的经济性。

曦望Sunrise脱胎于商汤的芯片业务部门,于2024年底独立并完成第一轮外部融资,今年7月宣布了一笔近10亿元的新融资。公司董事长由商汤科技联合创始人徐冰担任,联席CEO王勇和王湛均有百度从业背景。

截至目前,该公司已推出三代推理芯片。据记者了解,第一代S1芯片于2020年量产,定位于视觉推理芯片,主要服务于商汤的计算机视觉(CV)业务,累计销售超2万颗;第二代S2芯片从2024年9月起量产,采用GPGPU(通用GPU)架构,公司方面声称该芯片实测性能接近英伟达A100的80%;第三代S3芯片在2025年5月正式立项,预计2026年点亮——该步骤意味着芯片设计和制造过程已经成功。S3芯片针对大模型推理定制优化,支持FP8和FP4(8位和4位浮点数)低精度数据格式。

阎研介绍,S3芯片将配置200G以上的显存以及足够的带宽去满足推理需求。公司的目标是使其在大模型推理部署的成本,能接近英伟达的下一代Rubin架构芯片。

相较于训练芯片,推理芯片的设计难度和数据处理规模相对较低,成为众多国产AI芯片公司必争之地。同时,AI应用的加速普及,带动推理算力市场需求的高涨。这也是曦望Sunrise全面押注推理芯片的行业背景。阎研认为“大模型下半场”已然到来:如今,预训练模型趋于成熟,头部开源模型的性能表现亮眼,很少有AI公司仍继续开展模型预训练;而伴随智能体和下游应用持续爆发,行业预见推理算力将在未来数年占据上风。

在阎研看来,AI芯片范式也随之变迁:高性能训练芯片的市场发展空间小,但高性价比推理芯片则是市场蓝海。如何做到好用和高性价比,是推理芯片当前面临的挑战。

为了降低客户迁移成本,曦望Sunrise和大多数国产芯片公司一样,选择兼容英伟达的并行计算框架CUDA——它能让开发者轻松利用GPU的并行计算能力。阎研提到的公司另一策略是,通过资本投融资以及深度业务合作的方式,紧密绑定众多上下游企业。“也就是说,芯片从设计的第一天开始就已经有了客户。”有人使用,才能得到一手反馈,进而提高芯片的易用性。

记者了解到,曦望Sunrise背后的产业资本包括装备制造企业三一集团、第四范式、美的控股、游族网络等,同时公司还与商汤科技、数据中心服务商世纪互联、服务器厂商超云、AI Infra公司硅基流动等建立合作。

在推理芯片性比价的优化策略上,阎研认为,取得算力与显存带宽之间的平衡至为关键。在推理计算任务中,可能出现浪费算力或浪费带宽的情况,都相当于拉低了芯片的性价比。因此在芯片设计阶段,厂商就应该让目标计算任务的运行,尽量落在算力与显存带宽的平衡点上。

采写:南都N视频记者 杨柳 发自北京

相关内容

热门资讯

VD: Backend 'VB... 虚拟电脑名称: windows11VD: Backend 'VBoxIsoMaker' does n...
他把玉璧嵌入星空,也把玉做成耳... 12月20日下午,赵赵的最新个展“玉”在成都K空间开幕。现场展出的一系列装置、绘画、综合材料与迷你雕...
中国I O型OTP单片机市场十... 2025-2031年中国I O型OTP单片机市场十五五需求与发展前景研究报告 ︿︿︿︿︿︿︿︿︿︿︿...
中科大造出首个紫外光谱成像芯片... 1666 年,牛顿在剑桥的房间里,让一束阳光穿过三棱镜,世界第一次看见光分解成彩虹般的色彩。那一刻,...
并购重组热潮之下 “半导体女王... 12月15日晚,知名智能家居制造商皮阿诺发布公告,公司控股股东、实际控制人将发生变更,同时引入关联方...
【中国光计算芯片,新突破】上海... 【中国光计算芯片,新突破】上海交大科研团队在光计算芯片领域取得重大突破,首次实现支持大规模语义媒体生...
威锋电子推出工业级USB集线器... USB4、SuperSpeed USB、USB 2.0 与 USB PD 控制芯片的领导厂商威锋电子...
江苏德默-CARLO GAVA... 江苏德默工业控制设备有限公司 是国内较早的欧洲自动化仪器仪表,备品备件现货代理供应商,总部位于上海,...