AI推理算力需求即将爆发,深圳云天励飞加注推理芯片

AI推理算力需求即将爆发,深圳云天励飞加注推理芯片

hyde1088 2025-07-29 装修装饰 2 次浏览 0个评论

界面新闻记者 | 梁宝欣

界面新闻编辑 | 林腾

AI推理芯片正成为人工智能行业新的涌入方向。

7月25日,2025年世界人工智能大会期间,界面新闻记者了解到,深圳云天励飞(688343.SH)宣布全面聚焦AI推理芯片,围绕边缘计算、云端大模型推理、具身智能三大场景,目标是国产算力“加速器”。

云天励飞董事长兼CEO陈宁告诉界面新闻等媒体,2025年成为人工智能发展的重要转折点——大模型技术达到新的成熟高度,模型调用成本显著降低。AI从“专家工具”逐步演变为“全民基础设施”。AI正从训练时代迈入推理时代,预示着推理算力需求将迎来爆发式增长。

今年以来,以DeepSeek R1为代表的新一代大模型加速发展,推动AI产业的深度变革。中信建投证券研报指出,DeepSeek R1在长CoT数据微调基础上应用强化学习,除性能提升外,DeepSeekR1采用GRPO强化学习策略,专门优化数学推理任务,减少计算资源消耗,实现更低的成本。推理成本来看,R1模型价格只有OpenAI o1模型的几十分之一,具有极高的性价比优势。

除此之外,中信建投证券研报还提到,三大增量助力推理算力需求加速,一是各家互联网大厂加速AI与原有业务结合,二是Agent和深度思考推理的结合,三是多模态加速渗透。

AI推理算力需求即将爆发,深圳云天励飞加注推理芯片

陈宁表示,未来AI可能全面重塑我们身边的各类电子产品——从智能耳机、智能眼镜等可穿戴设备,到扫地机器人、冰箱等家用电器,再到电动汽车,几乎所有电子设备的形态与功能都将被重新定义。这些设备将具备“主动工作”的能力,能像人类一样开口交流,理解复杂指令、主动回应需求甚至解决实际问题。可以预见,未来各类智能设备,也能通过更人性化的交互,实现功能的跃升与体验的革新。而这一切场景的落地,都离不开AI 推理芯片的底层支撑。

推理算力需求的爆发,核心依赖AI推理芯片——这是云天励飞选择聚焦该领域的关键背景。

从AI芯片的分类来看,根据所承担任务的不同,可分为训练芯片和推理芯片。其中,推理芯片主要负责利用神经网络模型进行推理预测,需综合考量单位能耗算力、时延、成本等多方面指标。

虽然当前AI推理芯片市场仍处于蓝海阶段,其市场规模相较于数千亿美元的训练芯片市场仍较小,但预计未来三至五年内,AI推理芯片的增长速度将大幅超越训练芯片。陈宁说。

针对各类应用场景,云天励飞已开发出 DeepEdge10C、DeepEdge10标准版、DeepEdge10Max 和 DeepEdge200 四款芯片。

据了解,2023年11月 ,云天励飞正式发布面向边缘人工智能的DeepEdge10系列推理芯片,其核心定位便是满足边缘端对千亿参数大模型的部署需求支持包括Transformer模型、BEV模型、CV大模型、LLM大模型等各类不同架构的主流模型

从技术底层来看DeepEdge10系列芯片采用的是“算力积木”架构,通过D2D Chiplet技术、C2C Mesh技术和C2C Mesh Torus技术,将多个标准计算单元像搭积木一样,封装成不同算力的芯片和多芯片互连的可扩展计算系统,覆盖8T-256T算力需求,可实现7B、14B、130B、671B等不同参数量大模型的推理,赋能各类智算推理硬件产品。

云天励飞CTO李爱军表示,算力积木架构实现了两方面核心能力:一方面是算力的纵向拓展(scaleup),即在单个计算节点内聚合更多算力——通过该架构,可在一个封装内最多集成8个算力积木,形成统一算力。这一架构源于2020年对GPT等算法的分析,目前已在Edge10芯片上落地,实现了单个封装内集成8个积木、达成128T推理算力的单芯片成果。

另一方面是通过C2C Mesh技术(结合Mesh互联与Mesh Torus技术)实现算力扩展:将多个节点首尾连接形成更大规模的算力池,从而支撑MoE架构大模型的推理。

目前,DeepEdge10芯片平台已成功适配DeepSeekR1系列模型、QwQ-32B模型及国产鸿蒙操作系统。

从经营数据来看,2024年云天励飞营收增长了81%;今年一季度,这一增速进一步提升至160%。云天励飞管理层表示,展望下半年,随着AI推理算法的迭代、算力需求的攀升以及AI应用的持续拓展,有信心继续保持高速增长的态势。

转载请注明来自夏犹清建筑装饰工程有限公司,本文标题:《AI推理算力需求即将爆发,深圳云天励飞加注推理芯片》

每一天,每一秒,你所做的决定都会改变你的人生!

发表评论

快捷回复:

评论列表 (暂无评论,2人围观)参与讨论

还没有评论,来说两句吧...