易IC电子行业销售管理系统 - 易IC电子行业库存管理软件
首页 / 行业新闻 / 正文

吉姆·凯勒:人工智能仍遵循传统计算法则

2026-06-25   电子工程时报
阅读时间约 3 分钟
加利福尼亚州圣克拉拉——一年前,《电子工程时报》(EE Times)探访Tenstorrent首席执行官吉姆·凯勒的办公室时,他门外白板上写着:“我们要赢!”一年后重返,白板内容已变为:“天啊,这速度真快!”
在Tenstorrent举办TT-Deploy活动之后,该公司首次公开展示了其芯片在大规模部署下的实际能力。凯勒向EE Times表示,Tenstorrent凭借BlackHole Galaxy服务器,在性能上可超越GPU及各类专用AI硬件。
凯勒认为,AI推理本质上是一个网络与内存问题,而Tenstorrent的架构已在规模化验证中证实了这一点。
在TT-Deploy活动中,Tenstorrent展示了多种工作负载下的性能表现。例如,16台Tenstorrent Galaxy服务器(共512颗芯片)可在批处理规模为32的情况下,以每用户最高350 tokens/秒的速度进行DeepSeek-671B模型的推理。
Tenstorrent实现高速token生成的关键在于其能轻松将大型张量拆分至数百颗芯片上协同运算。Galaxy机箱每台配备56个以太网端口;相较之下,GPU服务器通常每台仅有8个外部接口。
凯勒援引IBM于20世纪60年代提出的“伦茨定律”(Rent’s Rule),指出逻辑模块所需的I/O接口数量随逻辑规模增长呈亚线性关系;换言之,计算单元面积的增长速度远超通信通道的可用空间。他认为,这是许多其他架构难以克服的根本缺陷。
“不存在新定律,”他说,“AI计算的基本原理源自20世纪70年代的高性能计算(HPC),这些原理早已被业界充分理解数十年。”
他强调,成功的AI基础设施仍取决于计算、内存与I/O三者之间的平衡。
“AI主要涉及矩阵运算与非线性向量操作;要使其高效运行,需具备充足的SRAM以暂存数据与计算结果,并设置缓冲区用于在内存、张量处理器与芯片之间传输数据——我们已完整实现这一点,”他解释道,“若内存过大,提升有限;若过小,则性能严重受限。”
Tenstorrent的竞争对手Cerebras近期公布了Kimi K2.6(1T参数)模型在CS3硬件上的性能:981 tokens/秒。该模型是其迄今公开测试的最大规模模型。
据凯勒称,Tenstorrent通过大规模部署BlackHole Galaxy服务器,不仅可超越该性能指标,且硬件成本仅为Cerebras方案的极小部分。
“Cerebras的IPO及其后续估值对我们很有帮助,尤其当我们将在各方面全面超越他们时,”他说,“挑战已接受!”
www.eic.net.cn 易IC库存管理软件 在系统级设计中,Tenstorrent强调软硬件协同优化的重要性。尽管大型云服务商与前沿实验室因垂直整合而被认为在芯片定制方面具备天然优势,但凯勒指出,这种优势可能被高估。Tenstorrent同样针对常用非线性函数进行了硬件优化,并可在后续芯片迭代中灵活调整。
他指出,芯片层面最关键的是:支持大模型训练、精度控制得当、并能妥善应对巨型KV缓存与计算密集型任务(如扩散模型)。他总结道:“只要DRAM、SRAM、计算单元、矩阵-向量运算模块与片上网络(NoC)配置均衡,目前所有功能均运行良好——伦茨定律依然稳固有效。”
另一条经典定律——阿姆达尔定律(Amdahl’s Law)——也正以新形式回归现实。该定律通常用于说明:任何任务的加速上限受限于其中无法并行化的部分。
“智能体计算(Agentic computing)正是一个典型的阿姆达尔定律问题,”凯勒说,“过去AI需要海量算力,CPU只能提交任务后等待完成;如今AI已足够快,瓶颈反而转移到标量计算环节,从而推高了对CPU的需求。”
关于上市计划,凯勒未回应有关英特尔与高通等公司有意收购的传闻,仅确认曾与这两家公司的CEO及各大云服务商高层会面,推介Tenstorrent的硬件IP技术。
“我期待能促成一笔重大合作,因为我们的RISC-V CPU IP非常出色,”他表示,“其中一家云服务商还在评估我们的AI IP用于小型芯片项目。”
他指出,虽然大型云厂商已自研超大规模AI芯片,但边缘设备所需的小型AI芯片无法简单缩减同款IP。Tenstorrent的AI IP专为可扩展性设计,已完全产品化——从单核到千核规模均可无缝适配。
近六个月来,Tenstorrent的两家初创同行分别完成了(实质性的)收购与IPO。凯勒确认,Tenstorrent正积极推进IPO进程,并同步拓展供应链与全球布局。
“目前投资者对IPO热情高涨,”他说。
有观点认为,Tenstorrent作为解码加速器的潜力,或使其成为GPU厂商的潜在收购目标。对此凯勒表示,更可能的合作形式是战略联盟或联合市场推广。
他补充道:“无论是主权基础设施建设方还是顶尖前沿实验室,都希望在软硬件层面掌握自主权。未来存在多种可能性。”
TT-Deploy活动后,Tenstorrent已收到多笔订单,其中最大一笔为96台Galaxy集群(总计3,072颗Blackhole芯片),将运往美国境外。截至目前,其最大客户仍是日本AI&公司,其CEO为前Tenstorrent高管大卫·贝内特。
“部分客户原计划向英伟达下单1亿美元设备,但因交货周期长达一年,转而采购价值2000万美元的Tenstorrent设备——价格更低、交付更快,”凯勒透露。
目前Tenstorrent正在制造1000台Galaxy服务器,其中至少一半已完成销售。
“我们的产品运行稳定,已有10家客户现场部署Galaxy系统,已越过概念验证阶段,”凯勒表示,“我们正陆续收到追加订单……目标是先赢得10位满意客户,再扩展至20家、30家。”
易IC库存管理软件 作为支撑现代AI基础设施的关键环节,高效、可靠的芯片与系统管理能力日益重要。Tenstorrent的快速成长印证了行业对高性能、高性价比AI算力的迫切需求,也为供应链协同与库存优化提出了更高要求。

|
|
|
|
TOP
©Copyright www.eic.net.cn 2003-2026 BeiJing MengKaiGuan Software Exploiture Co.,Ltd. All Rights Reserved.    北京梦开关科技有限公司
IC元器件库存管理软件 IC元器件库存管理系统 IC元器件管理软件 IC元器件进销存 IC元器件库存管理软件 IC元器件库存管理系统 快递查询接口
QQ: 880717
18500810082