在AI算力成本居高不下、大模型部署门槛越来越高的今天,一家来自美国西雅图的硬件初创公司,正用全新路线向英伟达发起正面挑战。
在目前流行的预填充-解码分离系统中,命中token的KV缓存完全由预填充引擎直接从远程存储加载。这种设计将所有存储I/O压力集中在预填充端的网卡上,而解码引擎端的网卡则基本处于空闲状态。
2026年2月24日, AMD与Meta宣布达成一项规模达6吉瓦的长期战略供货协议,将采用多代AMD Instinct ...
2026 年 2 月 21 日,一家名为 Taalas 的芯片初创公司正式揭开面纱,发布了它的第一款产品:一颗将 Meta 的 Llama 3.1 8B 大语言模型几乎完整“刻进”硅片的推理芯片 HC1。按照该公司公布的数据,这颗芯片在单用户场景下可以跑到 17,000 tokens/s 的输出速度,大约是目前市面上最快竞品 Cerebras 的近 9 倍,是 Nvidia ...
英伟达首席财务官科莱特·克雷斯此前也证实,备受期待的GeForce RTX 50系列显卡将在接下来一段时间里面临供应紧张的问题,并指出供应限制将成为2026年第一季度及之后游戏业务的“不利因素”。
实现归属于母公司所有者的净利润-78,145.20 万元,较上年同期亏损收窄 44.53%;实现归属于母公司所有者的扣除非经常性损益的净利润-82,170.63万元,较上年同期亏损收窄 21.28%。
当全球AI产业的焦点从大模型参数竞赛转向实际应用落地,一个全新的临界点正在到来——Agent生态的爆发式扩张。从Multi-Agent集群协作到“贾维斯”式个人助手,AI正在从被动的对话工具,进化为能够自主规划、执行、反思的智能体。这场变革不仅重新定义了人机交互的边界,更在深刻重塑整个计算体系的底层架构。
散热方面,功耗暴涨随之引发了严重的积热问题,玩家果断舍弃传统硅脂,改用导热效率极高的液态金属散热方案。在初次尝试失败后,他增加夹紧垫圈以大幅提升散热器与核心的贴合压力。改造完成后,显卡的降频现象消失,待机温度被压制在 31℃ 左右。
快科技2月28日消息,NVIDIA CEO黄仁勋前不久表态要推出前所未见的AI芯片,此前网络上认为这会是新一代GPU费曼,首发台积电A16工艺。 虽然费曼GPU很好很强大,但它毕竟还是常规GPU升级,跟黄仁勋所说的前所未见对不上号,因此即将推出的芯片其实不是GPU,而是LPU——Language Processing Units,语言处理单元。
从全球GPU芯片产业链来看,行业巨头大多集中在美国、欧洲、日本和韩国等,它们位居产业链各个环节核心,对全球GPU行业起着决定性的作用。其中,在设计环节中,NVIDIA、AMD几乎垄断独立GPU芯片的市场,而英特尔、AMD几乎垄断集成GPU芯片市场;设备、材料、EDA/IP ...
为弥补现有业务短板,英特尔在2025年OCP全球峰会上推出Gaudi ...
4月2日,通用GPU厂商天数智芯通过官方微信公众号宣布,天数智芯首款通用GPU天垓100及天垓100加速卡自发布以来,累计获得的订单金额已经接近2亿元。 从2021年3月31日,天数智芯发布了国内首款通用GPU——天垓100芯片及天垓100加速卡,实现了国内通用GPU从0到1的 ...
一些您可能无法访问的结果已被隐去。
显示无法访问的结果