机器之心编辑部近日,来自字节跳动 Seed 团队和清华大学 AIR 的新研究 CUDA Agent,在 AI 领域引发了不小的轰动。研究人员训练了一个能够编写快速 CUDA 内核的模型:不只是正确的内核,而是真正经过优化的内核。在简单/中等内核上,它的性能比 torch.compile 高出 2 倍;在复杂内核上,它的性能比 torch.compile 高出约 ...
NVIDIA 在2025年GTC大会上宣布了一项具有里程碑意义的技术更新:CUDA并行计算平台正式支持原生Python编程。这一突破性进展将 ...
Python易学易用,用户超过300万人,是世界上十大编程语言之一。该语言让用户能够编写出充分体现用户算法理念的高级软件代码,而无需钻研编程细节。Python广泛的库与先进的特性使其十分适合各种HPC学科、工程以及大数据分析等应用。 对NVIDIA CUDA的支持是通过 ...
最多可支持 10000+ 个并发线程。 经过近 10 年的不懈努力,对计算机科学核心的深入研究,人们终于实现了一个梦想:在 GPU 上运行高级语言。 上周末,一种名为 Bend 的编程语言在开源社区引发了热烈的讨论,GitHub 的 Star 量已经超过了 8500。 作为一种大规模并行 ...
快科技12月7日消息,日前NVIDIA正式推出了CUDA 13.1,官方将其定位为“自2006年CUDA平台诞生以来最大、最全面的升级”。 此次更新的核心亮点,是引入了革命性的CUDA Tile编程模型,标志着GPU编程范式迈入一个新的、更高抽象的阶段。 传统的GPU编程基于SIMT (单指令多 ...
快科技12月7日消息,日前NVIDIA正式推出了CUDA 13.1,官方将其定位为“自2006年CUDA平台诞生以来最大、最全面的升级”。 此次更新的核心亮点,是引入了革命性的CUDA Tile编程模型,标志着GPU编程范式迈入一个新的、更高抽象的阶段。 传统的GPU编程基于SIMT (单指令多 ...