近日,PyTorch 官方分享了如何实现无 CUDA 计算,对各个内核进行了微基准测试比较,并讨论了未来如何进一步改进 Triton 内核以缩小与 CUDA 的差距。 在做大语言模型(LLM)的训练、微调和推理时,使用英伟达的 GPU 和 CUDA 是常见的做法。在更大的机器学习编程与 ...
结果是显著的:StitchCUDA 将 Hacking 率从 Kevin-32B 的 52% 降至 16%, Hacking 从 4 次降至 0 次。而去除 Rubric 的 StitchCUDA-A 变体,Hacking 率回升至 32%,进一步验证了 Rubric Reward 的因果效应。
快速导读:阿里巴巴通义千问的核心人物林俊阳宣布离职。这个看似平常的人事变动,却在海外AI社区引发了一场罕见的“集体致敬”,从PyTorch联合创始人到Ollama,顶级大牛纷纷表示震惊。有投资人甚至直言:我买阿里股票就是因为千问,现在得重新评估了。
导语:本书适用于自然语言处理(NLP)和深度学习的新手学习两个领域中的一些重要的知识点。这两个领域研究热点都呈指数增加。由于本书强调深度学习和自然语言处理中的代码实现 本书适用于自然语言处理(NLP)和深度学习的新手学习两个领域中的一些重要的知识点 ...
快科技9月25日消息,在2025年Computex大会上,AMD承诺将通过ROCm为Windows系统带来PyTorch支持,如今这一承诺终于兑现。 AMD发布了ROCm 6.4.4预览版本,为Windows系统下的Radeon RX 9000和RX 7000系列显卡以及Ryzen AI系列APU带来了PyTorch支持。 ROCm是由AMD开发的开源GPU计算生态系统 ...
快科技10月31日消息,摩尔线程宣布,针对PyTorch深度学习框架的MUSA插件“Torch-MUSA”,迎来重大更新新版本v1.3.0,全面兼容PyTorch 2.2.0。 新版进一步提升了PyTorch在摩尔线程GPU MUSA架构上的模型性能与覆盖度,能更友好地支持模型迁移到摩尔线程GPU。 PyTorch是全球 ...
AMD宣布ROCm和PyTorch支持已经开放给同是RDNA 3架构的RX 7900 XT显卡,涵盖了RDNA 3架构的所有顶级产品。 AMD上个月已经放出了Ubuntu Linux的ROCm 5.7.1驱动更新,为Radeon Pro W7900和Radeon RX 7900 XTX显卡带来了ROCm和PyTorch支持。而在12月初的AMD Advancing ...
小扎痛失老将!PyTorch创始人之一今早官宣离职,加入Meta十一年,一手打造出响彻AI界的PyTorch。如今,离职原因也很纯粹:不愿余生只与PyTorch绑定,去开启下一个新篇章。 刚刚,PyTorch创始人Soumith Chintala官宣,将于11月17日离职Meta! 原因很简单,不想一辈子搞PyTorch ...
作为一种边缘训练和推理的开源解决方案,ExecuTorch 1.0现已对所有开发者开放。 高通技术公司贡献了ExecuTorch代码库,以使开发者能够直接访问高通® Hexagon™ NPU。 这简化了开发者的工作流程,并释放了本地AI推理的优势,包括个性化、性能提升、隐私保护,以及 ...
AI自动生成的苹果芯片Metal内核,比官方的还要好? Gimlet Labs的最新研究显示,在苹果设备上,AI不仅能自动生成Metal内核,还较基线内核实现了87%的PyTorch推理速度提升。 更惊人的是,AI生成的Metal内核还在测试的215个PyTorch模块上实现了平均1.87倍的加速,其中一些 ...
PyTorch,这一广受欢迎的开源机器学习框架,近期正式推出了其最新版本——2.8版。此次版本更新聚焦于提升量化大语言模型(LLM)在Intel CPU上的推理性能,吸引了众多开发者和研究人员的目光。 在PyTorch 2.8中,开发者团队通过算法优化和技术革新,显著提高了 ...
为优化复杂生物物理模型参数拟合,研究人员开发 PhoTorch 软件,高效准确,意义重大。 人工智能(AI)的进步为植物表型分析和预测建模带来了巨大益处。然而,在利用人工智能进展优化复杂生物物理模型的参数拟合方面,仍存在未被挖掘的机遇。这项研究开发 ...