Pytorch and Cuda Guide

PyTorch CUDA内存管理优化：深度理解GPU资源分配与缓存机制

在深度学习工程实践中，当训练大型模型或处理大规模数据集时，上述错误信息对许多开发者而言已不陌生。这是众所周知的CUDA out of memory错误——当GPU尝试为张量分配空间而内存不足时发生。这种情况尤为令人沮丧，特别是在已投入大量时间优化模型和代码后 ...

腾讯网

全球首个AI CUDA工程师来了！将PyTorch原生实现提速10-100倍

机器之心报道编辑：张倩用 AI 提高 AI 的效率，它们就能变得像人类大脑一样高效？我们的大脑只用了 20 瓦的能量就能完成复杂思考，而现代 AI 系统却需要成排的高功率 GPU 和惊人的电力消耗。这种差距如何缩小？日本 AI 初创公司 Sakana AI 团队提出了一个大胆 ...

新浪网

AMD与CUDA竞争重要一步！ROCm 6.4.4发布：为Windows上RX 90/70带来PyTorch

快科技9月25日消息，在2025年Computex大会上，AMD承诺将通过ROCm为Windows系统带来PyTorch支持，如今这一承诺终于兑现。 AMD发布了ROCm 6.4.4预览版本，为Windows系统下的Radeon RX 9000和RX 7000系列显卡以及Ryzen AI系列APU带来了PyTorch支持。 ROCm是由AMD开发的开源GPU计算生态系统 ...

新浪网

英伟达危！谷歌联手Meta要让TPU支持PyTorch，击穿CUDA护城河

谷歌正在发起一项代号为「TorchTPU」的新行动，试图以此打破英伟达在 AI 算力市场的长期垄断。据知情人士透露，这项计划的核心在于让谷歌自研的 AI 芯片（TPU）能够更顺滑地运行 PyTorch，这是目前全球最主流的 AI 软件框架。这是谷歌激进战略拼图中的关键一 ...

InfoWorld

PyTorch review: A deep learning framework built for speed

PyTorch 1.0 shines for rapid prototyping with dynamic neural networks, auto-differentiation, deep Python integration, and strong support for GPUs Deep learning is an important part of the business of ...

36氪

斯坦福意外用AI生成超强CUDA内核，性能比人类专家优化得还要好，翻 ...

好家伙，AI意外生成的内核（kernel），性能比人类专家专门优化过的还要好！斯坦福最近披露了一组新发现，结果真的太亮眼了。由AI优化的内核，在常见深度学习操作上，翻倍超越原生PyTorch，性能至多可以提升近400%—— 矩阵乘法（Matmul，FP32）：性能达到 ...

Geeky Gadgets

How to use PyTorch for Deep Learning applications – Beginners Guide

Deep learning is transforming the way we approach complex problems in various fields, from image recognition to natural language processing. Among the tools available to researchers and developers, ...

Lianhe Zaobao

华为宣布开源CANN 或对标英伟达CUDA

中国科技巨头华为星期二（8月5日）宣布，华为昇腾硬件使能CANN全面开源开放，Mind系列应用使能套件及工具链全面开源。分析认为，华为开源CANN架构，建立华为昇腾的AI软硬件一体化方案，以对标以英伟达为中心的PyTorch+CUDA。综合腾讯科技和IT之家报道，华为 ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果