Pytorch GPU - 搜索 News

天下苦英伟达久矣！PyTorch免CUDA加速推理，Triton时代要来？

近日，PyTorch 官方分享了如何实现无 CUDA 计算，对各个内核进行了微基准测试比较，并讨论了未来如何进一步改进 Triton 内核以缩小与 CUDA 的差距。在做大语言模型（LLM）的训练、微调和推理时，使用英伟达的 GPU 和 CUDA 是常见的做法。在更大的机器学习编程与 ...

电子工程专辑

PyTorch宣布支持苹果M1芯片GPU加速：训练快6倍，推理提升21倍

更多精彩内容请点击上方蓝字关注我们吧！今年 3 月，苹果发布了其自研 M1 芯片的最终型号 M1 Ultra，它由 1140 亿个晶体管组成，是有史以来个人计算机中最大的数字。苹果宣称只需 1/3 的功耗，M1 Ultra 就可以实现比桌面级 GPU RTX 3090 更高的性能。随着用户 ...

腾讯网

PyTorch可对苹果M系芯片提供原生支持，实现GPU加速训练，性能最高 ...

近日，开源机器学习框架 PyTorch 官方宣布，将提供对苹果 M 系芯片的原生支持。这意味着开发和研究人员可以利用苹果芯片的 GPU 进行更快的模型训练，之前在苹果平台电脑上的 PyTorch 框架只支持利用 CPU 训练。（来源：PyTorch）简单说一下苹果自研的 M 系芯片 ...

新浪网

PyTorch官宣：告别CUDA，GPU推理迎来Triton加速新时代

【新智元导读】用英伟达的GPU，但可以不用CUDA？PyTorch官宣，借助OpenAI开发的Triton语言编写内核来加速LLM推理，可以实现和CUDA类似甚至更佳的性能。试问，有多少机器学习小白曾被深度学习框架和CUDA的兼容问题所困扰？又有多少开发者曾因为频频闪烁的警报「 ...

电子工程专辑

PyTorch官宣：告别CUDA，GPU推理迎来Triton加速新时代

【导读】用英伟达的GPU，但可以不用CUDA？PyTorch官宣，借助OpenAI开发的Triton语言编写内核来加速LLM推理，可以实现和CUDA类似甚至更佳的性能。试问，有多少机器学习小白曾被深度学习框架和CUDA的兼容问题所困扰？又有多少开发者曾因为频频闪烁的警报「CUDA版本 ...

新浪网

几十行PyTorch代码让GPU利用率猛涨，MIT团队打造新模型架构，渲染质量 ...

仅需几十行 PyTorch 代码即可大幅提高 GPU 利用率，在英伟达 A100 上的 GPU 利用率高达 70%。这一能力由一款名为 LaCT 的新模型架构实现，它由北京大学本科校友、美国麻省理工学院博士生张天远和所在团队打造。研究团队通过在不同模态的任务中采用范围从 2000 到 ...

快科技

努力替代CUDA！摩尔线程Torch-MUSA插件升级v1.3.0 完全开源

快科技10月31日消息，摩尔线程宣布，针对PyTorch深度学习框架的MUSA插件“Torch-MUSA”，迎来重大更新新版本v1.3.0，全面兼容PyTorch 2.2.0。新版进一步提升了PyTorch在摩尔线程GPU MUSA架构上的模型性能与覆盖度，能更友好地支持模型迁移到摩尔线程GPU。 PyTorch是全球 ...

36氪

谷歌狂喜：JAX性能超越Pytorch、TensorFlow，或成GPU推理训练最快选择

7项指标排名第一。 JAX在最近的基准测试中的性能已经不声不响地超过了Pytorch和TensorFlow，也许未来会有更多的大模型诞生在这个平台上。谷歌在背后的默默付出终于得到了回报。谷歌力推的JAX在最近的基准测试中性能已经超过Pytorch和TensorFlow，7项指标排名第一。

36氪

AI生成苹果Metal内核，PyTorch推理速度提升87%

AI自动生成的苹果芯片Metal内核，比官方的还要好？ Gimlet Labs的最新研究显示，在苹果设备上，AI不仅能自动生成Metal内核，还较基线内核实现了87%的PyTorch推理速度提升。更惊人的是，AI生成的Metal内核还在测试的215个PyTorch模块上实现了平均1.87倍的加速，其中一些 ...

来自MSN

PyTorch 2.8发布：LLM推理性能大幅提升，Intel GPU分布式后端实验性支持上线

PyTorch，这一广受欢迎的开源机器学习框架，近期正式推出了其最新版本——2.8版。此次版本更新聚焦于提升量化大语言模型（LLM）在Intel CPU上的推理性能，吸引了众多开发者和研究人员的目光。在PyTorch 2.8中，开发者团队通过算法优化和技术革新，显著提高了 ...

csdn

从PyTorch生态工具到具身智能实践：摩尔线程亮相智源大会展现国产AI ...

6月6日-7日，第七届北京智源大会在北京盛大召开。本届大会汇聚了4位图灵奖得主、30余位AI企业创始人&CEO、100余位全球青年科学家、200余位人工智能顶尖学者和产业专家。大会设置20个论坛共计180余场报告，覆盖多模态、深度推理、下一代AI路径、Agent智能体、具 ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果