GPU Cache - 搜索 News

1 天

显存又要撑爆了? 砸钱买 KV Cache 存储方案前，请先看这三点！

作为一名深耕算力中心架构与分布式存储领域的“老兵”，最近在各大行业会议和技术沙龙中，我们听到频率最高的一个词就是 KV Cache 。伴随着 DeepSeek 等国产大模型的强势崛起，不少用户陷入了“显存焦虑”：担心 GPU 显存被 KV ...

11 天

GPU 已经等不起了：KV Cache 语义化催生的 AI 存储大变局

Jensen 在 CES 上首次提出 ICMS（Inference Context Memory Storage），在 GPU 显存和传统存储之间插入一个以太网直连闪存层（G3.5），专门存放 KV Cache。当时 ICMS 还只是一个技术概念，没有独立产品页，没有硬件出货时间。

电子工程专辑

GPU: 衡量计算效能的正确姿势（3）

上期我们讲了现代计算机体系结构通过处理器（CPU/GPU）和内存的交互来执行计算程序，处理输入数据，并输出结果。实际上 ...

新浪网

推理加速存储AS3000G7发布：以存代算节省算力消耗

快科技7月31日消息，据媒体报道，2025（第二届）产融合作大会在北京召开。会上，浪潮存储重磅发布了推理加速存储产品AS3000G7，旨在解决大模型推理中因KV Cache重复计算导致的算力浪费和时延问题，为金融、科研等领域的模型规模化落地提供关键支撑。当前 ...

Pchome电脑之家

AMD疑似为Navi 31 GPU预留了3D V-Cache连接点

根据测试结果表明，AMD似乎为其全新的顶级显卡GPU也预留了3D V-Cache连接点 AMD目前已经在其EPYC服务器处理器和部分消费级处理器产品线上采用了3D V-Cache技术。但根据来自海外工程师的最新测试结果发现，AMD似乎为其全新的顶级显卡GPU也预留了3D V-Cache连接点，这 ...

电子工程专辑

Intel GPU的野望：从游戏到数据中心

今年的Intel Architecture Day上，更多有关Intel GPU的产品信息揭开面纱。这次Intel主要谈到了面向游戏玩家的Xe-HPG架构Alchemist GPU；以及面向数据中心的Xe-HPC架构GPU芯片Ponte Vecchio。后者被Intel形容为技术难度“堪比登月”的芯片，这也是我们第一次见到MCM（Multi-chip Module ...

DOIT

GPU 内存不够用了，这家公司想让 SSD 来“顶上去”

AI 计算正在撞上一堵墙：GPU 的显存（HBM）不够用了。无论是大模型训练，还是长上下文推理，真正的瓶颈已经不再是算力，而是能被 GPU 快速访问的数据量。现在，铠侠打算让 GPU 直接把 SSD 当成扩展显存来用。在传统架构中： ...

新浪网

破局显存焦虑：新华三推出大模型推理场景加速方案

据多家权威研究机构最新研判，2026 年核心存储供应链的结构性短缺已成行业刚性现实，供需缺口持续扩大且很可能延续至 2027 年。不仅是存储部件的单点问题，当前，生成式 AI 正从技术尝鲜全面走向规模化落地，大模型技术的应用场景正在从训练为主转向 ...

15 天

800亿晶体管核弹GPU架构深入解读，又是“拼装货”？

NVIDIA在3月23日公布基于全新Hopper架构的GPU H100，其多种精度下的AI性能达到上一代A100的3~6倍。NVIDIA如何做到如此大幅的性能升级？Hopper架构有何玄机？千芯科技董事长陈巍博士对此加以解读。

新浪网

AMD Radeon RX 6600M移动GPU性能实测：略逊于英伟达RTX 3060

原标题：AMD Radeon RX 6600M移动GPU性能实测：略逊于英伟达RTX 3060 来源：cnBeta.COM HXL（@9550pro）刚刚在 Twitter 上分享了采用“Navi 23”RDNA 2 GPU 架构的 AMD Radeon RX6600M 移动显卡的的基准测试成绩。按照计划，RX 6600M 将主攻主流笔记本市场。但略逊于英伟达 Ampere RTX 3060 的 ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果