智能助手网
标签聚合 GPU

/tag/GPU

linux.do · 2026-04-18 21:08:34+08:00 · tech

本帖使用社区开源推广,符合推广要求。我申明并遵循社区要求的以下内容: 我的帖子已经打上 开源推广 标签: 是 我的开源项目完整开源,无未开源部分: 是 我的开源项目已链接认可 LINUX DO 社区: 是 我帖子内的项目介绍,AI生成、润色内容部分已截图发出: 是 以上选择我承诺是永久有效的,接受社区和佬友监督: 是 以下为项目介绍正文内容,AI生成、润色内容已使用截图方式发出 前言: 事情起因,我想给虚拟机显卡能力提升下,在网上找到个工具,可以给虚拟机分配显卡,还有硬件直通,因为没玩过这玩意,显卡直通直接给物理机弄黑屏了,绷。当时害怕是因为,以为这电脑没核显,那没救了。后面通过改bios混合模式才救回来。然后就对cc和codex一顿拷打,实现这个工具,可以让物理机和虚拟机同时使用显卡。 功能: 一键为 Hyper-V 虚拟机配置 GPU 半虚拟化(GPU-PV),自动完成 GPU 分配和驱动复制。 使用过程: 主界面 — 选择 GPU、虚拟机,输入显存大小 配置前 — VM 设备管理器,只有 Hyper-V 视频 配置成功 — GPU-PV 配置完成,驱动已复制 配置后 — VM 设备管理器,RTX 4060 已识别 GPU 跑分 — VM 内运行 FurMark,GPU 正常工作 要我说使用感受的话,我感觉也就是虚拟机可以看到显卡,具体划分多少性能过去了,咱也不懂。反正多少是能用了。 免责声明 本人电脑(物理机win11 iot ltsc,虚拟机win10 ltsc)使用没事,但涉及虚拟机及数据方面,我觉得还是要谨慎点 项目地址 github.com GitHub - sec1900/HyperV-GPUshare 通过在 GitHub 上创建帐户来为 sec1900/HyperV-GPUshare 开发做出贡献。 觉得有用的佬们给点点star 如果有其他更好的方式去实现,也希望能甩我几个关键词或者帖子看看 1 个帖子 - 1 位参与者 阅读完整话题

hnrss.org · 2026-04-18 14:49:26+08:00 · tech

Hi HN, I'm the builder. I realized that using cloud AI APIs for sensitive workflows—like transcribing board meetings, OCRing employment contracts, or cleaning up ID photos—is a massive privacy liability. So I built a client-side workspace using transformers.js, Whisper, and WebGPU. Everything runs locally. You can turn on Airplane Mode after the initial model load, and it still transcribes and extracts text perfectly. To keep myself honest, I wrote a technical audit of how the data flows (or rather, doesn't flow). My only backend is a tiny 2-core node in Singapore running self-hosted Plausible analytics: [ https://gist.github.com/ygx2378/3275b333504c6a9def50ef531b54... ] I'm still learning the ropes of browser-based memory management, so I'd love your feedback on how the models load on your specific GPUs! Comments URL: https://news.ycombinator.com/item?id=47813703 Points: 1 # Comments: 0

www.ithome.com · 2026-04-18 12:53:37+08:00 · tech

IT之家 4 月 18 日消息,科技媒体 Wccftech 昨日(4 月 17 日)发布博文,报道称 AMD 已与 AI 公司 Anthropic 达成合作, 后者计划采用 Instinct MI450 AI 加速器。 消息称受行业算力供应短缺影响,Anthropic 寻求多元化供应链。 在推进自研 AI 芯片的同时 ,Anthropic 目前已采用 NVIDIA GPU 和 Amazon Trainium 芯片,此外该公司还和博通、谷歌合作,使用其 TPU 芯片。而最新消息称,该公司计划和 AMD 合作,在其服务器中部署下一代 Instinct MI450 GPU 加速器。 AMD 此前已获得 OpenAI 和 Meta 等客户,其中 Meta 签署了 6 吉瓦的算力采购承诺。此次合作若达成,将是 AMD 在 AI 硬件市场的又一重要突破。 IT之家注:Instinct MI450 隶属于即将发布的 MI400 系列,基于 CDNA 5 架构,提供 MI450X 和 MI430X 型号。官方数据显示,MI400 计算性能达 40 PFLOP(FP4)和 20 PFLOP(FP8),较 MI350 系列翻倍。 新品引入 HBM4 内存标准,容量提升 50% 至 432GB,带宽达 19.6 TB/s,是前代产品的 2.45 倍,GPU 还配备 300 GB/s 的扩展带宽。

linux.do · 2026-04-17 18:07:22+08:00 · tech

xAI 计划向 AI 编程初创公司 Cursor 提供大规模算力支持,允许其在 xAI 的基础设施上训练最新编程模型 Composer 2.5。据 Business Insider 披露,Cursor 将调用 xAI 旗下「Colossus」数据中心中的数万颗 GPU。这一安排标志着 xAI 战略的重大转向:通过出租冗余算力,xAI 正在从单纯的模型研发商向类似 AWS、CoreWeave 的云服务商角色扩张。 这一合作背景复杂。今年 3 月,xAI 刚从 Cursor 挖走了两名产品工程主管负责其产品团队。此外,xAI 内部一份备忘录显示,其目前的 GPU 利用率(MFU)仅为 11%,远低于 35% 至 45% 的行业平均水平。xAI 总裁 Michael Nicolls 已要求团队在数月内将利用率提升至 50%。向外部独角兽开放算力,既能分摊昂贵的数据中心运营成本,也能通过服务顶级编程代理获取宝贵的工程反馈。 目前,Cursor 正以 500 亿美元的估值进行融资谈判。在 OpenAI 和 Anthropic 激进切入编程助理赛道的背景下,绑定 xAI 的算力资源已成为其维持竞争优势的关键砝码。 Business Insider Elon Musk's xAI plans to supply computing power to coding startup Cursor Elon Musk's xAI is collaborating with Cursor, which is using xAI's GPUs for model training, people with knowledge of the matter said. 3 个帖子 - 2 位参与者 阅读完整话题

www.ithome.com · 2026-04-17 11:23:13+08:00 · tech

IT之家 4 月 17 日消息,科技媒体 computerbase 昨日(4 月 16 日)发布博文,报道称针对安全研究员 @weezerOSINT 指控 GPU-Z 存在严重安全漏洞一事, 开发者 Wizzard 回应称报告部分内容失实,强调普通用户根本无法直接访问驱动程序,必须持有管理员权限方可执行相关操作。 安全研究员 @weezerOSINT 在社交平台 X 发文,指控知名显卡检测工具 GPU-Z 存在严重安全漏洞。据其分析,攻击者可利用工具附带的驱动程序 Trixx.sys 中的漏洞,在无需管理员权限的情况下获取系统完整控制权。 该指控迅速引发舆论关注,IT之家发稿前,相关帖子浏览量已超过 33 万次。研究员警告称,攻击者借此可直接读取内存中的密码、Discord 令牌及浏览器会话等敏感数据,且杀毒软件无法检测。 面对指控,GPU-Z 开发者 Wizzard 回应表示,报告部分内容完全失实,强调普通用户根本无法直接访问驱动程序,必须持有管理员权限方可执行相关操作。 尽管如此,开发者承认部分技术细节看似合理,并已着手修复研究员提出的部分问题。同时,他指出 Windows 驱动模型本身存在诸多安全隐患,这在一定程度上导致了此类风险。

www.ithome.com · 2026-04-16 09:53:40+08:00 · tech

IT之家 4 月 16 日消息,美国服饰品牌 Allbirds 曾凭借 Wool Runner 鞋款走红,但在 2021 年以 约 40 亿美元估值上市后 ,公司始终未能盈利,且 2022 年至 2025 年销售额几乎腰斩。公司近期宣布,将在关闭门店后 以 3900 万美元出售品牌与资产 。不过,这一上市壳资源仍具价值。英国《金融时报》指出,Allbirds 正试图借此切入 AI 领域。 首席执行官乔 · 韦尔纳乔表示,公司计划从一名未披露投资者处 融资 5000 万美元(IT之家注:现汇率约合 3.42 亿元人民币) ,将转型后的 NewBird AI 打造为 “GPU 即服务”与 AI 原生云平台 。该业务将通过采购高性能 GPU 并以租赁形式提供算力服务,目标是构建覆盖算力与服务的“新云”体系。 这一布局瞄准当前 AI 算力紧缺的市场环境。随着 AI 需求快速增长,企业在 AI 服务和数据中心的投入持续上升,而高端 GPU 供应紧张、交付周期拉长,数据中心资源趋紧,新增算力也已提前被锁定,导致企业和开发者 难以获取足够算力 。 NewBird AI 试图填补这一缺口,计划通过部署高性能、低延迟算力资源,并以长期租赁方式服务客户,以补充现有云厂商难以稳定覆盖的需求。 不过,这一转型与 Allbirds 原有业务 几乎没有关联 。沃顿商学院教授加德 · 阿隆表示,将其称为“转型”并不准确,“转型意味着将既有能力延伸至新市场,而 Allbirds 在 AI 领域并无相关能力。它真正的资产是 上市公司身份 ,公司更像是在借助这一身份围绕热门概念融资。” 阿隆还表示,“华尔街有句老话, 当擦鞋童开始推荐股票时,就该卖出了 。现在或许可以说,当一家鞋企开始把自己包装为 AI 公司时,市场已经在释放泡沫信号。” 受转型消息刺激,Allbirds 股价(BIRD)盘中一度飙升至 24.31 美元(现汇率约合 166.1 元人民币),较开盘价 6.82 美元 上涨 721% ,目前仍在约 20 美元水平震荡。

www.ithome.com · 2026-04-16 09:23:33+08:00 · tech

IT之家 4 月 16 日消息,消息人士 @jaykihn0 昨日爆料称, 英特尔将为其 AI 推理优化 GPU "Crescent Island" 推出工作站版本 。 英特尔在 2025 年 10 月宣布将推出面向数据中心的 "Crescent Island" AI 加速器。其采用 Xe3P 微架构,支持广泛数据类型,配套 160GB LPDDR5X 内存(显存),针对能效优化,面向 Token aaS 应用场景。 英特尔如果要在原版 "Crescent Island" 的基础上推出面向工作站平台的变体,可能会调整板卡外形规格、降低功耗、削减内存容量、“阉割”核心规模。 此外 @jaykihn0 表示, 其尚未得到有关 Xe3P 独立游戏显卡的消息 。

www.ithome.com · 2026-04-15 11:15:55+08:00 · tech

IT之家 4 月 15 日消息,消息源 @数码闲聊站 今早对于高通下代智能手机应用处理器 (AP) 骁龙 8 Elite Gen 6 的规格设计进行了爆料。 IT之家注意到,这位消息人士在复述整合此前爆料点还提到了一些新信息,比如这款代号 SM8950 的 SoC 在存储部分支持最新的 UFS 5.0 规范 , 配备的 Adreno 845 GPU 拥有 6 个 Slices 切片 。@数码闲聊站 此前并未提到骁龙 8 Elite Gen 6 Pro (SM8975) 上 Adreno 850 GPU 的具体规格。 骁龙 8 Elite Gen 6 基于台积电 2nm 工艺制程;CPU 部分导入高通新一代 Oryon 自研架构,采用 2+3+3 三丛集设计,共享 16MB L2 缓存(持平 Pro 版);GPU 部分拥有 12MB GMEM 缓存,较 Pro 版减少 6MB;SLC 系统级缓存则是 6MB,较 Pro 版减少 2MB。 相关阅读: 《 曝骁龙 8 Elite Gen6 Pro(SM8975)芯片疑似共享 16MB L2,规格“很激进” 》

linux.do · 2026-04-13 19:39:50+08:00 · tech

《华尔街日报》调查报道,AI 行业正经历全面的算力供给危机,GPU 租金飙升、服务频繁宕机、产品被砍、客户流失同时发生。 英伟达最新一代 Blackwell 芯片的云端现货租金已涨至每小时 4.08 美元,两个月前为 2.75 美元,涨幅 48%。数据来自 GPU 定价数据商 Ornn 发布的算力价格指数,该指数近期已被纳入彭博终端。云基础设施公司 Vultr CEO J.J. Kardwell 说:「这是我经营这家公司五年多来见过的最严重的算力短缺。数据中心建设周期太长,2026 年可用的电力已经全部被预订了。」 Anthropic 是受冲击最明显的一家。Claude API 截至 4 月 8 日的 90 天正常运行率为 98.95%,行业通行标准是 99.99%。企业软件开发平台 Retool 创始人兼 CEO David Hsu 说,他认为 Opus 4.6 是最好的企业级模型,但最终切到了 OpenAI,因为「Anthropic 一直在宕机」。3 月下旬,Anthropic 开始在工作日太平洋时间早 5 点至 11 点限制用户 token 消耗量。宕机频发的背面是爆炸式增长:年化营收从 2025 年底的 90 亿美元升至 2 月的 140 亿、4 月的 300 亿,增长本身在加剧供给缺口。 OpenAI 同样在做取舍。API token 处理量从去年 10 月的每分钟 60 亿升至 3 月底的 150 亿。CFO Sarah Friar 说:「我花很多时间在到处找最后一点可用算力,我们正在做一些非常痛苦的取舍,有些项目因为算力不够被放弃了。」此前 OpenAI 已关停视频生成应用 Sora,部分原因就是需要将芯片资源释放给编程和企业产品。 GPU 云服务商 CoreWeave 去年底将价格上调超过 20%,并要求中小客户签署至少三年合约,此前为一年。美国银行分析师上月给出「买入」评级,认为供不应求至少持续到 2029 年。 https://www.wsj.com/tech/ai/ai-is-using-so-much-energy-that-computing-firepower-is-running-out-156e5c85 3 个帖子 - 3 位参与者 阅读完整话题

linux.do · 2026-04-12 23:44:14+08:00 · tech

摩尔线程旗舰级 AI 训推一体全功能 GPU MTT S5000 已完成对新一代大模型 MiniMax M2.7 的 Day-0 极速适配,再次验证了中国国产全功能 GPU 对前沿 AI 大模型的快速响应与稳定支撑能力。 MiniMax M2.7 是业界首个具备深度自我进化能力的大模型,能够自主构建 Agent Harness,通过 Agent Teams 协作、复杂 Skills 调用及 Tool Search Tool 等能力完成复杂生产力任务,甚至深度参与自身迭代。在软件工程领域,M2.7 支持端到端完整项目交付、日志分析排障、代码安全审查及机器学习任务;在专业办公场景,其 Excel/PPT/Word 高保真编辑与多轮修改能力显著提升,即使在超长上下文复杂任务中仍保持稳定的高水平 skills 遵循率。与此同时,该模型对长上下文处理、复杂 Agent 任务调度及高保真编辑等场景提出了极高的计算效率要求。 摩尔线程技术团队基于 MUSA 架构完成深度调优,成功在 MTT S5000 上实现 M2.7 大模型的高性能推理。 https://mp.weixin.qq.com/s?__biz=Mzg3MTU3Mjc4OQ==&mid=2247491952&idx=1&sn=2ee931d474a1027b26e55bd28d86f7a1&chksm=cf28c7a8d57d1cf8956450249a72708848a4b74351196da3afda4a805423ddaadc0cac690043&scene=0&xtrack=1#rd ▼ 开发者可下载镜像进行开箱体验: registry.mthreads.com/presale/devtech/vllm_musa:MiniMax-M2.7 1 个帖子 - 1 位参与者 阅读完整话题

www.ithome.com · 2026-04-12 22:50:29+08:00 · tech

IT之家 4 月 12 日消息,摩尔线程已完成 MiniMax M2.7 大模型 Day-0 适配,支持 MTT S5000 旗舰级 AI 训推一体全功能 GPU。 据介绍, MiniMax M2.7 是业界首个具备深度自我进化能力的大模型 ,能够自主构建 Agent Harness,通过 Agent Teams 协作、复杂 Skills 调用及 Tool Search Tool 等能力完成复杂生产力任务,甚至深度参与自身迭代。 值得注意的是,摩尔线程已多次 Day-0 即时适配国产大模型,涵盖智谱 GLM-5、千问 QwQ-32B 等。 IT之家注:MTT S5000 是专为大模型训练、推理及高性能计算而设计的全功能 GPU 智算卡,基于第四代 MUSA 架构“平湖”打造。其单卡 AI 算力最高可达 1000 TFLOPS,配备 80GB 显存,显存带宽达到 1.6TB/s,卡间互联带宽为 784GB/s,完整支持从 FP8 到 FP64 的全精度计算。