NVIDIA 剛推出最新的 GB300 NVL72 系統。與舊款 Hopper 平台相比,每兆瓦電力可處理多 50 倍的工作量。這意味著每處理一筆資訊的成本降低了 35 倍。
Signal65 對 GB200 NVL72 進行了獨立測試,發現每瓦特處理的資訊量增加了 10 倍以上,成本降低到原來的十分之一。
改進持續進行中。僅 NVIDIA 的 TensorRT-LLM 函式庫升級就在四個月內為 GB200 帶來了五倍的效能提升,用於需要即時回應的任務。開發 Dynamo、Mooncake 和 SGLang 工具的團隊正在將效率推向更高。
這些 AI 工具如果出現延遲或無法記住足夠的情境就會失效。企業需要它們能在真實商業環境中實際運作,而不僅僅是展示。
能撰寫程式碼並充當數位助手的人工智慧工具,現在佔所有 AI 相關搜尋的近一半,而一年前僅佔 11%。
這些數據來自 OpenRouter 的推理狀態報告,顯示了這個領域變化的速度有多快。
這種突然的跳躍讓企業爭相建構能跟上的硬體。這些 AI 助手需要立即回應並記住整個軟體專案的情境,這對運算能力提出了嚴峻的要求。
市場爆炸性成長推動科技巨頭爭奪主導地位
涉及的金額龐大。AI 代理市場在 2024 年價值 49.2 億美元。預估 2025 年將達到 60.16 億美元,然後在 2035 年暴增到 449.7 億美元。未來十年每年成長 22.28%。銀行、醫院、商店和工廠是早期採用者。
企業正將這些代理整合到客戶管理系統、規劃工具和安全設定中,以節省成本並提高產能。最初是可選技術的東西正在成為基礎設施。
據 Cryptopolitan 報導,阿里巴巴剛推出針對中國市場的 Qwen3.5,聲稱處理成本降低了 60%。該模型可以查看螢幕並跨手機和電腦執行任務。它正與字節跳動的豆包應用程式正面競爭,DeepSeek 更新也即將推出。
OpenAI 在 15 日聘請了 Peter Steinberger。他建構了開源 AI 代理 OpenClaw。執行長 Sam Altman 表示,Steinberger 將領導下一代個人代理的工作,並稱他是天才,對能完成有用工作的智慧助手有很棒的想法。
無人能解決的人才危機
94% 的企業領導者表示他們缺乏 AI 技能。到 2028 年,44% 預計仍會有 20% 到 40% 的短缺。Workera 表示,由於產品延遲、品質問題和銷售損失,這些缺口可能在 2026 年讓全球經濟損失 5.5 兆美元。
目前全球 AI 人才需求與供給的比例為 3.2 比 1。AI 工作的薪資比一般軟體職位高出 67%。然而 85% 的辦公室工作者在業餘時間學習這些知識,83% 表示他們主要是自學而非接受正式培訓。
當企業從專業供應商購買 AI 工具時,成功率為 67%。內部建構的成功率只有約三分之一。
Salesforce 在 2025 年初的代理成長率達到 119%,這些產品的經常性收入突破 5 億美元。他們在三個月內增加了 6,000 家企業客戶。
企業可能會選擇購買解決方案而非自行建構。這指向市場將集中在少數幾個能提供實際有效方案的大型業者身上。
來源: https://www.cryptopolitan.com/nvidia-new-chips-to-cut-costs-by-35x/


