NVIDIAは最新のGB300 NVL72システムをリリースしました。旧世代のHopperプラットフォームと比較して、1メガワットの電力あたり50倍の作業を処理できます。つまり、処理される情報1つあたりのコストが35分の1に削減されます。
Signal65はGB200 NVL72について個別にテストを行い、1ワットあたり10倍以上の情報を処理し、コストを10分の1に削減できることを発見しました。
改善は続いています。NVIDIAのTensorRT-LLMライブラリのアップグレードだけで、即座の応答を必要とするタスクにおいて、わずか4か月でGB200のパフォーマンスが5倍向上しました。Dynamo、Mooncake、SGLangツールに取り組むチームは、効率をさらに高めています。
これらのAIツールは、遅延時間があったり、十分なコンテキストを記憶できない場合に機能しなくなります。企業は、デモだけでなく、実際のビジネス状況で機能するツールを必要としています。
コードを書いたり、デジタルヘルパーとして機能する人工知能ツールは、現在AI関連検索のほぼ半分を占めており、1年前のわずか11%から増加しています。
この数字はOpenRouterのState of Inferenceレポートから得られたもので、この分野の変化の速さを示しています。
この急激な増加により、企業は追いつくためのハードウェア構築に奔走しています。これらのAIアシスタントは即座に応答し、ソフトウェアプロジェクト全体からのコンテキストを記憶する必要があり、これが計算能力に深刻な要求を課しています。
市場の爆発的成長がテクノロジー大手の覇権争いを加速
関わる金額は巨額です。AIエージェント市場は2024年に49.2億ドルの価値がありました。2025年には60.16億ドル、2035年には449.7億ドルに膨れ上がると推定されています。これは今後10年間、毎年22.28%の成長率です。銀行、病院、店舗、工場が早期導入者です。
企業はこれらのエージェントを顧客管理システム、計画ツール、セキュリティ設定に導入し、コストを削減し、より多くのことを達成しています。オプションの技術として始まったものが、基本的なインフラになりつつあります。
Cryptopolitanの報告によると、Alibabaは中国市場をターゲットにQwen3.5をリリースし、以前より60%低い処理コストを主張しています。このモデルは画面を見て、スマートフォンやコンピューター全体でタスクを実行できます。ByteDanceのDoubaoアプリと真っ向から対決しており、DeepSeekのアップデートも予定されています。
OpenAIは15日にPeter Steinbergerを雇用しました。彼はオープンソースのAIエージェントであるOpenClawを構築しました。CEOのSam AltmanはSteinbergerが次世代のパーソナルエージェントの開発を主導すると述べ、彼を有用なことを成し遂げるスマートアシスタントについて素晴らしいアイデアを持つ天才と呼びました。
誰も解決できない人材危機
ビジネスリーダーの94%がAIスキルが不足していると述べています。2028年までに、44%が依然として20〜40%の不足があると予想しています。Workeraは、これらのギャップが製品の遅延、品質問題、販売損失により、2026年に世界経済に5.5兆ドルのコストをもたらす可能性があると述べています。
現在、世界中でAI人材の需要は供給を3.2対1で上回っています。AIの仕事は通常のソフトウェアの職位より67%高い報酬を支払います。しかし、オフィスワーカーの85%が自分の時間でこの分野について学んでおり、83%が正式なトレーニングを受ける代わりに主に独学していると述べています。
企業が専門ベンダーからAIツールを購入する場合、67%の確率で成功します。内部構築は約3分の1の頻度でしか機能しません。
Salesforceは2025年初頭にエージェントが119%成長し、これらの製品の定期的な収益が5億ドルを超えました。3か月で6,000のエンタープライズ顧客を追加しました。
企業はおそらくソリューションを構築するのではなく購入するでしょう。これは、実際に機能するものを提供できる少数の大手プレーヤーに市場が集中することを示しています。
出典: https://www.cryptopolitan.com/nvidia-new-chips-to-cut-costs-by-35x/


