torygreen

vip
期間 2.8 年
ピーク時のランク 0
現在、コンテンツはありません
推論の数値を調べていると、ある統計が繰り返し浮かび上がってくる。
2026年にはAI推論の70%がエッジで実行される。ハイパースケールデータセンターではなく、AWS上でもない。産業用システム、自律型機器、接続デバイス上で動作し、クラウドサーバーへの往復はレイテンシ問題ではなく、障害モードとなる。
1060億ドルの推論市場が成長しているのは、人々がAIに「チャット」クエリを増やしているからではない。成長の理由は、AIが継続的に稼働し、信頼性の高いネットワークがない環境で動作し、待つことが許されない物理インフラに組み込まれているからだ。
ハイパースケーラーの構築は現実だ。7250億ドルの設備投資コミットメントも現実だ。それは単に30%に向けられているだけだ。
原文表示
  • 報酬
  • コメント
  • リポスト
  • 共有
物理的なテクノロジーに近いことは、実際にそれを採用することとはほとんど関係がないようだ。
カリフォルニアには、重要な最先端AIラボがすべて存在する。ニューヨークは他のどの州よりも多くのフォーチュン500企業を抱える。しかし、両州ともコロラドに追い抜かれた。コロラドは業務におけるAI導入率23.2%に達したのに対し、ニューヨークは13.8%だった。
コロラドとアリゾナが持っているのは、より優れたインフラや人材ではない。業界が安全だと合図する前に動く意欲だ。テクノロジーに最も近い州は、しばしばそれを導入するのが最も遅い。なぜなら、現状の仕組みに最も多くの投資をしているからだ。
2026年になっても、アメリカの企業の4分の3はまだAIを有意義な形で活用しておらず、AIが経済を再形成するという見出しはすべて、77%の企業がまだ参入していない世界を描写している。
モデルは毎月改善され、安くなっているにもかかわらず、それは依然として流通の問題に行き着く。そして流通を解決する層は、製品を構築した層ではない。
原文表示
post-image
  • 報酬
  • コメント
  • リポスト
  • 共有
理論上は、AIのコストは今頃崩壊しているはずだ。
同じフロンティアレベルのタスクで、2023年のGPT-4発売時に100万トークンあたり30ドルかかったものが、現在GPT-5では1.25ドルになっている。名前のついたモデルで公表価格を見ると、3年間で96分の1の下落だ。
通常の法則では、企業のAI請求額は急落しているはずだ。その代わり、フォーチュン500の平均AI予算は、2024年の$7M から2026年の$19M へと増加した。2つの予算サイクルで約3倍だ。
その理由:安いトークンは節約されず、武器化される。チャットボットは一度トークンを発射して停止する。実際の作業を行うエージェントは、同じタスクで5~30倍多く実行し、推論がそれほど安くなれば、あらゆるものにそれを向ける。価格が下がるたびに、節約する以上に使用量が増える。
コストセンターは縮小しなかった。モデル層からその下のインフラ層に移動した。そこに本当の請求額が書かれており、ほとんどの企業はまだそれを見ていない。
原文表示
post-image
  • 報酬
  • コメント
  • リポスト
  • 共有
今年、AIコンピュートに静かな反転が起き、それが実際の構築の目的を変えている。
2023年には、AIコンピュートの3分の2がトレーニング、つまりモデルを構築する実際の作業に使われていた。残りの小さな部分は推論、つまり構築後に実際にモデルを実行する作業に充てられていた。しかし、その比率は静かに逆転し始めた。
Deloitteによると、推論は現在3分の2を占め、さらに上昇しており、それを実行するために構築されたチップは今年$50B を超えた。
この反転が重要な主な理由(パーセンテージの問題ではない)は、トレーニングと推論は異なる性質を持つということだ。トレーニングはバースト的に発生し、1つの巨大なクラスターで行われ、その後終了する。推論は決して止まらない。誰かがプロンプトを送信したり、エージェントが一歩を踏み出すたびに実行され、ユーザーを追加するたびにスケールする。一方は建設プロジェクトであり、もう一方は永遠に増え続ける公共料金のようなものだ。
AIインフラに関するあらゆる前提はトレーニングを中心に構築されていた。なぜなら、そこにお金が流れていたからだ。そのお金は今、単一のクラスターに置く必要のないワークロードに移動したのだ。
原文表示
post-image
  • 報酬
  • コメント
  • リポスト
  • 共有
2年前、このチャート上のオープンモデルは最下位に近い位置にあったでしょう。クローズドラボは数世代先を行っており、その差こそが人々がモデルを所有する代わりにレンタルする理由のすべてでした。
今、GLM-5.2は@ArtificialAnlysインデックスで51位に位置しています。
オープンウェイト、中国のラボ、全体で5位。そしてFableは利用不可のためリストから除外すると、オープンウェイトモデルはそのランキングが示すよりもはるかにトップに近いです。
クローズドの売りは常にリードでした。APIを支払い、条件を受け入れ、自分でコントロールできないものの上に構築する。モデルが十分に先を行っているから価値があるのです。そのリードは今やわずか数ポイントとなり、GLMはNvidiaチップのカットオフリストに載りながらそこに到達したことは、さらに印象的です。
プレミアムはそのギャップに対して価格設定されていました。ギャップはほぼなくなったのに、プレミアムは動いていません。
1年後、私たちがどこにいるのかを見るのが楽しみです。
GLM2.56%
原文表示
  • 報酬
  • コメント
  • リポスト
  • 共有
AIコンピューティングにおいて、多くの人が正しく読み取れていない分割点がある。
フロンティアトレーニングは四半期ごとに集中度を増しており、数千のGPUが一か所に配置され、配線で結ばれている。しかし、トレーニングは2026年の需要のわずか30%に過ぎない。残りの70%は推論であり、それをハイパースケーラーで実行することは、最も負荷の高いワークロード向けに構築されたインフラを、最も簡単なワークロードのために支払うことを意味する。
分散ネットワーク上では、同じ推論が45~75%安く実行できる可能性があり、AIインフラの予算を策定する人にとって、その差こそがすべてを物語っている。
トレーニングは必然的に集中化する。推論は断片化する。なぜなら、Amazon Web Services(AWS)のマージンを必要としないワークロードに対して、そのマージンを支払うことが、規模が大きくなるにつれて意味をなさなくなるからだ。
原文表示
post-image
  • 報酬
  • コメント
  • リポスト
  • 共有
最近のGLM 5.2のニュースと、みんなが持ち出すオープンウェイトの角度について考えていたが、彼らはまったく別の角度を見逃している。
誰もが、中国の研究所がフロンティアレベルのパフォーマンスを達成し、それをオープンソース化したという事実に注目しているが、注目すべきはその方法だ。ZAIとその他の中国の研究所は2025年初頭にNvidiaから遮断されたため、それ以来H100やH200は直接入手できなかったと推定される。
彼らは $128B を超えた。おそらく中国製シリコンでトレーニングされたモデルが、フロンティアに数ポイント差で迫っている。
輸出管理は中国を減速させることを意図していた。実際には、競争をチップではなく電力に移行させた。中国が余剰に持つ唯一のインプットだ。1年間で543GWの容量が追加され、インドの全送電網より大きい。
2021年以来、中国は米国の全送電網が保持する量を超える新規電力を追加した。一方、米国の送電網はAI需要の下ですでにひっ迫している。
シリコンを制限することはできる。電力を制限することはできない。そして、制約を受けた側がオープンウェイトを出し続ける限り、業界全体がその恩恵を継承する。
GLM2.56%
原文表示
  • 報酬
  • コメント
  • リポスト
  • 共有
今、企業のGPU容量の95%が使われずに座っている。
その数字は、一般的な調査ではなく、Cast AIが23,000の実際の運用クラスターを測定した結果から得られたものだ。
平均利用率は5%であり、NvidiaがH200の価格を15%引き上げたちょうどその瞬間に起こっている。これは20年ぶりの初めての値上げだ。誰もが不足していると言うハードウェアのほとんどは、ほとんど何もしていない。
もし、なぜ計算資源を入手するのが難しいと感じるのかを理解しようとしているなら、これがその理由だ。誰も数ヶ月待った割り当てを返さない。だから、フリートは5%のままで、時間単位で請求され、希少性が自己増殖している。これは供給の失敗ではなく、調整の失敗のようだ。
原文表示
post-image
  • 報酬
  • コメント
  • リポスト
  • 共有
いくつかの大きなEUのAI政策の動きが報じられているが、彼らが取り組んでいるインフラの現実はこうだ。
> EUの主権AIインフラへの2026年の支出額:126億ドル。
> 同じ年の米国ハイパースケーラーの資本支出:7250億ドル。
ヨーロッパは6年間で19のAIファクトリーと14のスーパーコンピューターを構築したが、今年だけでアマゾンだけがその全努力を2週間で超える支出をする。
ほとんどのヨーロッパのAIチームはヨーロッパのインフラを使わず、バージニアやアイオワからレンタルし、GDPR準拠のプレミアムをハイパースケーラーのマージンに上乗せして支払っている。新しいNvidiaハードウェアは米東部から3〜6ヶ月遅れてEUのデータセンターに到達する。大陸は、設計しないチップに構造的に依存し、制御しないファブで製造され、まず自国市場を優先する企業によって割り当てられている。
もう一つの天井は電力網だ。アイルランドのデータセンターはすでに国内電力の22%を消費している。EUの空き容量は年末までに6.5%に圧縮される。
政策発表だけでは57倍のギャップを埋められない。計算資源はすでに38か国にまたがって存在している。問題は、それが何か有効に接続されていないことだ。
原文表示
post-image
  • 報酬
  • コメント
  • リポスト
  • 共有
今年この数字が現れるとは思いませんでした。
GitHubは2026年までに140億回のコミットを達成する見込みです。これは2025年の10億から大きく増加しています。たった1年で14倍の増加で、そのほとんどは人間がコードを書いているわけではありません。
負荷が非常に高まったため、地球上で2番目に大きなクラウドを所有・運営するMicrosoftは、プラットフォームをオンラインに保つためにAWSを経由してトラフィックをルーティングしなければなりませんでした。5月だけで9件のサービス障害が発生し、可用性は88.4%に低下しました。
すべてのエンジニアリングチーム、インフラベンダー、クラウドプロバイダーにとって、人間の速度での開発のために容量を調整している基準値は、桁違いに動いたのです。
原文表示
post-image
  • 報酬
  • コメント
  • リポスト
  • 共有
Nvidiaの収益は、「エージェント的計算」が理論ではない証拠です。すでに損益計算書に記載されています。
$26B 4年前。昨年は2,159億ドル。ほとんどのAIがまだチャットボックスに座っていて、あなたが質問をするのを待っている間に、その8倍になったのです。
重要なのは成長だけではありません。Nvidiaがそのアーキテクチャをほぼすべての他者のロードマップにとって交渉不可能な入力に変えたことです。ラボ、クラウド、企業。APIのロゴは異なるが、下層のシリコンは同じです。このサイクルでAIインフラに費やされたほぼすべてのドルが、彼らのスタックのどこかに漏れています。
今、Jensenの主張を考えてみてください。エージェント的AIは生成AIの約10倍の計算能力を必要とする、と。それは誇張ではなく、配線です。チャットボットは一つの前方パスとアイドル状態です。計画し、実行し、自分の作業をチェックし、複数ステップの仕事をリトライするエージェントは、単一の結果のために何十、何百ものパスを行います。「オフ」スイッチはありません。作業は止まらないからです。
エンタープライズAIは今日約8%の浸透率で、2032年までに約67%に達すると予測されています。その曲線の各パーセンテージポイントは、さらに84億ドルのインフラ需要を意味します。
トレーニングはモデルを構築しました。推論はそれらをAPIの背後に
原文表示
post-image
  • 報酬
  • コメント
  • リポスト
  • 共有
私はゴールドマンの5年分の数字がこれほど大きいとは思わなかった。
5つのハイパースケーラーは、2025年から2030年の間にAIインフラに5.3兆ドルを投資する見込みだ。2022年には合計で$162B を費やした。
今年は7,250億ドルの見込みだ。2027年までに、アナリストは1兆ドルに達すると予測している。
これらの5つのバランスシート以外でAI製品やインフラを構築している人にとって、この軌道は計画の前提で最も重要な数字だ。
彼らが展開できるものと、他のすべてがアクセスできるものとの間のギャップは、この継続期間ごとに増大していく。
原文表示
  • 報酬
  • コメント
  • リポスト
  • 共有
誰もがAIが最初に反復的な管理作業を引き継ぐと予測していた。データは異なることを示している。
意思決定は現在、職場のAI活動の28%を占めている。最も一般的な用途は自動化ではなく、判断である。
人々はAIを使って選択肢を分析し、トレードオフを評価し、自分が責任を持つ結論をサポートしている。そして、その変化は労働市場の問題を超えて重要となる。
判断に基づく作業負荷は継続的に行われ、1回のセッションあたりのコンテキストが多く必要であり、効率的にバッチ処理できない。
一日中意思決定を支援するAIのインフラ要件は、メールの下書きを行うAIのインフラとは全く異なる。
原文表示
post-image
  • 報酬
  • 1
  • リポスト
  • 共有
Millionairetasks:
皆さんにとって素晴らしいチャンスです
グローバルクラウドインフラストラクチャ2026年第1四半期。 1,290億ドルを単一四半期で達成。前年比35%の成長。
市場は急速に拡大しているが、集中度は変わっていない。AWS、Azure、Google Cloudは2年前とほぼ同じシェアを保持しているが、それらと他のすべての差は、ドル換算でこれまでで最も広くなっている。
それがパーセンテージチャートに示されていない部分だ。その他の部分は、実際の代替案に成長していない。比率は同じままで、3つのハイパースケーラーが毎四半期で数十億ドルの絶対収益を追加している。
異なる分布が出現するためのウィンドウは、広がっていない。
原文表示
post-image
  • 報酬
  • コメント
  • リポスト
  • 共有
PJMはアメリカ合衆国の13州と6500万人の人々に電力網を運営しています。これは世界最大の競争的卸売電力市場です。
その容量市場のクリア価格、将来の電力供給が需要を満たせるかどうかを示すレートは、2024年の28.92ドル/MWから2026年には329.17ドルに上昇しました。2つのオークションサイクル。
データセンターの需要が主な推進力として特定されています。2027/2028年のオークションはわずかに333.44ドルでクリアし、PJMは直接的に5,100 MWの負荷増加をデータセンターに帰属させています。
それは供給ショックや地政学的な出来事ではありません。AIの展開が、それに対応できない電力網に影響を与えているのです。
新しい施設を電力網に接続するには、ほとんどの地域で4年から10年かかります。施設の建設には2年から3年。
そのギャップに捕らわれたすべてのプロジェクトは、市場がクリアする価格を支払うことになります、その間待ちながら。
計算能力は整っています。電力が整っていないのです。
原文表示
post-image
  • 報酬
  • 2
  • リポスト
  • 共有
DiveNate:
2026 GOGOGO 👊
もっと見る
このチャートから2つの数字。
AI APIの価格:2022年以来96%下落。
ハイパースケーラーの資本支出:同じ期間に12倍増加。
ほとんどの人は最初の数字を見て、それを民主化と呼ぶが、二つ目の数字を軸に戦略を立てている人は誰もいない。
それは偶然ではない。それは構造的なキャプチャの戦略だ。
安価なモデルを祝うすべてのAIスタートアップは、自分たちが所有しない計算資源上で動いており、再現できないインフラ上で動いており、三つの企業によってコントロールされている。
ソブリンAIはソブリンインフラストラクチャから始まる。その他はすべて、より良い価格の依存関係に過ぎない。
原文表示
post-image
  • 報酬
  • 1
  • リポスト
  • 共有
Yuhuan:
gsgsgshsokzkzkzkxhxj
金曜日に明らかになったことは、政府がAIモデルを停止させることができるということではない。
それは、世界で最も能力の高いモデルの全世界のユーザーベースが、単一の企業の単一の運用決定の背後にあるということだ。警告や冗長性はない。
現在、最大手のAI企業3社が最先端のAIアクセスの88%を管理し、それに対するコンプライアンスの唯一の窓口となっている。
金曜日に明らかになったのは、計算資源とモデルアクセスが少数の企業の中に収まっているとき、全体のシステムが彼らの単一障害点を引き継ぐということだ。これは中央集権型AIに反対する議論ではない。両方のモデルが存在する必要がある。
しかし、分散型インフラが中央集権的なプロバイダーと並行して動作する世界は、そうでない世界とは構造的に異なる。
分散型計算には一つのコンプライアンス窓口がない。すべてを一度にオフラインにする単一の手紙は存在しない。これこそが今すぐに構築する必要があるアーキテクチャの部分だ。
原文表示
post-image
  • 報酬
  • コメント
  • リポスト
  • 共有
2024年、AI計算マップには二つの超大国があった。アメリカは53.7 GW、中国は31.9 GW。
2026年、中国は2.5 GWになっている。
これは輸出政策を通じた国家のAIインフラ容量の制御された破壊である。爆弾も制裁もなく、チップ規制だけだ。
これが証明しているのは、計算能力が今や地政学的兵器であるということだ。自国のインフラを所有していない国は、その兵器の受け手になるのがどんなものか知りたくない。
問題は分散型計算が勝つかどうかではない。それが次の政策決定によって地図が再構築される前に到達するかどうかだ。
原文表示
post-image
  • 報酬
  • コメント
  • リポスト
  • 共有
2000年代最大のテックIPOはビザの280億ドルでした。
2010年代最大はアリババの1680億ドルでした。
およそ10年ごとに6倍です。
今、ラインを延長します。OpenAIとAnthropicはそれぞれ$1T 上場前から位置しています。
過去25年間の最大のテックデビューを合計すると、アリババ、フェイスブック、ウーバー、リヴィアン、スノーフレイク、パランティア、セレブラズ、コアウィーブ、すべて含めて。
およそ8000億ドルになります。
OpenAI + Anthropicだけでほぼ2兆ドルの価値があります。まだ非公開です。
ウォール街の最大上場の25年分の2.5倍の規模です、合計で。
しかし最大の構造的な違いは、ビザやアリババ、その他のテック企業が既存のインフラ上で拡大したことです。
決済レール、インターネット普及率、物流、そしてそれらの評価は構築されたキャパシティを収益化しました。
これらのAIの評価は、まだ存在しないキャパシティを前提としています。
データセンター、電力、GPU供給はまだ資金調達と展開を待っています。
$2T の価値は、誰も完成させていないインフラに価格付けされています。
そのギャップこそがこの時代の決定的な経済的チャンスです。
価値はそれを埋める者に蓄積されます。
原文表示
  • 報酬
  • コメント
  • リポスト
  • 共有
歴史の大半において、資本は機械を通じて拡大してきた。
今や、それは認知を通じて拡大している。
スタートアップは、ほぼゼロの限界コストで並列に動作する100万人のアナリスト、研究者、コーダー、戦略家に相当するものを一晩で呼び起こすことができる。
AI革命は、これまでのいかなる技術革命とも異なるものである。
原文表示
  • 報酬
  • コメント
  • リポスト
  • 共有