xAI が Grok 4.3 をリリース、入力トークン料金は前世代比で40%削減、出力は60%削減、さらに120秒で音声を複製できるカスタムボイス音声キットも同時発表。 (前提:イーロン・マスク「地表最強AI」Grok 3 無料公開:サーバーダウンまで!(解説付き)) (補足:xAI共同創設者が次々と離脱!マスクが公開謝罪:「初期の会社に問題があり、多くの人材が面接すら受けていなかった」) 毎回推論ステップを省かずに考えること、これがGrok 4.3の製品ロジックの核です。xAIはこの設計を「Always-on reasoning(常時推論)」と呼び、問題の難易度に関わらず、モデルは回答前に強制的に推論プロセスを実行し、これをオフにできない仕組みです。知識のカットオフは2025年12月ですが、内蔵のウェブ検索とX検索でリアルタイム情報を補完可能です。> Grok https://t.co/NI6rEuwIKK > > — Elon Musk (@elonmusk) 2026年5月1日### 価格引き下げと競合ポジションGrok 4.3のAPI価格は入力$1.25、出力$2.50(100万トークンあたり、20万トークン未満)、合計$3.75。前世代のGrok 4.2の$2(入力)と$6(出力)と比べて、入力コストは37.5%削減、出力は58%削減、全体の値下げ幅は主流モデルの中でも顕著です。Abacus AIのCEO、Bindu ReddyはX上で次のように述べています:「Sonnet 4.6と同じくらい賢いが、5倍速く、5倍安い。」> Grok 4.3が本日リリース 🚀 > > それはSonnet 4.6と同じくらい賢く、5倍速く、5倍安い > > Geminiモデルも近日登場 > > — Bindu Reddy (@bindureddy) 2026年5月1日### カスタムボイス:120秒で音声クローン作成Grok 4.3と同期してリリースされたカスタムボイス音声キットの最大の特徴は、複製のハードルが低いことです。120秒の音声サンプルを提供すれば、システムは2分以内に音声モデルを構築し、発音や話し方のパターンも学習します。音色だけでなく、話し方の癖やトーンも再現可能です。TTSサービスはEve、Ara、Rex、Sal、Leoの5種類の内蔵音声を提供し、料金は$4.20/百万文字。音声認識(STT)のストリーミングは$0.20/時間、バッチ処理は$0.10/時間。カスタム音声APIエンドポイントは現状Enterpriseプランのみ対応。各チームは最大30の音声IDを作成可能で、SOC 2 Type II、HIPAA、GDPRに準拠しています。現時点では米国内のみ提供され、イリノイ州は生体認証プライバシー法のため除外されています。
xAI が Grok 4.3 をリリース:強制推論と価格交渉を主打、60%削減で市場に参入
xAI が Grok 4.3 をリリース、入力トークン料金は前世代比で40%削減、出力は60%削減、さらに120秒で音声を複製できるカスタムボイス音声キットも同時発表。
(前提:イーロン・マスク「地表最強AI」Grok 3 無料公開:サーバーダウンまで!(解説付き))
(補足:xAI共同創設者が次々と離脱!マスクが公開謝罪:「初期の会社に問題があり、多くの人材が面接すら受けていなかった」)
毎回推論ステップを省かずに考えること、これがGrok 4.3の製品ロジックの核です。xAIはこの設計を「Always-on reasoning(常時推論)」と呼び、問題の難易度に関わらず、モデルは回答前に強制的に推論プロセスを実行し、これをオフにできない仕組みです。
知識のカットオフは2025年12月ですが、内蔵のウェブ検索とX検索でリアルタイム情報を補完可能です。
価格引き下げと競合ポジション
Grok 4.3のAPI価格は入力$1.25、出力$2.50(100万トークンあたり、20万トークン未満)、合計$3.75。前世代のGrok 4.2の$2(入力)と$6(出力)と比べて、入力コストは37.5%削減、出力は58%削減、全体の値下げ幅は主流モデルの中でも顕著です。
Abacus AIのCEO、Bindu ReddyはX上で次のように述べています:「Sonnet 4.6と同じくらい賢いが、5倍速く、5倍安い。」
カスタムボイス:120秒で音声クローン作成
Grok 4.3と同期してリリースされたカスタムボイス音声キットの最大の特徴は、複製のハードルが低いことです。120秒の音声サンプルを提供すれば、システムは2分以内に音声モデルを構築し、発音や話し方のパターンも学習します。音色だけでなく、話し方の癖やトーンも再現可能です。
TTSサービスはEve、Ara、Rex、Sal、Leoの5種類の内蔵音声を提供し、料金は$4.20/百万文字。音声認識(STT)のストリーミングは$0.20/時間、バッチ処理は$0.10/時間。
カスタム音声APIエンドポイントは現状Enterpriseプランのみ対応。各チームは最大30の音声IDを作成可能で、SOC 2 Type II、HIPAA、GDPRに準拠しています。現時点では米国内のみ提供され、イリノイ州は生体認証プライバシー法のため除外されています。