xAI は 2026 年 5 月 29 日、エージェント型コーディング専用モデル Grok Build 0.1 を API 公開ベータとして提供開始しました。同社の Grok シリーズが「会話するチャットアシスタント」から「自律的にコードを書き終えるエージェント」へと舵を切る大型ローンチで、CLI 版は 2 週間先行する 5 月 14 日にプライベートベータが配布されていた経緯があります。本稿では仕様・価格・競合との立ち位置を整理します。
Grok Build 0.1 とは何か
xAI が「agentic coding 専用」と明言する最初のモデルです。設計思想はシンプルで、1 つのプロンプトから自律的にタスクを最後までやり切る こと。Web 開発、デバッグ、リポジトリ全体のリファクタリングといった「ワンショット会話では収まらない作業」を、自前のツール呼び出しと継続ループで完遂させます。MCP(Model Context Protocol)にも対応しており、外部ツール・データソースとの接続性も確保されています。
汎用チャットモデルではなく 「コード書きに極振りした派生モデル」 という位置付けが特徴。一般用途のチャットでは Grok 4.20 系を、コーディング業務では Grok Build を、というラインアップ分業が xAI のロードマップとして見え始めました。
価格・性能:「速くて安いコード専用機」

API ベータ時点のスペックは次のとおりです。
| 項目 | 値 |
|---|---|
| 速度 | 100+ tokens/秒 |
| 価格(入力) | $1 / 1M tokens |
| 価格(出力) | $2 / 1M tokens |
| コンテキスト | 256,000 トークン |
| 入力モダリティ | テキスト + 画像 |
| サブエージェント | 単一プロンプトで最大 8 並列 |
注目すべきは 価格設定の安さ。Claude Opus 4.8 が入力 $5 / 出力 $25 で攻めの価格ながら、Grok Build 0.1 は その 1/5 〜 1/12 という水準で、しかも 100tok/s 級のスループットを謳います。「コードを書き続けさせる」ような長時間ジョブ・夜間バッチで顕著な差が出る価格帯です。
サブエージェント・MCP・継続ループ

Grok Build 0.1 の中核機能は、ひとつのプロンプトから 最大 8 個のサブエージェントを生成し、それぞれを別ブランチに割り当てて並列作業させる 機構です。Anthropic の Claude Code が同時期に「数十〜数百並列」を打ち出しているのに対し、xAI は 「8 個まで・1 シェル内で完結」 という設計で堅実路線を選んだ印象です。
具体的なユースケース:
- 大規模リポジトリの依存関係調査と並列リファクタリング
- フロントエンドの複数コンポーネントを別々のサブエージェントが同時並列に実装
- バックエンド API のテスト網羅率を 1 サブエージェントが調査、別 1 サブエージェントが追加テスト記述
継続ループ(continuous loop)はタスクが完了するまでモデル側が判断して反復実行する仕組みで、ユーザーが「合格」を出さなくても自走します。
CLI・アクセス方法
ベータ提供は次の 2 経路です:
- API:
console.x.aiから API キーを取得し、grok-build-0-1を指定して呼び出し - CLI: 別途配布されている
grok-buildコマンドからローカル端末で利用
CLI 版は Plan Mode や Headless CI モードを備え、CI/CD パイプラインに差し込んで「PR を自動で立てる」運用も可能。Mervin Praison のレビュー記事ではターミナル内での実行例が紹介されており、Claude Code と同様の DX が整いつつあります。
サブスクリプション側では SuperGrok / X Premium Plus にバンドル提供され、より深いエージェント機能は SuperGrok Heavy(月 $300) で開放される構成。
Claude Code・Codex との競合比較
2026 年 6 月時点で並ぶエージェント型コーディングツールの位置関係は次のとおり整理できます。
| 製品 | 並列性 | コンテキスト | 価格(入/出) | 特徴 |
|---|---|---|---|---|
| Claude Code (Opus 4.8) | 数十〜数百 | 1M | $5 / $25 | 動的ワークフロー、Plugins |
| Grok Build 0.1 | 最大 8 | 256K | $1 / $2 | 高速・低価格・MCP |
| GitHub Copilot CLI | 1 | – | サブスク | エコシステム統合 |
Claude Code が「最大限の並列性と巨大コンテキスト」で攻める一方、Grok Build は コストと速度を武器に、規模はそこそこでよい中小タスクや CI 自動化に刺さりそうです。
個人開発者目線の使いどころ
- 夜間バッチで自動修正・テスト生成: 安価なため、長時間走らせる前提のジョブと相性が良い
- MCP で社内ツール・データに接続したコード生成: チャット系より「実装最後までやり切る」志向
- 無料・低額サブスクユーザーの初期エージェント体験: SuperGrok バンドルで触りやすい
ベータ段階のため不安定さは残るものの、「コーディングタスクのコストを 1 桁下げる」 という競合へのプレッシャーは強烈です。Claude / OpenAI 一強の構図に xAI が改めて切り込んできたローンチと言えるでしょう。
コスト試算:Claude Opus 4.8 と比べてどれくらい安いのか
「夜間に 10 万トークンのコード修正ジョブを 1 回走らせる」想定でざっくり比較すると、入出力比 1:1 を仮定したとき:
- Claude Opus 4.8: 入力 $0.50 + 出力 $2.50 = $3.00 / ジョブ
- Grok Build 0.1: 入力 $0.10 + 出力 $0.20 = $0.30 / ジョブ
約 10 倍の差です。月 30 ジョブを走らせるなら $90 → $9 と桁が変わります。もちろん品質差・並列度の制約があるため単純比較はできませんが、「規模はそこそこで頻度を上げたい」用途では Grok Build が圧倒的に有利な価格レンジに位置していることが分かります。
既知の制限とアンチパターン
公開ベータ時点で押さえておくべき制限事項は次のとおりです。
- 並列上限が 8 サブエージェント: 大規模リポジトリ全体監査のような用途では足りない場面がある
- コンテキスト 256K: Claude Opus 4.8 の 1M と比較すると見劣り。巨大モノレポの全体把握には向かない
- ベータゆえの API 変更リスク: GA 前のためメソッド名・パラメータが変わる可能性あり
- 日本語ドキュメントが少ない: 一次情報は英語が中心、コミュニティ側の和訳に当面依存
逆に 「中規模リポジトリ ×頻繁な小タスク」 であれば、現時点でもメイン採用に耐える完成度。GA に向けたロードマップでは並列上限引き上げと長コンテキスト対応が示唆されており、向こう半年で評価が大きく変わるカテゴリです。

