2026年現在、AI開発を受託する会社は国内だけで数百社を超えました。大手SIerから生成AI専門のベンチャー、フリーランスまで選択肢が溢れています。一方、発注して失敗した企業の声も急増しています。「PoCで終わった」「納品物が使えなかった」「コストが青天井だった」。
この記事では、AI開発会社の選定基準を7つに絞って解説します。比較表・チェックリスト・契約の注意点も含めた、発注前に読むべきガイドです。
まず知るべき:AI開発会社の3分類
AI開発を外注する前に、「誰に頼むか」の選択肢を整理します。
大手SIer(NTTデータ・富士通・アクセンチュア等)
総合的なシステム開発の延長でAIを扱う分類です。数億円規模のプロジェクトや官公庁・基幹系との統合に強く、プロジェクト管理体制が整っておりリスクマネジメントに慣れています。ただし費用は高めで、小規模案件は引き受けないケースが多いという特性があります。
AI専門ベンダー(生成AI・LLM・機械学習専門)
AIそのものの設計・実装を主業務とする分類です。最新モデル(GPT-4o・Claude・Gemini等)の実装知見が豊富で、スタートアップが多くスピードと柔軟性があります。ただし会社規模が小さいため、体制の安定性・保守継続性の確認が必須です。
フリーランス・個人エンジニア
費用は最も安く、小規模なPoC・プロトタイプ向きです。本番環境の運用・保守が想定外のリスクになりやすく、1人に依存するため離脱リスクを事前に織り込む必要があります。
AI開発会社の選定基準7つ——具体的に何を見るか
基準①|同業界・同課題の実績があるか
「AI開発実績あり」は当然として、自社と同じ業界・同じ課題の実績があるかを確認します。
製造業の需要予測とEC向けレコメンドエンジンは、技術スタックも設計思想も違います。「実績豊富」と書いてあっても、自社と無関係な業種の案件ばかりの会社に頼むのはリスクです。
チェック方法としては、会社のケーススタディを読んで業種・課題・使用技術を確認すること、「自社と同じ課題に対して、何件手がけましたか?」と直接聞くこと、導入先企業の担当者に話を聞けるかどうかを確認すること(リファレンスチェック)が有効です。
基準②|PoCで終わらせない体制があるか
日本企業のAI導入においてPoC(概念実証)が本番稼働に至らないケースは依然として多いです。原因はベンダー側だけではありませんが、ベンダーが本番移行を想定した設計をしているかは会社選びで見抜けます。
確認すべき点は3つです。PoC終了後の「本番化フェーズ」の提案があるか、運用体制・運用コストの試算を出してくれるか、本番環境での技術的ボトルネック(データ量・既存システム連携・セキュリティ制約)を事前に議論してくれるかを見てください。
PoCが終わっても「次のフェーズは別途お見積もり」と毎回切り替えてくる会社は要注意です。
基準③|自社の技術スタックに合わせられるか
AIシステムは単独では動きません。既存のCRM・ERP・データウェアハウス・クラウド環境との統合が必ず必要になります。
AWSとGCPのどちらを使っているか、オンプレミスのシステムと連携するための実績があるか、社内データの形式(CSV・DB・API)に対してどう対応するかを確認してください。「うちはAI専門なのでインフラは別途調達すること」という会社では、後から統合コストが膨らみます。
基準④|AIエンジニアが社内にいるか、外注か
受注してから実際の開発をフリーランスにパスしているだけの「AI開発会社」が存在します。発注者が直接確認できる方法として、「開発担当のエンジニアと事前に話せるか?」と聞くことが有効です。技術的な質問(使用モデル・ファインチューニングの方針・評価方法等)を投げて即答できるかの確認と、GitHubや技術ブログなど実際の技術的アウトプットの確認も合わせて行ってください。
基準⑤|見積もりが「人月」だけで構成されていないか
AI開発の見積もりには、以下の要素が含まれるべきです:
| コスト項目 | 内容 |
|---|---|
| 要件定義・設計費 | 課題整理・システム設計にかかる工数 |
| データ整備費 | データ収集・クレンジング・アノテーション |
| 開発費 | モデル選定・実装・テスト |
| インフラ費 | クラウド・GPU・API利用料 |
| 運用・保守費 | モデル再学習・監視・サポート |
| ライセンス費 | 商用LLM利用料(OpenAI・Anthropic等) |
「人月×単価」だけで構成された見積もりは、実態が見えません。特にデータ整備とインフラ費は後から膨らみやすい項目です。最初から内訳を分けて提示してくれる会社を選んでください。
基準⑥|コミュニケーション頻度と報告体制が明確か
AI開発は不確実性が高く、「やってみたら想定と違った」が起きやすいです。そのときに、週次報告があるか・Slackや定例会で進捗を共有しているか・何かあったときの意思決定ラインが明確かが、プロジェクトの成否を大きく左右します。
契約前に週次・月次の報告フォーマットがあるか、進捗管理ツール(Notion・Jira等)での可視化があるか、技術的課題が出たときの対応フローを説明してもらうことを確認してください。
基準⑦|契約条件が明文化されているか
後述しますが、知的財産権の帰属・SLAの定義・保守範囲は契約書に書いてなければ存在しません。口頭での「大丈夫です」は信用しないでください。
「何から始めればいいかわからない」を解決します。 STANDXでは、業務課題の整理からAI導入の設計まで無料でご相談いただけます。サービス詳細を見る →
比較表:大手SIer vs AI専門ベンダー vs フリーランス
| 比較軸 | 大手SIer | AI専門ベンダー | フリーランス |
|---|---|---|---|
| 費用感 | 高い(数千万〜) | 中程度(100万〜) | 安い(50万〜) |
| AI専門性 | 中(汎用IT会社が多い) | 高 | 個人差大 |
| スピード | 遅い | 速い | 速いが不安定 |
| 保守継続性 | 高い | 中(会社規模による) | 低い |
| 向いているケース | 大規模・基幹系統合 | 中小規模・スタートアップ | PoC・プロトタイプ |
| 向いていないケース | 小規模・スピード重視 | 大規模基幹統合 | 本番運用・長期保守 |
どの分類を選ぶべきか:3つの判断軸
迷ったときはこの順番で判断します。
① 予算が3,000万円以上かつ既存基幹システムとの統合が必要 → 大手SIer セキュリティ要件が厳しい官公庁・金融・製造業の大規模案件はここ一択です。費用は高いですが、プロジェクト管理体制とリスクマネジメントが安定しています。
② 予算が100万〜3,000万円・スピードを重視・生成AIを活用したい → AI専門ベンダー ほとんどの中小規模案件はここが合います。生成AI(LLM・RAG等)を活用した業務自動化やチャットボット、需要予測システムなら、AI専門ベンダーの専門性と機動力が活きます。
③ 予算が100万円以下・まず試したい・本番運用はまだ先 → フリーランス PoCやプロトタイプのみに限ります。本番運用・長期保守が見えてきた時点で、ベンダーへの切り替えを計画しておきます。
見積もりの読み方——費用の内訳を分解する
AI開発の費用相場を規模別に整理します。
小規模(チャットボット・社内ツール) は相場100万〜300万円、期間1〜3ヶ月が目安です。社内FAQ Bot、メール自動分類などが典型例です。
中規模(業務プロセス自動化・レコメンド) は相場300万〜2,000万円、期間3〜9ヶ月です。需要予測、画像検査自動化などが含まれます。
大規模(基幹統合・専用LLM構築) は相場3,000万円〜、期間9ヶ月〜になります。企業専用モデルや全社DXプラットフォームがこれに当たります。
費用で最もトラブルになる3項目
① データ整備費の過少見積もり
「データはあります」という状態から、実際に使えるデータに整備するコストは想定外に大きいです。アノテーション(データのラベル付け)だけで数十万〜数百万円になるケースもあります。事前にデータ品質の診断を依頼し、整備コストを先に出してもらいます。
② 運用時のAPIコスト
GPT-4oやClaude APIを使う場合、利用量に応じてAPIコストが発生します。月あたりの想定コール数から試算し、運用費を契約前に確認します。「月額○円のAPI費用が別途かかります」が契約後に判明するのは痛いです。
③ モデル再学習・チューニングコスト
AIは一度作れば終わりではありません。データが増えたとき、精度が落ちたとき、新しいビジネスルールが追加されたとき——再学習と調整が必要になります。このコストを「保守費に含む」のか「都度見積もり」なのかを明確にしておきます。
AI開発会社の外注で失敗するパターン5つ
AI導入で失敗した企業に共通するパターンを整理しました。詳細はAI導入失敗事例の記事でも解説しています。
パターン①|「AI導入実績○社」だけで選ぶ
社数は関係ありません。1社の深い実績のほうが、100社の浅い実績より信頼できます。「どういう課題をどう解決したか」を具体的に聞きます。
パターン②|提案資料の豪華さで判断する
大手コンサルや有名企業の提案書は美しいです。ただし「誰が実際に開発するのか」「どんな技術者が担当するのか」を商談時に直接確認してください。パートナー会社へ丸投げする体制になっていないかを確認します。
パターン③|PoC費用だけで比較する
PoC費用が安くても、本番化で10倍のコストがかかる設計になっている場合があります。最初からトータルコスト(PoC+本番化+運用2年分)で比較します。
パターン④|課題を曖昧なまま発注する
「AIを使って業務を効率化したい」という丸投げ発注は失敗の元です。何を解決したいのか、現状の業務フローはどうなっているか、成功の定義は何かを自社で整理してから発注します。
パターン⑤|戦略・企画ごと外注する
どんな業務にAIを使うか、ROIをどう設計するか——これは発注者側が決めることです。AIの戦略設計まで丸投げすると、ベンダーの得意技術に寄せた提案しか返ってきません。
AI導入費用の全体像については、AI導入費用ガイドも参照してください。
契約時の注意点:知財・SLA・保守
知的財産権の帰属
AI開発契約で最もトラブルになりやすい論点の一つが知的財産権の帰属です。経済産業省の「AI・データの利用に関する契約ガイドライン」では、以下の6つを個別に扱うことを推奨しています:
- 生データ(学習に使う元のデータ)
- 学習用データセット(整備・加工後のデータ)
- 学習用プログラム(学習を実行するコード)
- 学習済みモデル(完成したAIモデル)
- 学習済みパラメータ(重みデータ)
- ノウハウ(設計・チューニングの方法論)
特に「学習済みモデルが自社資産になるのか、ベンダーのものになるのか」は明示的に契約に書かなければ、グレーのまま残ります。「成果物は全て甲に帰属」という一文では不十分なケースもあります。
SLA(サービスレベル合意)
SLAは「契約書と別に書類を渡された」だけでは法的拘束力がない場合があります。SLAが契約書と紐づいているか、稼働率・応答時間・障害時の対応時間が定量的に書かれているか、SLAを下回った場合のペナルティ(減額・クレジット等)が明記されているかを必ず確認してください。
保守・運用の範囲
「保守費月額○○円」という費用だけでは不十分です。バグ修正が含まれるか、モデルの精度劣化時の再学習は含まれるか、新しいビジネスルール追加への対応はどうなるか、障害発生時の対応時間・連絡体制はどうなっているかを必ず確認してください。
保守範囲が「基本的なサポート」としか書かれていない契約書はやり直しを要求します。
データの取り扱いとセキュリティ
AIシステムの学習に使う業務データは多くの場合、機密情報を含みます。データの保管場所と暗号化要件、開発終了後のデータ削除義務、クラウド利用の場合のリージョン指定、ISO 27001・SOC 2等の認証取得状況の確認——これらを契約に盛り込んでください。
発注前チェックリスト
発注前に以下を全て確認します。「はい」が揃わない状態で発注するリスクは高いです。
自社側の準備
- 解決したい課題が具体的に言語化できている
- 成功の定義(KPI・目標値)が決まっている
- 使用できるデータの種類・量・品質を把握している
- AI導入の意思決定者が社内で明確になっている
- 運用フェーズの担当者・体制が決まっている
ベンダー評価
- 同業界・同課題の実績を具体的に確認した
- 実際の開発担当エンジニアと話した
- トータルコスト(PoC+本番化+運用2年)の試算を取った
- データ整備費・インフラ費・API利用料が見積もりに含まれている
- 本番化フェーズの提案を受けた
- リファレンスチェック(導入先への確認)が可能か聞いた
契約確認
- 知的財産権の帰属(学習済みモデル含む)が明記されている
- SLAが定量的に定義され、契約書と紐づいている
- 保守・運用の範囲が具体的に明記されている
- 開発終了後のデータ削除義務が明記されている
- 途中解約時の条件が明記されている
AI開発会社を探すとき、最初に何をすべきか?
発注先を探すより先にやるべきことがあります。「自社の課題を1枚の紙に書く」ことです。
現状として何の業務がどれくらいのコスト・時間がかかっているか、目標としてAIで何をどこまで自動化・改善したいか、制約として使えるデータ・予算・社内リソースの上限——この3点を明文化することが出発点です。
この1枚が書けない段階でベンダーに問い合わせても、汎用提案しか返ってきません。課題が明確なほど、ベンダーの提案の質が上がり、比較もしやすくなります。
RFP(提案依頼書)を作るときのポイント
複数社に見積もりを依頼するときは、RFP(Request for Proposal)を作ることで比較が容易になります。
RFPに含める基本4項目は、①背景と課題(現状の業務フローの何が問題か)、②スコープ(今回の開発範囲)、③データ概要(種類・量・品質、サンプル添付)、④成功基準(精度目標・業務改善のKPI)です。加えて、⑤予算感、⑥スケジュール(本番稼働の目標時期)、⑦技術要件(既存システムとの連携仕様、クラウド環境の条件)も必ず盛り込んでください。
RFPを作らずに「口頭で説明して見積もりをもらう」方法は、各社の提案条件がバラバラになり比較できません。
AI専門ベンダーに何を期待するか:STANDXの場合
ここまでで解説した7つの基準を、実際に発注先を探している人向けに具体化しておきます。
渋谷に拠点を置く弊社は、Claude・GPT-4oなどの生成AIを活用したAIワーカー導入サービスを提供するAI専門ベンダーです。「AI専門ベンダー」の分類に入り、以下の特性を持ちます:
PoCから本番運用まで一気通貫で設計・実装・伴走します。業務プロセスの分析・課題の言語化から入るため、「何をAIに任せるか」が曖昧な段階から相談できます。チーム規模・業種に応じた3プランで投資規模を段階的にコントロールできるのも特徴です。
サービスプラン:
| プラン | 初期費用 | 月額 | 対象 |
|---|---|---|---|
| セルフ | ¥10,000 | — | ツール・テンプレートで自社導入 |
| ワーカー導入 | ¥500,000 | ¥100,000 | AIワーカー設計〜導入伴走 |
| チーム構築 | ¥1,000,000 | ¥200,000 | 複数AIワーカーによる業務自動化チーム |
「PoCで終わらせない」という設計思想は、基準②(本番移行を想定した体制があるか)に直接対応しています。
詳しくはSTANDXのサービスページをご覧ください。
FAQ
Q. AI開発会社に頼むと、どのくらいの期間かかりますか?
規模によって大きく異なります。小規模なチャットボット導入なら1〜3ヶ月、中規模の業務自動化システムで3〜9ヶ月、大規模な基幹統合になると1年以上かかるケースもあります。「○ヶ月で完成します」という即答は要注意で、要件定義の段階で詳細なスケジュールを出してもらうのが正しい順序です。
Q. 相見積もりは何社に取るべきですか?
3社以上が望ましい。ただし、提案書のクオリティより「実際の開発担当者と話せたか」「技術的な議論ができたか」を重視します。10社に出して比較表を作るより、3社と深い議論をした上で選んだほうが失敗しにくいです。
Q. 開発途中でベンダーを変えることはできますか?
技術的には可能ですが、コストと時間がかかります。特にAI開発では、学習済みモデルや学習データの引き渡し条件が契約に書かれていないと、途中変更が実質的に不可能になるケースもあります。契約時に中途解約・引き渡し条件を明記しておくのが最善策です。
Q. 「AIコンサルティング」と「AI開発」は何が違いますか?
AIコンサルティングは、どの業務にどのAIを使うか・ROIをどう設計するか・社内推進体制をどう作るかを支援する上流工程です。AI開発は実際のシステムを作る実装工程です。両方を一社でやる会社もあれば、コンサルのみ・開発のみの会社もあります。自社に必要なのがどちら(または両方)かを明確にしてから探してください。
Q. 生成AI(GPT・Claude等)を使うシステムと、機械学習モデルを作るのは何が違いますか?
生成AIは「既存の大規模モデルをAPIで呼び出してシステムに組み込む」アプローチです。開発期間が短く費用が比較的安いです。機械学習モデルは「自社データで独自のモデルを学習させる」アプローチで、データ整備から始まるため費用と期間がかかりますが、自社固有の予測・分類に特化できます。2026年現在は、生成AI+自社データのRAG(Retrieval-Augmented Generation)という中間的なアプローチも普及しています。
まとめ
AI開発会社の選び方を7つの基準で整理しました。
最も重要な視点は一つ。「PoC以降のフェーズを想定して提案してくれる会社か」です。
華やかな提案書・豊富な実績数・安い初期費用——これらは選定の参考にはなりますが、決め手ではありません。本番稼働まで持っていく体制設計ができているか、知財・保守・SLAを契約に明文化してくれるか、開発担当者と直接技術的な議論ができるか。これらを確認した上で選んでください。
AI導入の費用全体を把握したい方は AI導入費用ガイドへ。 失敗事例から学びたい方は AI導入失敗事例へ。 Claude APIの企業導入を検討している方は Claude API企業導入ガイドへ。
AI導入の設計から開発まで一貫してサポートします。