1年間のAIプロジェクトを振り返って見えた、企業でAIを活かしきるための4つの課題

はじめに

皆さんこんにちは。エンジニアの竹田です。

フレクトでは、昨年初めてAI(LLM)を組み込んだシステムの開発プロジェクトをお客様から受注し、その後約1年間で10件以上のAIプロジェクトを手がけてきました。Agentforceを活用したプロジェクトが中心ですが、それ以外の技術を用いたものもあります。PoCフェーズのプロジェクトが多い一方で、すでにお客様の本番環境で運用されているものもあります。

本記事では、これらのプロジェクトを通じて得た知見をもとに、企業がAIの可能性をさらに引き出すために解決すべき課題と、その解決に向けた具体的なアプローチについて考察します。

この1年間で取り組んだユースケース

具体的にどのようなユースケースに取り組んできたか、代表的なものをいくつかご紹介します。

  • コンタクトセンターでの活用
    • スタッフ向けに、問い合わせ内容に対する解決策を提示
    • AIが人の代わりに問い合わせに回答
  • 営業報告からのインサイト抽出
    • 営業報告を分析し、今後の製品・サービスの開発・改善点と営業的な取り組み方を抽出
  • 店舗での接客支援
    • 商品の紹介や、お客様からの相談への対応
  • AI-OCRによるデータ抽出と書類チェック
    • AI-OCRによりPDFの内容を構造化データとして抽出
    • 単なるデータ抽出にとどまらず、業務の文脈を踏まえた内容チェック
  • Officeドキュメントの整理・検索
    • LLMを活用して非構造化ドキュメントを整理し、簡単に検索可能な状態に

いずれもLLMの登場以前には実現が困難だったことばかりです。AIの進化には目を見張るものがあり、SF(Science Fiction)の世界にまた一歩近づいたと感じます。

「ちょっと便利」の壁

しかし率直に言えば、企業の業務においてAIがもたらす効果は、まだ 「ちょっと便利」 の域を出ていないという印象があります。

AIの本来の可能性を考えれば、もっと多くのことができるはずです。SFの世界に登場するAIのように、人の相棒になってほしいですし、人の代わりに業務を遂行してほしいです。あるいは、人では出来ないことを実現してほしい。少なくとも企業内の業務で使うという点においては、そうした期待との間にはまだギャップがあります。

では、なぜ「ちょっと便利」止まりなのでしょうか。これまでの経験を踏まえて考えてみると、AIの可能性をさらに引き出すために解決すべき課題は主に4つあります。これらは言い換えると、業務の遂行に必要だが、まだ私たちがAIに与えられていないものです。

以下では、これまで扱った営業報告分析やコンタクトセンターでの問合せ対応といった業務を具体例としながら、4つの課題を掘り下げていきます。なお、これらはフレクトがよく扱っているAgentforceに限らず、企業でAIを業務活用する際に共通する課題です。

(なお、AIにツールとして与えるMCPやREST APIについては既に解決方法(作って与える)が見えている課題という認識なので、ここでの議論では除外しています)

課題1:業務の計画能力

1つ目の課題は、業務の計画能力です。

どんな作業を、どのような手順で進めるのかを考え、状況に応じて計画を見直す——これは人間にとっては当たり前のことですが、AIにとっては大きなハードルです。ChatGPTのThinking Modeで使われているようなReasoning Engineはこの領域で効果を発揮する技術ですが、現時点では一般的な問いかけには有効なものの、特定の業務プロセスに沿った計画立案にはまだ課題が残ります。

たとえば営業報告の分析であれば、求められるアウトプットを想定し、そこから逆算して進め方を組み立て、必要な情報を考える。足りない情報があればユーザに問いかけることも求められます。コンタクトセンターでの課題対応であれば、問合せ内容に応じて原因の仮説を立て、その仮説を検証するために情報を集めながら考えを進めていく手順が必要です。

ある程度作業の順序が決まっている業務であれば、その順序をAIに与えてワークフロー的に処理を進めることで、今でも対応できます。しかし、よりAIの能力を高めるためには、AIが自律的に判断して動けるようにすることが必要でしょう。基本的にはプロンプトとプログラミング的な制御を地道に組み込んで実現していくことになります。Agentforceの場合にはAgent Scriptが重要な道具になるはずです。

課題2:業務に必要な情報の取得

2つ目の課題は、情報検索の質です。

人間が業務を行う場合でも、頭の中にある情報だけで業務を完結できることは稀です。だからこそ私たちはネットを検索し、資料を読み、共有フォルダを探り、業務に必要な情報を入手しようとします。

現在、AIに与えられている情報取得(つまりRAG)の手段としてはVector Searchが主流です。しかし、Vector Searchには課題があります。「セマンティックサーチ」と呼ばれ、意味解釈ができるように思われていますが、実態としては文章そのものが表している意味を捉えているわけではありません。人間が業務上の目的を意識しながら行う検索とは、まだ大きな隔たりがあります。

たとえば営業報告を分析する場合には、販売している製品の情報やマーケットの状況を取得する必要があるかもしれません。顧客からの問合せに回答するためには、過去のトラブル事例を見つけてくる必要があるかもしれません。こうした検索を行う際にはVector Searchだけでは足りないことが多いでしょう。

ここで役に立つのが、Anthropicが採用しているAgentic Searchの考え方です。人間が検索するように、Web検索やgrepのような複数の手段を組み合わせ、検索結果を評価しながら必要な情報にたどり着く仕組みです(REST APIやMCPなどももちろん活用します)。既に人が用いている検索手段が多くあるので、それらをAIが扱えるように地道に対応していきさえすれば、この課題は解決可能なはずです。

(簡単にAgentic Searchを構築できるプラットフォームの登場にも期待したいところです)

課題3:経験に相当する知識

3つ目の課題は、経験の蓄積です。

業務のやり方はプロンプトで指示できますし、ツール類はMCP等を通じて渡すことができます。しかし、まだ足りていないのは、人間にとっての「経験」に相当するもの——すなわち、大小さまざまな成功・失敗にまつわる豊富な事例が頭に入っていることです。

たとえ頭がよくて勉強熱心な人でも、経験が足りないとうまくいかないことはよくあります。経験とは、教科書的にきれいに整理された知識ではカバーできないところを補うための、とても大事なパーツです。企業内の業務で判断を下す際にも、この経験が大きな役割を果たします。

たとえば営業報告の分析では、事前に定義した分析手法だけでなく、経験に基づいて仮説を立てることが重要です。豊富な事例が頭の中にあれば、営業報告の一部の記述から過去の事例を想起し、重要な発見につなげることができます。コンタクトセンターでの問合せであれば、過去の経験から課題の原因や対応策についての仮説をすぐに出せるかもしれません。

しかし、経験をAIに組み込む方法は、現時点ではかなり難しいと言わざるを得ません。まずは企業内の大小さまざまな事例を地道にためていくこと。その上で事例を検索・活用する仕組みを作る必要があります。理想的には、LLMのContext Windowがさらに大きくなった後に、経験に当たる事例をまるごとContext Windowに入れて評価させる方がよいでしょう。 こうしたデータの蓄積は時間がかかるものですが、だからこそ企業の競争力として重要なものになってくるはずです。

課題4:文脈の注入

4つ目の課題は、文脈の取り込みです。

計画や経験は、その業務に関する一般的な知識と言えます。しかし実際に業務を遂行するには、その業務に至るまでの文脈が重要です。同じ業務で同じ作業を行うように見えても、文脈によって判断が異なることはよくあります。

人間は、業務システム上の情報、雑談、会議など、さまざまなチャネルから文脈を得ています。情報が足りなければ自ら取りに行くこともできます。一方、AIの場合はアクセス可能なチャネルが限られており、能動的に文脈を把握しに行くことも(今のところ)困難です。

たとえば営業報告の分析であれば、そもそも分析することになった経緯や最終的な目的、誰が何のために必要としているのか、分析結果が与える影響、販売対象の製品・サービスについての開発・販売の経緯——こうした、きれいなデータにはなっていない文脈が存在します。コンタクトセンターでの問い合わせであれば、相手が法人の場合、これまでの取引の経緯や発生したトラブル、営業担当者や法人内のキーパーソンとその影響関係など、深い文脈が関わってくるかもしれません。

この課題の解決は難しく、地道な努力が必要です。今まで人間だけが得ていた情報をAIにも渡せるようにするために、会話をテキストに起こしたり、さまざまなやり取りをデータとして残していく必要があります。Slack等のチャネルの情報をAIが参照できるようにするのも一つの手段です。

これからは、同僚に情報共有するのと同じように、AIにも情報を共有していくことを意識する必要があるかもしれません。

解決策の全体像

ここまでの議論をまとめると、4つの課題に対する解決の方向性は以下のようになります。

課題 解決方法 難易度・時間軸
計画 プロンプトとプログラミング的な制御の組み込み。Agentforceの場合はAgent Scriptの活用。将来的にはAIが自律的に判断できる仕組みへ ワークフロー的な対応は現時点でも可能。自律的な判断は段階的に実現
情報取得 Vector Searchに頼らず、Agentic Searchを導入。REST API・MCPなど複数の検索手段を組み合わせ、検索結果を評価する仕組みを構築 地道に対応すれば解決可能。Agentic Searchのプラットフォームの登場にも期待
経験 企業内の成功・失敗事例を地道に蓄積。将来的にはContext Window拡大後に事例をまるごとLLMに渡して判断に活用 現時点ではかなり難しい。事例の蓄積に時間がかかるが、それゆえに企業の競争力になる
文脈 会話のテキスト化、Slack等のチャネル情報のAI連携など、これまで人間だけが得ていた情報をAIにも共有していく 解決は難しく地道な努力が必要。「同僚に共有するようにAIにも共有する」という意識の転換も鍵

参考:コード生成の世界ではなぜうまくいっているのか

ここまで挙げた4つの課題とその解決の方向性について、すでに高いレベルで実現できている分野があります。それが コードの自動生成(Claude Code、Cursorなど)の分野です。

なぜコード生成ではAIがうまく機能しているのか、4つの課題の観点から整理してみます。

課題 AIによるコード生成ではどう解決されているか
計画 コーディングに必要な各種ツール(CLIコマンド、MCP、ファイル操作等)を前提に、設計・実装の方法論がインプットされた状態で計画できる。さらにCursorのAgentモードのように「計画→実行→結果確認→計画修正」というエージェントループが確立されており、テスト実行やリンターのフィードバックを受けて自律的に計画を見直せる
情報取得 セマンティックサーチ、grep、ファイルパターン検索、Web検索など、複数の手段を目的に応じて使い分けるAgentic Searchが実現されている。MCPを通じた外部サービスとの連携も進んでいる
経験 GitHub等で公開されている膨大なコード(良質なものも低品質なものも含む)を学習データとして蓄えており、これが豊富な「経験」として機能している。加えてCursor RulesやAGENTS.mdのように、プロジェクト固有のルール・慣習を定義ファイルとして渡す仕組みがあり、「この現場ならではの経験」もAIに共有できる
文脈 ユーザーのプロンプト(要件)に加え、IDE自体が豊富な文脈を提供している——開いているファイル、カーソル位置、直近の編集履歴、リンターエラー、ターミナル出力、Git履歴など。そもそもソフトウェア開発における要件定義とは、解釈の余地がある文脈をシステム要求として明確化する作業であり、文脈の明示的な投入が開発プロセスに組み込まれている

コード生成の分野でAIがうまく機能している理由とはつまり、4つの課題それぞれに対する「仕組み」がすでに整っているということです。

計画のための推論ループ、情報取得のための多様な検索手段、経験に相当する膨大な学習データとプロジェクト固有ルール、そしてIDEという文脈豊富な実行環境——これらが揃っているからこそ、コード生成AIは高い成果を出せています。

一般の業務においても、こうした「仕組み」を一つひとつ意識的に整備していくことが、AIの活用を次のステージに引き上げる鍵になるのではないでしょうか。

おわりに

この1年間、さまざまなAIプロジェクトに携わる中で、AIの可能性と現実のギャップを肌で感じてきました。現時点では「ちょっと便利」に留まっている部分も多いですが、課題は明確になりつつあります。

計画・情報取得・経験・文脈——この4つの領域で、AIにはまだ与えられていないものがあります。これらを一つひとつ解決していくことで、AIは「ちょっと便利なツール」から「頼れる業務パートナー」へと進化していくはずです。

取り組むべきことは多いですが、まだまだAIの業務適用という分野は黎明期です。今後様々な発展があるでしょう。またContext Windowの拡大をはじめとするLLMの進化が、これらの取り組みを強力に後押しすることになります。

こうした技術・業界の発展をキャッチアップしながらエンジニアとしてやれることを地道にやっていきましょう。