LINEとAgentforceを仲介するWebサーバーを(ほぼ)ゼロショットで生成する

みなさんこんにちは。エンジニアの佐藤です。本日はLINEとAgentforceを仲介するWebサーバーのお話です。

とは言え、このテーマは実はそれほど難しくありません。というのは、LINEもAgentforceもWebフックやREST APIといった業界標準を尊重して作られているからです。つまり、あとは手順に乗っているデータの解釈の問題で、手順自体はほとんど自明なのです。

そこで生成AI(LLM)に全部のプログラムコードを一度に書かせるという目標を立てました。昨今はプログラム開発を含む様々な仕事でChatGPTのようなLLM(大規模言語モデル)の利用が注目を集めています。このブログをお読みのあなたも、きっと日常的にご利用のことでしょう。

LLM登場以前の開発はこうでした。マニュアルを読み、該当知識を仕入れ、サンプルを作って動作確認する。そしてあるべき機能要件を眺めてサンプルを組み合わせることで全体的な形にしていく。筆者は前者をソフト開発における「ハードウェア的な部分」、後者を「真にソフトウェア的な部分」と呼んでいました。どちらにも固有の仕事があり、前者は言わば「外部仕様と内部仕様のすり合わせ」で、技術者には高い客観性と正確さが要求されるのに対し、後者は「ソリューション要件の網羅」が肝心で、どちらかと言えば創造性と統合の問題でした。

LLMに任せると高い精度の結果が出てくるのは、このうちの「統合」の部分ではないか、というのが筆者の意見です。LLMは本質的には「関数」で、それ自体に意思はありませんので、「そもそもどうしたいのか」と言った創造的な内容は開発者が指示する必要があります。また、開発対象物の外にはどんな世界があるのか、つまりインフラ要件や入出力データの形式もまた、正確に情報提供してもらわなければ正しいコードは出力できないでしょう。しかしこれらが入力されれば、それらの間を仲介するコードによる全体の「統合」作業は、プログラミング言語という比較的狭い知識ドメインに閉じた地道な作業であり、世界の公開情報を読み尽くした「文脈の辞書」であるLLMの中で関係文脈を辿っていけば、自動構成できる可能性が高い。筆者はそんなふうに感じていました。

そこで筆者は今回、このテーマを、十分な品質のプログラムコードを生成させるにはどんな情報が必要十分か？という程度を探る試みとして挑戦することにしました。以下はその経緯です。なお、生成AI結果は実行のたびに揺れ動きますので、以下の手順を正確にフォローしても結果は異なっている場合があります。

要素技術の動作を確認する

今回のプログラムは以下のような全体図をしています。特別な点は何もなく、できれば短時間でサクッと作りたいものです。

最初にLINE側ですが、

APIの仕様は公式ドキュメントに書かれています。

また、Github line-bot-sdk-pythonに受信したメッセージを折り返すサンプルがありますので、これが参考になりそうです。今回はこのサンプルを手元で動作確認しました。(Webフックを受けるにはDNSやTLS証明書の準備が必要になりますが、一般的な話なので省略します。)

次にSalesforce側ですが、

Salesforceの仕様はAgent API Developer Guideに書かれています。

こちらもGet Started with the Agent APIに丁寧に解説されているので、開発者組織でこれを辿って動作を確認しました。

プロンプトしてみる

ここまで来たら、もう「誰か」にお願いして、自分はもっと別の仕事(案件営業とか)に行きたいと思うでしょう。その役割をLLMにやらせるため、プロンプトを書いていきます。ただし漠然とプロンプトしても精度の高い生成結果にはならないと思いましたので、以下のように構成しました。

# 全体的処理手順

## LINEからのHTTPリクエストの処理
  ...
## Agentforceの呼び出しと返却内容の処理
  ...

...

# 注意事項

## Agentforceのセッション管理
  ...
## Salesforceのアクセストークンの管理
  ...

...

# サンプルコード / コマンド

## LINEメッセージを折り返すサンプル
  ...

## Agentforceを呼び出すcurlコマンドと返信内容 
  ...

プロンプト全文はこちらです(英語の方がLLMが良くしてくれるだろうとの期待から、英語で書いてみました)。「全体的処理手順」と「注意事項」はあっさりしたものです。もし対人で要件を申し伝えるとしたら、ホワイトボードや作業チケットに書かれた内容そのままと言っても良いでしょう。

工夫したのは「サンプルコード / コマンド」の追加です。ここには、冒頭に説明した「ハードウェア的な部分」の正確な情報が書かれています。ただし、その記述は要素技術の動作確認結果そのままであり、経験の浅い人間の作業担当者が見たら「えっとー、」となってしまうかもしれません。そしてWebサイトをGoogle検索したりしてPython言語やSQLite、CURLコマンドを勉強したことでしょう。そういう仕事はLLMが学習済みで、丁寧に仕上げてくれると期待されます。

今回の要件は秘密性は無いので、ChatGPTに入力して解答生成しました。20秒ほどでコードが生成されました。