[Passionate Genius CTO 森本氏]二刀流で切り開くRAG活用術 #LLM最新活用事例

イベントレポート

2024-07-26 更新日 2024-07-30

株式会社Passionate Genius CTO

森本タカヒロ

明治大学卒。ゲームプログラマーとしてキャリアをスタートし、ハイパーカジュアルゲームの開発を経験。ChatGPTのローンチをきっかけに生成AIの可能性を感じ、AI開発者への転身を決意。電話オペレーター業務に特化したAI「nocall.ai」を開発し、現在はPassionate GeniusのCTOとして、nocall.aiのプロジェクトマネジメントを邁進しています。趣味はパーティーを開くことと女装。

Connpass詳細はこちら

アーカイブはこちら

資料はこちら

RAGと言えばセマンティック検索(ベクトル検索)です。セマンティック検索では、語句の意味を解釈して検索したり、文脈に沿ってクエリを修正します。今回は、セマンティック検索やRAG周辺技術の問題点と解決策、そして弊社プロダクトへのRAGの活用について紹介していきます。

「Offers」では、エンジニア・PM・デザイナー向けにキャリア、スキル、働き方についての役立つイベントを開催しています。無料登録・ログインで、人気のイベント動画は今すぐアーカイブ視聴可能です。動画を視聴して、最新の技術トレンドや実践的なノウハウを手に入れましょう！

→【限定配信】アーカイブ動画を今すぐ視聴する！

45本以上の人気テックイベントを見るまずは求人を見てみる

この記事の目次

セマンティック検索の改善は非経済合理的である
HydeやRag fusionを使用しても依然として課題は残る
ハイブリッド検索とリランキングで検索精度を改善する試み
RAGを活用したAIが電話対応や接客業務を担う
丸岡氏のコメントと視聴者からの質問に答える質問タイムへ

セマンティック検索の改善は非経済合理的である

セマンティック検索は未学習の単語に対してベクトルを生成する能力が低いのが弱点です。そのため、専門用語や固有名詞、自社内のみで使う用語は検索をかけてもヒットしません。

しかし、RAGを改善するために、Embeddingモデル自体を改善するのは非経済合理的です。ベクトル検索はあくまでも文章の類似性の特定が得意な手法なので、質問に対する回答が全く異なる意味だったり、用語が専門的すぎてベクトル検索に対してEmbeddingできない問題が出てきてしまいます。

HydeやRag fusionを使用しても依然として課題は残る

セマンティック検索の問題に対応するために、RAGの周辺技術であるHydeやRag fusionを使用することが思いつきますが、それぞれ問題があります。

Hydeでは生成した仮の文章とドキュメントをマッチングさせて検索します。しかし、1回文書を生成しなければいけない分、速度が課題です。Rag fusionはクエリを与えられた時にLLMで生成した複数のクエリから生成したドキュメントをマッチングさせる仕組みですが、曖昧なクエリだと複数のクエリも曖昧になってしまいます。

ハイブリッド検索とリランキングで検索精度を改善する試み

弊社ではハイブリッド検索とリランキングという2つの手法を用いて問題を解決していきました。結果的には5〜10%ほどの精度改善が見込めました。

ハイブリッド検索はキーワード検索とベクトル検索を組み合わせた手法です。キーワード検索はGoogle検索と同様で、単語の品質を文章の長さによってスコアを出す仕組みになります。文章全体の意味を特定できるベクトル検索の良さをキーワード検索と掛け合わせて精度を上げていきます。

キーワードとベクトル検索の融合方法は順位に基づいたスコア(逆順位融合)と加重平均の合計スコアで最終的なスコアを算出する形です。

学術的な指標を用いると、ベクトル検索ではFAISSとOpenAIのtext-embedding-3-largeを使用しています。キーワード検索にはOkapiBM25(キーワード検索の中では1番精度がいいと言われているアルゴリズム)を使用します。

使用するデータセットは弊社の資料(170チャンク)で、クエリとドキュメントが1対1でも紐付いているものです。

評価仕様にはMRRとRecallを使用します。MRRはユーザーの正解を4番目に出したものと1番目に出したものがあったとしたら、1番目に出した方がスコアが高いという仕様です。Recallは、例えばユーザーに5個おすすめしてその中に正解が含まれているかどうかという指標です。

そして、結果は以下の通りです。RFF hybridに関しては先ほど説明した逆順位融合(Reciprocal Rank Fusion)で、その下はweighted sum hybridです。ベクトル検索やキーワード検索とともに高いスコアを出しており、精度が向上しているのが分かります。

続いてリランキングです。リランキングとは、RAGの検索をかけた後にもう一度同じ文章クエリが正しいかどうかをランキング付けするモデルです。例えば、取得した50個のドキュメントの中で上から5個の文章を並べ替えます。

今回はCohereのリランキングAPIを使用しています。結果はhybridでは精度の向上が見られませんでしたが、ベクトル検索とキーワード検索では著しい精度改善が見られました。特にMRRでは先ほどの指標よりも15〜16%ほど改善しています。

ここで注意ですが、ハイブリッド検索によって精度が下がる場合があります。あるデータセットではキーワード検索が足を引っ張って性能が上がらないケースもあります。また、リランキングには今回CohereのAPIを使用しましたが、コストが結構かかってしまいます。

その一例としてデータセットを使用して検証したところ、ベクトル検索やキーワード検索、hybridでは改善しませんでした。しかし、hybridのrerankモデルを使うと数%ほど改善しました。

RAGを活用したAIが電話対応や接客業務を担う

実際には、架電業務に特化したnocall.aiというAI電話オペレーターサービスのプロダクトにRAGを活用しています。nocall.aiは人間のようにAIと対話できるのが特徴であり、リマインドの自動化やSaaSオンボーディングのサポート、インサイドセールス電話の自動化などに使われます。

RAGを導入することで、お客様の多岐に渡る内部データへの検索精度が上がって、対応品質の向上に繋がっています。

また、ブラウザ搭載の接客AIアバターも提供しております。画面右下に接客AIアバター(コンシェルジュ)を表示させて、スムーズな会話でAIが接客してくれるサービスです。

実際にアパレルブランドのお客さんから、ブランドや商品情報をRAGで取得したいという要望がありました。自社商品などのニッチな情報にはRAGが強いです。

丸岡氏のコメントと視聴者からの質問に答える質問タイムへ

――まずは丸岡さんの方から技術的な観点やコメント等がございましたらお願いします。

丸岡：初めてプロダクトを拝見しましたが、非常に応答速度が早いと感じます。言える範囲で構いませんので、工夫されているところはありますか。

森本：応答速度は大体1秒以下でできるように作っています。認識した瞬間から処理するイメージです。基本的に私たちのプロダクトは文字起こししてからGPTに投げて、Text-to-Speechで情報をリアルタイムで流す形にしています。

――「RAGの精度評価について、パフォーマンスはどのように評価していったのでしょうか」とのことですが、いかがでしょうか。

森本：基本的にテストデータはドキュメント1個に対してクエリ1個で作りました。ドキュメント全体を見て我々で一旦クエリを書いてから、ChatGPTを使って水増しする形でデータを作成しました。

丸岡：色々試されてハイブリッドに落ち着いたとのことですが、速度面の性能で選ばれたのでしょうか。

森本：そうですね。我々のプロダクトは速度を重視しているので、ユーザーの応答前にクエリの処理をするものは速度的に採用できませんでした。

丸岡：最近GPT-4oも速くなったと言われますが、4と比べても遜色ない速度ではないでしょうか。

森本：4oの内部構造が分からないのではっきりとは言えないですが、4oは0.3秒程度で返すようです。我々は文字起こし→ChatGPT→結果を喋らせるという3段階のステップを踏んでいます。最近発表されたGPT-4oは音声とプロンプトを入れて音声を出すモデルを使用しているのではないかと推測しています。

見逃し無料配信！続々追加！
45本以上の人気テックイベントが見放題

業界トップクラスの開発者たちが"実践で使える"最新技術トレンドを徹底解説！React、Next.js、Go、TypeScript、セキュリティ、テスト設計まで幅広くカバーした45本の厳選イベントを見逃し配信中。すでに4,000人以上のエンジニアが視聴申込み！⇒ 全45本のイベント一覧をもっと見る

【2025年3月最新】Offersで人気のテックイベントランキングTOP3

【1位】「どこまで安定してる？Express/NestJS/Hono運用者に聞くバックエンドTSのイマ」

最新TypeScriptバックエンドフレームワークの実運用比較と今後の展望

【2位】なぜ今必要？Figma×SmartHR×DMM.com×一休エンジニア視点で考えるデザインシステ

大規模サービスの開発現場が語るデザインシステム導入の実際

【3位】「テストしやすいコードとは？tenntenn氏、渋川氏、zoncoen氏に聞くGoテスト設計最前線」

Go言語の第一人者たちが語る、実践的なテスト手法とベストプラクティス

45本の人気テックイベントを今すぐ見放題

※Next.js最新版解説、実践的なLLM活用法など旬のテーマも多数！期間限定見逃し配信中

この記事をシェア

あなたにおすすめの新着求人・案件

【時給2500円〜/◎フルリモート】ソフトウェアテストのQAエンジニア募集！

DAIJOBU株式会社

雇用形態

業務委託
勤務場所

フルリモート
稼働時間

120時間 ~ 160時間（週30 ~ 40時間）
時給

時給 2,500円〜3,500円
技術スタック

-

QAエンジニア
リモートOK

[Passionate Genius CTO 森本氏]二刀流で切り開くRAG活用術 #LLM最新活用事例

セマンティック検索の改善は非経済合理的である

HydeやRag fusionを使用しても依然として課題は残る

ハイブリッド検索とリランキングで検索精度を改善する試み

RAGを活用したAIが電話対応や接客業務を担う

丸岡氏のコメントと視聴者からの質問に答える質問タイムへ

【1位】「どこまで安定してる？Express/NestJS/Hono運用者に聞く バックエンドTSのイマ」

【2位】なぜ今必要？Figma×SmartHR×DMM.com×一休 エンジニア視点で考えるデザインシステ

【3位】「テストしやすいコードとは？tenntenn氏、渋川氏、zoncoen氏に聞くGoテスト設計最前線」

あなたにおすすめの新着求人・案件

【時給2500円〜/◎フルリモート】ソフトウェアテストのQAエンジニア募集！

データ基盤構築からデータマート設計｜データ活用を加速させるデータエンジニア

ドメイン駆動開発｜モダン技術｜エンジニア主導で事業成長させるWebアプリ開発

n8nを用いた業務自動化・AIエージェントワークフロー設計・開発経験者募集！

【フルリモ】実務経験3年以上、n8n/AI開発経験者歓迎!

【リモート可】業務用Webシステム × AI基盤｜バックエンドエンジニア

【時給3500円〜/◎フルリモート】セキュリティエンジニア（脆弱性診断）募集！

【時給3500円〜/◎フルリモート】ソフトウェアテストの自動化エンジニア募集！

【在宅/～週3日/高単価】プロジェクトマネージャー｜データ基盤構築・BI開発

【フルリモ相談可】クレジットカードシステムのPM経験者を大募集！

【フルリモ】製造業向けDX案件でデータ可視化（Power BI）支援をお任せ！

【フルリモ＆週４日～】ServiceNow 開発・保守運用エンジニア大募集！

【ほぼリモート】SAP導入/PP領域におけるコンサルタントを募集！

【週3～5/フルリモ】大手ガス会社のグループ企業にてWEBアナリスト！

【在宅可】大手製薬会社のデータ基盤設計プロジェクトでバックエンド開発リーダー！

【前編】Node、Deno、Bun?Node代表古川さんと学び直す JS Runtimeの歴史とこれから #フロントエンドの未来

【後編】Node、Deno、Bun?Node代表古川さんと学び直す JS Runtimeの歴史とこれから #フロントエンドの未来

【前編】MIT、GPL、BSL？何をしたら違反になる？ケースから学ぶ OSSライセンス講座 #DeepDive

【後編】MIT、GPL、BSL？何をしたら違反になる？ケースから学ぶ OSSライセンス講座 #DeepDive

AIエンジニアの仕事内容とは？仕事の種類や他エンジニアとの違いを解説

AIエンジニアに必要なスキルとは？未経験からの転職ロードマップ・役立つ資格を徹底解説

【2024年11月最新】バックエンドエンジニアの将来性はどうなる？キャリアパスも解説

【2024年11月最新】AIの将来性は？ディープラーニングの進化と医療事務への影響

未経験からエンジニアに転職するステップやポイントを詳しく紹介

【2025年版】エンジニア転職で年収アップに直結する資格選びと取得戦略

エンジニア 転職 30代で成功するための戦略と市場価値向上のポイント

AIエンジニアの年収は？AIエンジニアの稼ぎ方やなり方、収入アップまで徹底解説

Salesforce関連の自社製品開発で昨対150％成長！エンジニアがApexやLWCを学ぶ先にあるものとは？

毎月拡大を続ける「スニダン」開発組織。VPoE林氏が見据える次の打ち手と、OffersMGRへの期待とは

確認工数が1/10も削減に! OffersMGRで開発効率を改善し、数値を意識した組織にしていきたい。

Webエンジニアから「Salesforceエンジニア」へ。求められるスキルと理想の人物像とは

【2024年11月最新】デザイナーの転職志望動機の書き方は？成功例とともにご紹介

【2024年11月最新】デザイナーの転職理由の例文を紹介！面接での答え方や伝え方のポイントも解説

【2024年11月最新】グラフィックデザイナーの副業事情とは？必要なスキル・経験から案件獲得方法まで徹底解説

【2024年11月最新】デザイナーの転職理由とは？よくある5つの理由と面接での伝え方を解説

業務委託の場合に交通費はどうする？請求や仕訳のポイント

業務委託における経費精算の方法。負担の考え方や認められる経費

フリーランスの税金事情。種類からおすすめの本まで丁寧に解説

フリーランスで月40万円稼げる職種とは。知っておくべき税金の知識

【2024年11月最新】スクラム採用とは何か？基本から成功事例までを紹介

【キャリア別】エンジニアが後悔しない転職タイミングと市場価値を高めるポイント

【2024年11月】コンピテンシー自己評価の例文の書き方。評価向上のための具体例を紹介

【2024年12月最新】リファラル採用による人材獲得の秘訣とは？成功事例と導入手順を解説

【後編】Node、Deno、Bun?Node代表古川さんと学び直す JS Runtimeの歴史とこれから #フロントエンドの未来

【前編】Node、Deno、Bun?Node代表古川さんと学び直す JS Runtimeの歴史とこれから #フロントエンドの未来

【後編】MIT、GPL、BSL？何をしたら違反になる？ケースから学ぶ OSSライセンス講座 #DeepDive

【前編】MIT、GPL、BSL？何をしたら違反になる？ケースから学ぶ OSSライセンス講座 #DeepDive

【2025年最新】エンジニア転職の面接攻略法！技術面接から年収交渉まで完全ガイド

【2025年最新】エンジニアが転職で年収アップを実現する5つの戦略と成功事例

【2025年最新】エンジニアが転職で失敗する5つの理由と成功への具体的対策

【2025年版】エンジニア転職で年収アップに直結する資格選びと取得戦略

【1位】「どこまで安定してる？Express/NestJS/Hono運用者に聞くバックエンドTSのイマ」

【2位】なぜ今必要？Figma×SmartHR×DMM.com×一休エンジニア視点で考えるデザインシステ

エンジニア転職 30代で成功するための戦略と市場価値向上のポイント