[丸岡氏]RAGの基本と最新技術動向 #LLM最新活用事例

イベントレポート

2024-07-26 更新日 2024-07-30

丸岡和人

20年以上にわたりエンジニアとして活動中。未踏OB。仕事の傍ら、これまで1000人以上のエンジニアやデータサイエンティストの育成に関わり、Kaggle MasterやKaggle Expertなどを複数排出。現在は、大手商社の生成AIプロジェクトなど複数のAIプロジェクトを主導する。

Connpass詳細はこちら

アーカイブはこちら

資料はこちら

OpenAIの設立者イーロンマスク氏は、「AIは人間の仕事を100%奪う」と断言しています。

他の研究論文でもかなりの確率で大部分が奪われていく話が多く、AIが仕事を奪う時代に向かっていると言えるでしょう。

しかし、生成AIによって生まれる仕事も存在します。生成AIエンジニアはその代表格です。今後は生成AIを開発したり運用する人が絶対に必要となります。

見逃し無料配信！続々追加！
45本以上の人気テックイベントが見放題

業界トップクラスの開発者たちが"実践で使える"最新技術トレンドを徹底解説！React、Next.js、Go、TypeScript、セキュリティ、テスト設計まで幅広くカバーした45本の厳選イベントを見逃し配信中。すでに4,000人以上のエンジニアが視聴申込み！⇒ 全45本のイベント一覧をもっと見る

Offersで人気のテックイベントランキングTOP3

【1位】「どこまで安定してる？Express/NestJS/Hono運用者に聞くバックエンドTSのイマ」

最新TypeScriptバックエンドフレームワークの実運用比較と今後の展望

【2位】なぜ今必要？Figma×SmartHR×DMM.com×一休エンジニア視点で考えるデザインシステ

大規模サービスの開発現場が語るデザインシステム導入の実際

【3位】「テストしやすいコードとは？tenntenn氏、渋川氏、zoncoen氏に聞くGoテスト設計最前線」

Go言語の第一人者たちが語る、実践的なテスト手法とベストプラクティス

45本の人気テックイベントを今すぐ見放題

※Next.js最新版解説、実践的なLLM活用法など旬のテーマも多数！期間限定見逃し配信中

45本以上の人気テックイベントを見るかんたん無料登録で転職相談する

この記事の目次

RAGでChatGPTの回答精度が上がる
検索を3ステップに分けてRAGのボトルネックを特定していく
RAGを簡単に作成できる仕組みが次々と登場

RAGでChatGPTの回答精度が上がる

RAGの話に入る前にChatGPTについておさらいします。正式名称は「Chat Generative Pre-trained Transformer」です。つまり、「チャットを生成する、事前にデータで訓練されている訓練済みのトランスフォーマー」という意味になります。

トランスフォーマーとは2017年にGoogleの研究チームが作った技術で、わかりやすさのためにシンプルに言うと、与えられた文字の続きを予測するAIです。例えば「日本で1番高い山は、」という文字を与えると、続きの文字として「富士山」を出します。

会社の規定や法律の文章などの独自データからChatGPTに回答させたい場合は大きく2つの方法があります(実際には、3つ目の方法として事前学習方式があるが話が長くなるため今回は割愛する)。

1つ目はファインチューニングという方法です。新しいデータで再学習させるファインチューニングは、学習時間とコストが必要になります。

2つ目はプロンプトに回答データを入れて答えさせる方法で、学習時間やコスト、マシンパワーも必要ないので最近流行り出しています。こちらがRAGに当たります。

RAGの全体の流れとしては、ユーザーの質問をクエリーとしてデータベースを検索します。

そして、返ってきた検索結果を元々のユーザーからの質問と一緒に、プロンプトの中に埋め込みます。

これが以下のイメージになります。

「以下の検索結果を基に、ユーザーインプットに対して適切な回答を訂正してください。」という指示を実行させるために、「有給申請の方法を教えてください」というクエリを投げます。そうすると検索結果として「社内ポータルの〇〇から申請してください」と出ます。

クエリと検索結果の両方を与えてChatGPTに対応させる形がRAG(Retrieval Augmented Generation)です。つまりは検索を拡張しているのですが、当時Meta社に在籍していたパトリックルース博士が2020年の5月に発表した論文内で初めて提唱した概念です。

検索を3ステップに分けてRAGのボトルネックを特定していく

RAGには色々な課題がありますが、適切な回答が得られないことと誤った情報を生成してしまうハルシネーションが代表格としてあります。

これらの問題は、データの質や検索インデックスの作り方、検索精度によって大きく影響を受けます。そういった時には、どの処理にボトルネックがあるのかをRAGのシステムを作るときに見た方が良いです。私が実際にプロジェクトをやっている中でも、こちらは非常に重要視しています。

そのため、まずは、そもそも社内で使っている検索エンジンから精度良く回答を得られるのかを確認する必要がありますし、生成AIから回答生成できるレベルのデータなのかを見ないことにはシステムの最終的なパフォーマンスが高まりません。

RAGの場合だと検索前・検索時・検索後と大きく3つのステップに分けられるので、各ステップにおいてどこがボトルネックなのかを考えていくのが良いと思います。

スライドを見ていただくと分かるかと思いますが、ざっと書き出しただけでもこれだけ色々やれることがあります。

検索前ではデータの前処理やクエリ変換、クエリによる分類を行う方法があります。検索時にはベクトル検索以外の方法も検討したり、検索語はプロンプトチューニングや生成した回答自体が本当に有効かをChatGPT自体に評価させる方法が有効です。上記の手法を試してしっかりと精度を上げて、ボトルネックを埋めていくのが非常に重要です。

RAGを簡単に作成できる仕組みが次々と登場

そして、新たな潮流としてDifyというRAGを簡単に作れる仕組みが出てきています。数時間もかからずにデプロイできるので、Difyを選択する中小企業もかなり増えると予想されます。

あとはエンタープライズ向けであればMicrosoft公式のリファレンスアーキテクチャがおすすめです。こちらも日本語版が公開されていて、1時間程度でRAGを作成できます。

続いてChatGPT-4oです。画像もDifyに通せるので、マルチモーダルな仕組みなどDifyと組み合わせると面白いものが作れるようになっています。しかし、それでも大多数の人には難しいので、生成AIエンジニアは非常に重要な存在になってくると思います。

見逃し無料配信！続々追加！
45本以上の人気テックイベントが見放題

【2025年3月最新】Offersで人気のテックイベントランキングTOP3

【1位】「どこまで安定してる？Express/NestJS/Hono運用者に聞くバックエンドTSのイマ」

最新TypeScriptバックエンドフレームワークの実運用比較と今後の展望

【2位】なぜ今必要？Figma×SmartHR×DMM.com×一休エンジニア視点で考えるデザインシステ

大規模サービスの開発現場が語るデザインシステム導入の実際

【3位】「テストしやすいコードとは？tenntenn氏、渋川氏、zoncoen氏に聞くGoテスト設計最前線」

Go言語の第一人者たちが語る、実践的なテスト手法とベストプラクティス

45本の人気テックイベントを今すぐ見放題

※Next.js最新版解説、実践的なLLM活用法など旬のテーマも多数！期間限定見逃し配信中

この記事をシェア

あなたにおすすめの新着求人・案件

アプリ開発×フルリモート｜顧客の声を形にするSEディレクター募集！

株式会社Crew

雇用形態

業務委託
勤務場所

フルリモート
稼働時間

128時間 ~ 160時間（週32 ~ 40時間）
時給

時給 4,500円〜8,000円
技術スタック

Laravel

情報システムエンジニア
リモートOK

[丸岡氏]RAGの基本と最新技術動向 #LLM最新活用事例

【1位】「どこまで安定してる？Express/NestJS/Hono運用者に聞く バックエンドTSのイマ」

【2位】なぜ今必要？Figma×SmartHR×DMM.com×一休 エンジニア視点で考えるデザインシステ

【3位】「テストしやすいコードとは？tenntenn氏、渋川氏、zoncoen氏に聞くGoテスト設計最前線」

RAGでChatGPTの回答精度が上がる

検索を3ステップに分けてRAGのボトルネックを特定していく

RAGを簡単に作成できる仕組みが次々と登場

【1位】「どこまで安定してる？Express/NestJS/Hono運用者に聞く バックエンドTSのイマ」

【2位】なぜ今必要？Figma×SmartHR×DMM.com×一休 エンジニア視点で考えるデザインシステ

【3位】「テストしやすいコードとは？tenntenn氏、渋川氏、zoncoen氏に聞くGoテスト設計最前線」

あなたにおすすめの新着求人・案件

アプリ開発×フルリモート｜顧客の声を形にするSEディレクター募集！

【給与ＵＰ】賞与３回★大企業へステップUP★長期安定雇用★厚労省認定ホワイト企業

CTO候補募集｜HRTech × プロティアンキャリアで社会に変革を！

【フルリモート／副業歓迎】【React】ヘアカラー専門店向けポイントサービス開発

【フルリモート／副業歓迎】【Flutter 経験者歓迎】医療業界向けアプリ開発

【フルリモート／副業歓迎】【C#, .NET】医療機関向け電子カルテの開発

【フルリモート】【Ruby on Rails】医療機関向け予約システムの開発

【フルリモート】【Node.js】ヘアカラー専門店向けポイントサービス開発

【フルリモート／副業歓迎】【Laravel】美容業界向けのシステム開発

【フルリモート】【Angular】タレントマネジメントサービスの UI/UX

AI Agentを社会実装する、第二創業の仲間を募集！

機械学習エンジニアの方必見！AIプロジェクトの学生PMインターンを大募集！

【AI Native SaaS/物理AI】Webフルスタックエンジニア

【AI Native SaaS/物理AI】Webフルスタックエンジニア

T2D3ペースで急拡大中|巨大市場で急拡大を実現するRailsエンジニア募集！

【前編】Node、Deno、Bun?Node代表古川さんと学び直す JS Runtimeの歴史とこれから #フロントエンドの未来

【後編】Node、Deno、Bun?Node代表古川さんと学び直す JS Runtimeの歴史とこれから #フロントエンドの未来

【前編】MIT、GPL、BSL？何をしたら違反になる？ケースから学ぶ OSSライセンス講座 #DeepDive

【後編】MIT、GPL、BSL？何をしたら違反になる？ケースから学ぶ OSSライセンス講座 #DeepDive

【2024年11月最新】バックエンドエンジニアの将来性はどうなる？キャリアパスも解説

【2024年11月最新】AIの将来性は？ディープラーニングの進化と医療事務への影響

黎明期から使ってきたC＃の将来性について考える。キャリアを広げるために意識すること

【2024年11月最新】BigQueryとは？使い方や料金、特徴を徹底解説

【2024年11月最新】主婦もエンジニアに転職できる？具体的なステップやおすすめの職種を紹介

【2024年11月最新】エンジニアが転職を成功させるための志望動機の書き方や注意点を徹底解説

【2024年11月最新】子持ちエンジニアの転職は可能？AWSソリューションアーキテクトの勉強方法

【2024年11月最新】技術顧問エンジニアの副業事情とは？必要なスキル・経験から案件獲得方法まで徹底解説

Salesforce関連の自社製品開発で昨対150％成長！エンジニアがApexやLWCを学ぶ先にあるものとは？

毎月拡大を続ける「スニダン」開発組織。VPoE林氏が見据える次の打ち手と、OffersMGRへの期待とは

確認工数が1/10も削減に! OffersMGRで開発効率を改善し、数値を意識した組織にしていきたい。

Webエンジニアから「Salesforceエンジニア」へ。求められるスキルと理想の人物像とは

【2024年11月最新】デザイナーの転職志望動機の書き方は？成功例とともにご紹介

【2024年11月最新】デザイナーの転職理由の例文を紹介！面接での答え方や伝え方のポイントも解説

【2024年11月最新】グラフィックデザイナーの副業事情とは？必要なスキル・経験から案件獲得方法まで徹底解説

【2024年11月最新】デザイナーの転職理由とは？よくある5つの理由と面接での伝え方を解説

業務委託の場合に交通費はどうする？請求や仕訳のポイント

業務委託における経費精算の方法。負担の考え方や認められる経費

フリーランスの税金事情。種類からおすすめの本まで丁寧に解説

フリーランスで月40万円稼げる職種とは。知っておくべき税金の知識

【2024年11月】コンピテンシー自己評価の例文の書き方。評価向上のための具体例を紹介

【2024年12月最新】リファラル採用による人材獲得の秘訣とは？成功事例と導入手順を解説

【2024年11月最新】スタートアップ採用で重要な人材戦略。採用成功のための実践方法を解説

【2024年11月】ダイレクトリクルーティングが中途採用に効く理由とは？採用手法のメリットを解説

【後編】Node、Deno、Bun?Node代表古川さんと学び直す JS Runtimeの歴史とこれから #フロントエンドの未来

【前編】Node、Deno、Bun?Node代表古川さんと学び直す JS Runtimeの歴史とこれから #フロントエンドの未来

【後編】MIT、GPL、BSL？何をしたら違反になる？ケースから学ぶ OSSライセンス講座 #DeepDive

【前編】MIT、GPL、BSL？何をしたら違反になる？ケースから学ぶ OSSライセンス講座 #DeepDive

【2025年最新】エンジニアが転職する理由ランキングと理想的な転職方法を実現する方法

40代エンジニアが転職で年収アップするには？｜年収アップを叶える人の共通点と失敗しない進め方

AIエンジニア転職ガイド｜年収相場と求められるスキル体系

エンジニアの最適な転職時期は？ベストなタイミングと転職を成功させるポイントを紹介

【1位】「どこまで安定してる？Express/NestJS/Hono運用者に聞くバックエンドTSのイマ」

【2位】なぜ今必要？Figma×SmartHR×DMM.com×一休エンジニア視点で考えるデザインシステ

【1位】「どこまで安定してる？Express/NestJS/Hono運用者に聞くバックエンドTSのイマ」

【2位】なぜ今必要？Figma×SmartHR×DMM.com×一休エンジニア視点で考えるデザインシステ