Rerank ~RAGの精度を高める手法~

こんにちは！けーじです。最近AI関連の記事をかけていなかったのですが、今回Rerankという手法についてまとめて見ましたので、ご興味あればのぞいていってみてください。RAGと深く関係している技術でして、RAGの説明も絡めつつご紹介できたらと思います。

1 RAGの概要
- 1.1 AIが持っている知識と限界
- 1.2 AIに未知の知識を教え込む方法
2 リランクの概要
3 リランクを試してみる
4 参考文献

RAGの概要

AIが持っている知識と限界

最近のAIは聞けば何でも答えてくれているように思いますが、限界があるのも事実です。その限界を超えたような回答を求めると、的を射ていないような回答を返してきたり、悪い場合には誤った事実なのにあたかも本当かのように答えてくる＝ハルシネーションを引き起こしたりしてしまいます。例えば、AIは学習に用いたデータ以上のことは答えるのが難しいです。「日本の総理大臣は誰？」とGeminiに聞いてみると、2025年12月14日付けでは高市早苗氏が正解ですが、かなり新しい情報ですので、一代前の石破茂氏と回答してしまうことがあります。このようにAIが未知の情報に基づいて回答できないというのがAIを活用するうえでネックになっていました。これを解決する手法が考えられてきて、有力候補となっているのがRAGになります。

AIに未知の知識を教え込む方法

RAGの説明に移る前に、AIに未知情報に基づいて回答させるために検討されてきた技術について説明して、最後にRAGについて触れます。

文脈内学習
こちらはAIとやり取りしていく中で、AIがやり取りの内容を考慮して回答してくれるようになることを言います。先ほどの内閣総理大臣の例で言えば、「実は最近総理大臣が変わって、高市早苗氏になったんですよ」といったようなやり取りを踏まえた後で、再度総理大臣の名前を聞くと高市早苗氏と返してくれるような感じですね。この方法は手軽なのが最大のメリットですが、AIへの手動での入力が必要になるため、システム開発では有用な手段とは言えません。
ファインチューニング
こちらはAIを少量のデータで追加学習させて、AIの出力を調整させるようなイメージです。例えば、最近の政治に関するニュースの情報を集めてきて、それをAIに追加学習させてあげることで、AIが政治に関する部分だけは最新情報をもとに回答できるようになります。AIに最新情報を教え込ませるイメージからすると自然なアイデアに見えますが、AIを学習させるコストがそこそこ高いため、できればもう少し手軽な方法で最新情報を扱わせたいと考えられていました。

RAG
RAGは上記のファインチューニングの欠点を克服した手法になります。Retrieval Augmented Generationの略で、単語通りに訳していくと「検索拡張生成」とでも言うのかもしれませんが、普通はRAG（ラグ）と呼ばれることが多いです。こちらはAIに対してなにか質問をするときに、その質問に関連すると考えられる検索機能を利用します。そして検索結果ともとの質問をAIに合わせて入力することで、AIが知らない情報を検索結果が補って回答を生成できるということになります。
RAGの技術的な概要
技術的なところを補足しておきます。RAGを用いる場合にはデータをベクトルに変換して保存しておく必要があります。ベクトルを用いて情報同士が類似しているかを判断します。初めて聞く方はイメージしづらいかもしれませんが、ベクトルを矢印で表したときに、近い場所を指す情報同士が似ているのだとイメージしていただければ、本記事を読むうえでは支障はありません。なにか人間からの質問があったときに、ベクトルをもとに似ている情報を検索して、AIに渡して回答を作らせているのです。

リランクの概要

RAGの限界

RAGが確立されて、多くの現場で役立てられてきていますが、必ず良い回答が返ってくるかというとそうでもないのが正直なところのようです。前の説明によると、RAGには大きく「情報検索」の段階と「AIによる回答生成」の段階に分けられますが、今回焦点に当てているRerankは「情報検索」にアプローチする手法になります。RAGで検索した結果が思ったよりも良い情報を拾えていないときに検討する手法になります。

新手法 Rerank

Rerankでは質問と情報のペアをAIに渡して、その関連度のスコアを出力させます。この場合、RAGのときに行ったようなベクトルで関連している情報を選ぶような方法よりも精度が高く関連度を測る事ができることが知られています。RAGで関連度が高い情報をうまく拾えていないときに、精度の高いRerankを用いて改めて関連度を算出することで、本当に関連度の高い情報だけをAIに渡すことができるということを狙っています。

Rerankの限界

Rerankが精度の高い関連度を算出できるので、はじめからRAGで関連度を出さないでRerankだけ用いれば良いと考える方もいらっしゃるかもしれません。しかし、Rerankは人間の質問とデータをそれぞれペアにしてAIに入力して計算させる必要があります。このような過程は少々計算の負荷が高くなりまして、特にベクトルを用いて関連度を出すよりはかなり負荷が高くなってしまいます。精度が高い結果が得られる一方で、それを算出する過程でRerankはデメリットを抱えています。

RAGとハイブリッドで良い検索手法

以上のようなRerankの特徴を踏まえまして、RAGとRerankのハイブリッドを用いる手法が検討されています（そもそもRerankという名称自体がRe-rank（順位をつけ直す）だと思います）。はじめに検索対象となるデータセット全体からは、計算負荷の少ないRAGの手法、すなわちベクトルによる関連度の高い情報を拾う手法を用います。そして得られた情報だけに対してRerankを適用します。計算負荷のかかるRerankは、限られたデータにだけ使うことでそのデメリットを目立たないようにしています。最終的にAIに入力する情報は、Rerankにより関連度が高い上位の結果を用いることになります。

リランクを試してみる

技術概要が説明できたところで実際にRerankをコーディングして試してみましょう。とはいっても、Rerank自体は外部にサービスとして用意されているので、今回はそちらを用います。

用いるデータセット

データセットはGeminiに作成してもらいました。以下のように作成しています。ある質問文に対して、正解と考えられる回答を5個、質問文に含まれる単語を説明しただけの回答や、広い意味ではあっているが遠い回答など、惜しい回答を5個、そのほか無関係やノイズとされる回答を15個用意します。例えば「大谷翔平選手がメジャーリーグで達成した「二刀流」の具体的な内容を教えてください。」といった質問に対しては、以下のような回答群が作成されました。B01のように端的に説明されているものが正解としてあったり、無関係なもので言えば、B15のような競技も違うようなものまであります。

B01,正解,"[史上初の定義] 彼は、投手として規定投球回に到達し、打者として規定打席に到達した史上初の選手です。これにより、彼の二刀流はメジャーリーグの歴史において公式に確立されました。"
B02,正解,"[具体的記録] 同一シーズンに10勝以上と40本塁打以上を記録した唯一の選手でもあります。これは、投手と打者の両方で傑出した成績を残したことを示しています。"
B03,正解,"[MVP選出] 2021年と2023年に、満票を含むア・リーグの最優秀選手（MVP）を獲得しました。この受賞は、彼の二刀流パフォーマンスが評価された結果です。"
B04,正解,"[コミッショナー特別表彰] 2021年シーズン終了後、ベーブ・ルース以来の二刀流の功績を称え、MLBコミッショナー特別表彰を受けました。"
B05,正解,"[ルール変更の影響] DH制を廃止した「大谷ルール」が2022年シーズンから適用されました。これは、先発投手が降板後も打者として出場し続けられるようにするためのルールです。"
B06,HN:用語O.L.,"メジャーリーグにおける「二刀流」の議論は、ベーブ・ルースの時代にまで遡りますが、現代の分業化された野球においては、その才能を比較することはできません。"
B07,HN:広い文脈,"大谷選手は日本プロ野球時代からその才能を認められていました。高校時代は花巻東でプレーし、ドラフトでは複数の球団から指名を受けましたが、最終的にロサンゼルス・エンゼルスに入団しました。"
B08,HN:類義語置換,"井上尚弥選手は、プロボクシングでバンタム級において主要4団体を統一した、史上初のアジア人ボクサーです。彼はボクシング界における「二刀流」の偉業を達成しました。"
B09,HN:真逆の結論,"専門家は、大谷選手は怪我の再発を防ぐため、投手としての登板を完全に辞め、打者としてのキャリアに専念すべきであるという意見が大勢を占めています。"
B10,HN:古い情報,"2021年以前は、大谷選手が登板した試合で降板すると、その後は打者としても退かなければならず、これが二刀流のネックとなっていました。（※現行のルールと異なる）"
B11,無関係,"体操の内村航平選手は、オリンピックで個人総合において2大会連続を含む合計3個の金メダルを獲得しています。"
B12,無関係,"FIFAワールドカップで最も多く優勝している国はブラジルです。彼らはこれまで合計5回の優勝を果たしています。"
B13,ノイズ,"彼の打撃フォームは独特で、多くの専門家から賞賛されています。彼のパワーの源はどこにあるのでしょうか？"
B14,ノイズ,"(短い断片的な文章) トップアスリートは常に高い目標を設定している。"
B15,ノイズ,"ゴルフで、パーよりも1打少ない打数でホールアウトすることをバーディーと言います。"
B16,無関係,"スキージャンプのルールでは、飛距離点だけでなく、飛形点（フォームの美しさ）も得点に大きく影響します。"
B17,無関係,"サッカーの「VAR」（ビデオ・アシスタント・レフェリー）は、得点、ペナルティキック、レッドカード、人違いの場合にのみ適用されます。"
B18,無関係,"バレーボールにおける「ローテーション」は、サーブ権を得た際に選手が時計回りにポジションを一つ移動することです。"
B19,無関係,"F1のレース中にピットストップを行う主な目的は、タイヤ交換と燃料補給（かつて）であり、戦略の鍵となります。"
B20,無関係,"テニスの四大大会（グランドスラム）は、全豪オープン、全仏オープン、ウィンブルドン、全米オープンの四つです。"
B21,無関係,"バスケットボールのゾーンディフェンスは、選手が特定のエリアを守る防御戦略であり、特にインサイドの守備に有効です。"
B22,無関係,"近代オリンピックは、1896年にギリシャのアテネで初めて開催されました。"
B23,無関係,"競泳のマイケル・フェルプス選手は、夏季オリンピック史上最多となる通算28個のメダルを獲得しました。"
B24,ノイズ,"(短い断片的な文章) スポーツは人生そのものだ。"
B25,ノイズ,"野球の「タッチアップ」は、フライが捕球された後に塁を離れて次の塁に進む行為です。"

他にも「サッカーの「オフサイドルール」を簡単に説明してください。」というテーマや、「マラソンランナーがレース中に摂取する「カーボローディング」の目的を説明してください。」というテーマについても同様に25個の回答群を用意しました。合計で3個の質問と75個の回答群が得られたことになります。

目的は大谷翔平選手の質問文で考えると、B01～B05のような回答を検索で拾ってくることです。大谷翔平選手について聞いているのに、サッカーやカーボローディングといったA、Cの回答群から引っ張ってくるのは論外ですし、仮に正しくB群の回答を取ってこれたとしても、01～05の回答を拾ってこれるのが望ましいです。RAGでどこまで拾えるのか、そしてRerankでどこまで精度を高められるかが鍵となります。

実装

それでは実際にコーディングして確かめてみます。Geminiで用意した回答群はcsvにしてもらっていて、以下のDataPreparerクラスを用いてDocumentのリストとして整形しています。

# src/rerank_test/data_preparer.py
from pathlib import Path

import pandas as pd
from langchain_core.documents import Document

class DataPreparer:
    def __init__(self, data_path=Path(__file__).parent/"data/", filename="data.csv"):
        self.data_dir = data_path / filename
        self.data = []

    def data_prepare(self):
        df = pd.read_csv(self.data_dir)
        documents = []
        for index, row in df.iterrows():
            doc = Document(
                page_content=row['例文'],
                metadata={
                    "id": row['ID'],
                    "type": row['タイプ']
                }
            )
            documents.append(doc)
        self.data = documents
        return self.data

得られたDocumentのリストからベクトルストアを作成して、各回答をベクトルとして保存します。そのためのクラスである、VectorStoreCreatorクラスを作成しています。ベクトルストアを構築するのに今回はFAISSを用いました。回答群のベクトル化にはOpenAIのエンベディングモデルであるtext-embedding-ada-002を用いています。https://openai.com/ja-JP/

# src/rerank_test/vector_store_creator.py
import faiss
from langchain_openai import OpenAIEmbeddings
from langchain_community.docstore.in_memory import InMemoryDocstore
from langchain_community.vectorstores import FAISS
from dotenv import load_dotenv

load_dotenv()


class VectorStoreCreater:
    def __init__(self, model_name="text-embedding-ada-002"):
        self.embedidngs_model = OpenAIEmbeddings(model=model_name)
        self.vector_store = []

    def create_vector_store(self, documents: list["Document"]):
        print("ベクトルストアを作成します")
        index = faiss.IndexFlatIP(len(self.embedidngs_model.embed_query("Hello World")))
        vector_store = FAISS(
            embedding_function=self.embedidngs_model,
            index=index,
            docstore=InMemoryDocstore(),
            index_to_docstore_id={},
        )
        ids = [document.metadata.get("id") for document in documents]
        returned_ids = vector_store.add_documents(documents=documents, ids=ids)
        print(f"確認用：{returned_ids=}")
        self.vector_store = vector_store
        return vector_store

合わせてリランクを実施するためのクラスであるRerankerも実装しておきます。コードを見ればわかりますが、CohereというところからRerankを行えるAPIが提供されています。こちらに質問文と回答を送ると順位付けがされます。https://cohere.com/

# src/rerank_test/reranker.py
import os

import cohere
from langchain_cohere import CohereRerank
from dotenv import load_dotenv

load_dotenv()

class Reranker:
    def __init__(self):
        self.reranker = CohereRerank(client=cohere.ClientV2(api_key=os.getenv("COHERE_API_KEY")), model="rerank-multilingual-v3.0")
        self.result = ""

    def rerank(self, documents, query, top_n=20):
        documents_for_rerank = [result.page_content for result in documents]
        reranked = self.reranker.rerank(
            documents=documents_for_rerank,
            query=query,
            top_n=top_n,
        )
        # responseを元のdocumentsの形式に戻す
        result = []
        rerank_order = [data.get("index") for data in reranked]
        for order in rerank_order:
            result.append(documents[order])
        self.result = result
        return result

結果

以上のように実装して置くと、以下のようにコードを実行すれば、results_by_cosineにRAGで得られた回答群が、rerank_resultsにRerankで精度よく順位が付け直された結果が返ってきます。今回はRAGの時点で上位20件拾ってきています。

from rerank_test.date_preparer import DataPreparer
from rerank_test.vector_store_creator import VectorStoreCreater
from rerank_test.reranker import Reranker
from pprint import pprint

query = "大谷翔平選手がメジャーリーグで達成した「二刀流」の具体的な内容を教えてください。"

documents = DataPreparer().data_prepare()
vector_store = VectorStoreCreater().create_vector_store(documents)
results_by_cosine = vector_store.similarity_search(query, k=20)
rerank_results = Reranker().rerank(documents=results_by_cosine, query=query, top_n=20)

RAGによる検索結果が以下になります。上にあるものほど関連度が高いとされた回答です。

RAG

[f"{result.metadata.get("id")}: {result.page_content}" for result in results_by_cosine]
>>>
['B06: メジャーリーグにおける「二刀流」の議論は、ベーブ・ルースの時代にまで遡りますが、現代の分業化された野球においては、その才能を比較することはできません。',
 'B07: 大谷選手は日本プロ野球時代からその才能を認められていました。高校時代は花巻東でプレーし、ドラフトでは複数の球団から指名を受けましたが、最終的にロサンゼルス・エンゼルスに入団しました。',
 'B10: 2021年以前は、大谷選手が登板した試合で降板すると、その後は打者としても退かなければならず、これが二刀流のネックとなっていました。（※現行のルールと異なる）',
 'B01: [史上初の定義] 彼は、投手として規定投球回に到達し、打者として規定打席に到達した史上初の選手です。これにより、彼の二刀流はメジャーリーグの歴史において公式に確立されました。',
 'B11: 体操の内村航平選手は、オリンピックで個人総合において2大会連続を含む合計3個の金メダルを獲得しています。',
 'B09: 専門家は、大谷選手は怪我の再発を防ぐため、投手としての登板を完全に辞め、打者としてのキャリアに専念すべきであるという意見が大勢を占めています。',
 'B03: [MVP選出] 2021年と2023年に、満票を含むア・リーグの最優秀選手（MVP）を獲得しました。この受賞は、彼の二刀流パフォーマンスが評価された結果です。',
 'A15: 柔道では、野村忠宏選手がオリンピック3連覇という偉業を達成しています。',
 'A19: スキージャンプの葛西紀明選手は、入念な体調管理と競技への探求心により長期間活躍できました。',
 'B08: 井上尚弥選手は、プロボクシングでバンタム級において主要4団体を統一した、史上初のアジア人ボクサーです。彼はボクシング界における「二刀流」の偉業を達成しました。',
 'B02: [具体的記録] 同一シーズンに10勝以上と40本塁打以上を記録した唯一の選手でもあります。これは、投手と打者の両方で傑出した成績を残したことを示しています。',
 'A22: eスポーツのプロ選手になるには、高度な集中力とチームでの戦略立案能力が求められます。',
 'B13: 彼の打撃フォームは独特で、多くの専門家から賞賛されています。彼のパワーの源はどこにあるのでしょうか？',
 'B04: [コミッショナー特別表彰] 2021年シーズン終了後、ベーブ・ルース以来の二刀流の功績を称え、MLBコミッショナー特別表彰を受けました。',
 'B25: 野球の「タッチアップ」は、フライが捕球された後に塁を離れて次の塁に進む行為です。',
 'C12: ゴルフで、ボールを打った数がホールの規定打数（パー）よりも2打少ないことをイーグルと言います。',
 'B16: スキージャンプのルールでは、飛距離点だけでなく、飛形点（フォームの美しさ）も得点に大きく影響します。',
 'A23: ラグビーの「トライ」は、相手チームのインゴール内でボールを接地させることで成立し、5点が加算されます。',
 'B05: [ルール変更の影響] DH制を廃止した「大谷ルール」が2022年シーズンから適用されました。これは、先発投手が降板後も打者として出場し続けられるようにするためのルールです。',
 'C23: 野球の通算本塁打記録は、バリー・ボンズが持っています。']

以上の結果を見てみると、RAGの時点で関係のないカテゴリであるA, C系の回答はあまり拾われていないことがわかります。RAG自体も文書検索としてはきちんと役目を果たせていると考えられます。ただ、詳細に見ていくと一番に来ているB06は二刀流については触れられているものの大谷選手の言及がなかったり、二番目のB07は二刀流について触れられていない、3番目は事実と異なる内容であったりと、やや限界も垣間見えます。

続いてRerankの結果を見ていきましょう。先程RAGにより得られた回答20件を、さらに精度よく並び替えています。

Rerank

[f"{result.metadata.get("id")}: {result.page_content}" for result in rerank_results]
>>>
['B01: [史上初の定義] 彼は、投手として規定投球回に到達し、打者として規定打席に到達した史上初の選手です。これにより、彼の二刀流はメジャーリーグの歴史において公式に確立されました。',
 'B04: [コミッショナー特別表彰] 2021年シーズン終了後、ベーブ・ルース以来の二刀流の功績を称え、MLBコミッショナー特別表彰を受けました。',
 'B03: [MVP選出] 2021年と2023年に、満票を含むア・リーグの最優秀選手（MVP）を獲得しました。この受賞は、彼の二刀流パフォーマンスが評価された結果です。',
 'B10: 2021年以前は、大谷選手が登板した試合で降板すると、その後は打者としても退かなければならず、これが二刀流のネックとなっていました。（※現行のルールと異なる）',
 'B06: メジャーリーグにおける「二刀流」の議論は、ベーブ・ルースの時代にまで遡りますが、現代の分業化された野球においては、その才能を比較することはできません。',
 'B07: 大谷選手は日本プロ野球時代からその才能を認められていました。高校時代は花巻東でプレーし、ドラフトでは複数の球団から指名を受けましたが、最終的にロサンゼルス・エンゼルスに入団しました。',
 'B02: [具体的記録] 同一シーズンに10勝以上と40本塁打以上を記録した唯一の選手でもあります。これは、投手と打者の両方で傑出した成績を残したことを示しています。',
 'B08: 井上尚弥選手は、プロボクシングでバンタム級において主要4団体を統一した、史上初のアジア人ボクサーです。彼はボクシング界における「二刀流」の偉業を達成しました。',
 'B25: 野球の「タッチアップ」は、フライが捕球された後に塁を離れて次の塁に進む行為です。',
 'C23: 野球の通算本塁打記録は、バリー・ボンズが持っています。',
 'B09: 専門家は、大谷選手は怪我の再発を防ぐため、投手としての登板を完全に辞め、打者としてのキャリアに専念すべきであるという意見が大勢を占めています。',
 'A23: ラグビーの「トライ」は、相手チームのインゴール内でボールを接地させることで成立し、5点が加算されます。',
 'B13: 彼の打撃フォームは独特で、多くの専門家から賞賛されています。彼のパワーの源はどこにあるのでしょうか？',
 'C12: ゴルフで、ボールを打った数がホールの規定打数（パー）よりも2打少ないことをイーグルと言います。',
 'B05: [ルール変更の影響] DH制を廃止した「大谷ルール」が2022年シーズンから適用されました。これは、先発投手が降板後も打者として出場し続けられるようにするためのルールです。',
 'A22: eスポーツのプロ選手になるには、高度な集中力とチームでの戦略立案能力が求められます。',
 'A15: 柔道では、野村忠宏選手がオリンピック3連覇という偉業を達成しています。',
 'B16: スキージャンプのルールでは、飛距離点だけでなく、飛形点（フォームの美しさ）も得点に大きく影響します。',
 'A19: スキージャンプの葛西紀明選手は、入念な体調管理と競技への探求心により長期間活躍できました。',
 'B11: 体操の内村航平選手は、オリンピックで個人総合において2大会連続を含む合計3個の金メダルを獲得しています。']

一番にきたB01はまさに大谷選手の二刀流を端的に説明しているもので、感覚的に最も合致する順位付けだと思います。その後に続くB03, B04といった回答も正解に近い内容だと考えられるので、この点を踏まえるとRerankといった手法はかなり有効な手段と考えられるのではないでしょうか。ただ、他に正解想定としていたB02やB05が低い順位にあります。Rerankも万能薬というわけでもなく限界はあるようです。

ちなみに、ほか２つの質問に対しても実行してみています。詳細は省きますが、同様の効果が確認できて、「サッカーの「オフサイドルール」を簡単に説明してください。」という質問に対しては、正解として用意していた「A01: オフサイドは、味方選手がパスを受ける瞬間に、相手ゴールラインにいる相手競技者のうち最後から2人目より前にいる場合、反則となるルールです。」が返されています。もう一つの「マラソンランナーがレース中に摂取する「カーボローディング」の目的を説明してください。」という質問に対しても、正解としていた「C01: [目的定義] カーボローディングは、レースの数日前に炭水化物の摂取量を一時的に増やし、筋肉や肝臓にグリコーゲン（エネルギー源）を最大限に蓄えるための食事戦略です。」が返されています。面白いことにこれらはRAGで拾ってきた時点では2, 3番目とされていたのが、Rerankで1番に振り直されていました。

以上は簡単な検証でしたが、Rerankという手法の有用性を体験していただけたのではないかと思います。今回の検証ではあまり考慮できていない事項もありますので、結果に疑問を持つ方もいらっしゃるかもしれないですが、少なくともRerankという考え方がある事自体は覚えておいた損はないと思います。今後もAIに関連する技術について取り上げていけたらと思いますので、引き続きよろしくお願いします。

参考文献

Verma, S., Jiang, F., & Xue, X. (2025). Beyond Retrieval: Ensembling Cross-Encoders and GPT Rerankers with LLMs for Biomedical QA. CEUR Workshop Proceedings, Vol-4038, paper 50. https://ceur-ws.org/Vol-4038/paper_50.pdf
私がRerankについて調べようと思って最初に見た論文です。こちらは3段階で行っていました。RAG→Rerank１→Rerank２みたいな流れでした。Rerankの中でも計算コストが高いが精度の良いものを、最後に用いて精度が良い結果を得ようとしているみたいです。
Reimers, N., & Gurevych, I. (2019). Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks. In Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing and the 9th International Joint Conference on Natural Language Processing (EMNLP-IJCNLP) (pp. 3982-3992). Association for Computational Linguistics. https://doi.org/10.18653/v1/D19-1410
こちらはRAGの部分の話がメインになります。もともとRerankのような質問文と回答文を渡して関連度のスコアを出すような方法は知られていたのですが、計算コストが高すぎるためそれを解消する方法として紹介されています。
Rosa, G., Bonifacio, L., Jeronymo, V., Abonizio, H., Fadaee, M., Lotufo, R., & Nogueira, R. (2022). In Defense of Cross-Encoders for Zero-Shot Retrieval. https://openreview.net/forum?id=99pYlO57Hn
こちらはRAGを実施するモデルをバイエンコーダー、Rerankを実施するモデルをクロスエンコーダーとして比較しています。それぞれの特徴はここまで述べてきたとおりではありますが、AIが学習していないようなタスクでのZero-Shotはクロスエンコーダーに大きな優位性があるようです。
Nogueira, R., & Cho, K. (2019). Passage Re-ranking with BERT. ResearchGate. https://www.researchgate.net/publication/360898655_Passage_Re-ranking_with_BERT
リランクの手法を情報検索に応用して素晴らしい成果が上がっていることが報告されています。

けーじの学び場

Rerank ~RAGの精度を高める手法~

RAGの概要

AIが持っている知識と限界

AIに未知の知識を教え込む方法

リランクの概要

RAGの限界

新手法 Rerank

Rerankの限界

RAGとハイブリッドで良い検索手法

リランクを試してみる

用いるデータセット

実装

結果

参考文献

コメントを残すコメントをキャンセル

NEWS

メーカーから未経験でITエンジニアに転職して3年が経った

Pyrefly Metaが開発したRust製型チェッカー

Rerank ~RAGの精度を高める手法~

あまり「AIが言ってました」って言うなよ。弱く見えるぞ。

E資格合格体験記

Rerank ~RAGの精度を高める手法~

RAGの概要

AIが持っている知識と限界

AIに未知の知識を教え込む方法

リランクの概要

RAGの限界

新手法 Rerank

Rerankの限界

RAGとハイブリッドで良い検索手法

リランクを試してみる

用いるデータセット

実装

結果

参考文献

コメントを残す コメントをキャンセル

メーカーから未経験でITエンジニアに転職して3年が経った

Pyrefly Metaが開発したRust製型チェッカー

Rerank ~RAGの精度を高める手法~

あまり「AIが言ってました」って言うなよ。弱く見えるぞ。

E資格 合格体験記

コメントを残すコメントをキャンセル

E資格合格体験記