內容品質勝過檢索技術

在知識檢索系統中,最終回答品質取決於兩件事:LLM 拿到的 context 夠不夠好,以及 LLM 本身的能力。前者的影響遠大於後者,而 context 的品質主要由內容決定,不是由檢索演算法決定。

一個用頂級模型精心整理過的筆記——包含背景知識連結、常見錯誤提醒、相關概念交叉引用——即使只用簡單的語意搜尋找到,也能產出比 Graph RAG 從原文切片中拼湊更好的回答。

這個原則意味著:把算力投入在前期建構高品質內容(用最強模型慢慢跑),而不是在後期用複雜架構補救劣質內容(用複雜檢索找原文片段)。

比喻:Graph RAG 像考試時翻原版教科書找答案,增強型原子筆記像翻一本頂尖家教整理的精華筆記。同一個學生拿到後者當然答得更好。

為什麼重要

這個洞見能防止「技術過度工程」的傾向。當系統回答品質不佳時,第一反應應該是檢查內容品質(筆記是否完整、連結是否準確),而不是升級檢索架構。這與 Zettelkasten 方法論的核心理念一致:知識管理的關鍵是筆記本身的品質,不是工具。

連結

  • 上層:Claude 對話 - 高中教材知識庫的 RAG 實現方案
  • 相關:qmd 原子化筆記方案、用 LLM 建構增強型知識筆記、原子化筆記原則、連結優於分類

參考