圖檢索增強(qiáng)生成(GraphRAG)已成為大模型解決復(fù)雜領(lǐng)域知識(shí)問(wèn)答的重要解決方案之一。然而,當(dāng)前學(xué)界和開源界的方案都面臨著三大關(guān)鍵痛點(diǎn):
- 開銷巨大:通過(guò) LLM 構(gòu)建圖譜及社區(qū),Token 消耗大,耗時(shí)長(zhǎng),經(jīng)濟(jì)與時(shí)間成本高昂。
- 效果瓶頸:對(duì)復(fù)雜問(wèn)答的解析精度有限,面臨顯著的效果瓶頸。
- 適配成本高:缺乏跨任務(wù)泛化能力,遇新領(lǐng)域需重新調(diào)整全鏈路,遷移成本高。
針對(duì)這些難題,騰訊優(yōu)圖實(shí)驗(yàn)室正式開源 Youtu-GraphRAG 框架,通過(guò)創(chuàng)新的算法優(yōu)化,實(shí)現(xiàn)了成本和效果的雙重突破!

- 論文標(biāo)題:Youtu-GraphRAG: Vertically Unified Agents for Graph Retrieval-Augmented Complex Reasoning
- 論文鏈接:https://arxiv.org/pdf/2508.19855
成本和效果的雙重突破
在六個(gè)跨領(lǐng)域多語(yǔ)言基準(zhǔn)測(cè)試中,Youtu-GraphRAG 展現(xiàn)出卓越性能:
- 大幅成本優(yōu)化:相比同類最佳方案,構(gòu)圖成本節(jié)省 30%+;
- 顯著精度提升:在復(fù)雜推理任務(wù)中獲得最高 16%+ 的準(zhǔn)確率提升;
這些結(jié)果標(biāo)志著 GraphRAG 技術(shù)向落地可用的發(fā)展階段邁進(jìn)了重要的一步。



技術(shù)架構(gòu):三大創(chuàng)新構(gòu)建垂直統(tǒng)一的完整方案

Youtu-GraphRAG 通過(guò) Schema 連接兩個(gè)智能體,在圖構(gòu)建、索引和檢索上實(shí)現(xiàn)垂直統(tǒng)一和認(rèn)知閉環(huán),以領(lǐng)先的落地級(jí)圖構(gòu)建與推理能力推動(dòng) GraphRAG 進(jìn)入新的階段。
1. Schema 引導(dǎo)的層次化知識(shí)樹構(gòu)建
通過(guò)引入有針對(duì)性的實(shí)體類型、關(guān)系和屬性類型,為圖構(gòu)建智能體提供精確約束,實(shí)現(xiàn)了跨領(lǐng)域知識(shí)的自主演化和高質(zhì)量抽取。四層架構(gòu)設(shè)計(jì)包括:
- 屬性層:存儲(chǔ)實(shí)體的屬性信息
- 關(guān)系層:構(gòu)建實(shí)體間的關(guān)系三元組
- 關(guān)鍵詞層:建立關(guān)鍵詞索引體系
- 社區(qū)層:形成層次化的高維度社區(qū)結(jié)構(gòu)
2. 結(jié)構(gòu)語(yǔ)義雙重感知的社區(qū)檢測(cè)
巧妙融合結(jié)構(gòu)拓?fù)涮卣髋c子圖語(yǔ)義信息,在復(fù)雜網(wǎng)絡(luò)中提煉高維度知識(shí)加強(qiáng)推理總結(jié)能力,社區(qū)生成效果顯著優(yōu)于傳統(tǒng) Leiden 和 Louvain 算法。利用大模型進(jìn)行社區(qū)摘要生成,實(shí)現(xiàn)更高層次的知識(shí)抽象。

3. 智能迭代檢索機(jī)制
深度理解圖 Schema,將復(fù)雜查詢針對(duì)性地轉(zhuǎn)換為符合圖特征且可并行處理的子查詢,通過(guò)迭代檢索進(jìn)一步提升思維鏈追溯與反思能力。
