NL2SQL|AI|POC by Vibe Coding( Claude Code / Google Antigravity )
專案說明
NL2SQL 結構化數據問答流程 ( NL2SQL Data Q&A Pipeline ) 是一個旨在解決 RAG 技術「數值運算缺陷」的精準問答方案。
針對企業報表、財務數據等高精確度場景,本專案不依賴語言模型的生成能力進行計算,而是 將自然語言轉譯為可執行的資料庫查詢指令(SQL)。核心價值在於實現「數據民主化」,讓非技術人員(如業務、管理層)能透過對話直接獲取準確的數據洞察,同時確保數據來源的 100% 可驗證性,消除 AI 在數值上的幻覺風險。
專案背景
在企業知識管理(KM)的實際應用中,我們發現客戶不僅需要查詢文件(非結構化資料),更頻繁地需要查詢營收、庫存、績效等結構化數據。
然而,既有的 RAG 架構在面對這類需求時存在嚴重不足:
數值幻覺(Hallucination):
LLM 擅長文字續寫,但在進行加總、佔比等精算時經常出錯,這在金融與公部門場景是零容忍的
檢索邏輯斷層:
向量相似度無法處理「篩選大於 500萬 的訂單」這類邏輯精確的條件
信任危機:
使用者無法驗證 AI 給出的數字是怎麼算出來的,導致決策者對於採用 AI 提供的數據存在疑慮
因此,關鍵在於:如何打造如同 RAG 一樣的問答場景,又能夠確保結構化數據準確查詢(有效應用)?
專案階段
階段一:場景痛點定義
識別現有 RAG 產品在處理結構化數據時的「數值幻覺」問題,確立以 NL2SQL 查詢真實資料的解決方案,取代混合檢索(關鍵字 + 向量)的產品方向
階段二:敏捷原型開發 ( Vibe Coding )
使用 Claude Code 進行 vibe coding,在一週內快速搭建包含 Schema 解析、查詢轉譯到結果解釋的完整 POC,驗證技術可行性
階段三:價值驗證與提案
與使用者進行互動測試,驗證「查詢+檢核」模式對提升數據信任度的有效性,並完成產品規格提報
![]() | ![]() |
|---|---|
將數據轉為文字詮釋( Result-to-Text Generator ) | SQL 查詢數據( SQL Query Generator ) |
![]() | LLM 生成的 SQL 查詢語法 |
專案過程
策略轉向:從「生成」轉為「執行」
為了徹底解決數值準確性問題,將 LLM 的角色重新定義為「翻譯官」,負責理解使用者的業務意圖(Intent),並將其轉化為資料庫能看懂的 SQL 指令。計算的工作回歸給最擅長計算的資料庫引擎,確保結果 100% 精準
彌合「業務語言」與「數據結構」的鴻溝
單純的 SQL 生成往往因為欄位命名晦澀而失敗。在本架構中導入 欄位說明補充流程,引入「人機協作」機制,讓資料管理者能為冷冰冰的資料表欄位補充業務說明(Context)。這讓 AI 能聽懂「高價值客戶」對應的是
total_spend > 10000的邏輯,而非瞎猜構建「可解釋性」的信任迴圈
針對企業、政府機關客戶對 AI 的高度可驗證性需求,我設計了「三段式回應」的產品體驗:不僅給出自然語言的結論( Insight ),還同步展示「查詢指令( SQL )」與「原始數據表格( Raw Data )」。這讓使用者(或稽核人員)擁有「驗算」的權利,從而建立起對系統的深層信任
極速驗證產品假設
作為 PM,我利用 Claude Code( Vibe Coding ) 進行全端原型的快速搭建。在不佔用工程團隊資源的前提下,僅用 5 天 就完成了從資料庫串接到前端介面的 POC。這不僅驗證了技術可行性,更讓團隊在開發前就看到了具體的產品樣貌,大幅降低了溝通成本與開發風險

解決方案
實施「零幻覺數據查詢機制」
核心策略:以確定性的資料庫運算取代機率性的模型生成
執行細節:限制 LLM 僅負責邏輯推導,所有的加減乘除、排序篩選皆轉化為 SQL 語法由 Database 執行
價值:徹底解決了 RAG 模型「一本正經胡說八道」的數值問題,讓產品能安全應用於財務報表、庫存盤點等高風險場景
打造「數據民主化」的操作介面
核心策略:降低數據查詢的技術門檻
執行細節:透過 NL2SQL 技術,讓不懂 SQL 的業務人員也能用口語(如:「幫我列出上個月銷售前三名的產品」)直接調用資料庫數據,並由 AI 自動將結果轉譯為易讀的中文分析報告
價值:大幅提升結構化資料應用效率,讓業務決策者能即時獲取數據,縮短從「產生問題」到「獲得答案」的決策週期
建立「白箱化」的合規驗證標準
核心策略:主動揭露推導過程,滿足企業稽核需求
執行細節:系統強制輸出 SQL 查詢邏輯與原始數據快照,作為 AI 回答的「佐證」
價值:將 AI 從「黑箱」變為「白箱」,符合政府與大型企業對可解釋性 AI(XAI)的合規要求,成為產品進入高監管市場的關鍵敲門磚
成果說明
解決結構化數據的 RAG 盲區
POC 驗證證實,本方案能精準處理包含多重篩選、聚合計算(Group By)、比例運算等複雜邏輯的商業提問,填補了原產品線在「精確數據檢索」上的功能缺口
顯著降低技術驗證成本 (Time-to-Validation)
透過 PM 獨立執行 Vibe Coding,將原需工程團隊投入 2-3 週的技術評估期縮短至 1 週。這不僅加速了產品迭代節奏,也為公司節省了顯著的研發人力成本
提升客戶對 AI 產品的信任度
NL2SQL 解決方案兼具「可解釋性」、「準確性」,提升 B2B 場景中潛在客戶對於產品應用的信任度







