生成式AI在升學備審文件製作之輔助初探

本研究整合 RAG 檢索增強生成技術與 Skeleton of Thought 多階段生成策略, 開發一站式升學備審輔助系統。透過網頁爬蟲自動擷取各校招生資訊, 結合大型語言模型(GPT-4、Gemini)提供個人化撰寫建議, 有效降低幻覺率至 4.5%、提升內容一致性達 93%,並將生成時間縮短 83%。

關於專題

研究動機

本研究針對台灣現行大學個人申請制度中,學生與輔導老師常面臨的資訊分散、資料整合困難與備審建議難以精準的問題,提出結合生成式AI與RAG技術之解決方案。

學生需查詢不同學校網站的招生簡章與審查標準,往往耗時費力,且可能導致資訊不完整。

輔導老師也因招生資訊更新不及時而無法提供有效建議,因此有必要建立一套智能化、一站式的輔助系統。

研究目的

本研究目標為開發一個結合「網頁爬蟲 + 生成式 AI + 檢索增強生成(RAG)」的升學備審輔助系統,實現以下目標:

1.建立能快速查詢各大學招生簡章與審查標準的智能查詢模組。

2.提供符合各學系需求的自傳與學習歷程撰寫建議。

3.支援學生與輔導老師使用,提升備審資料的撰寫效率與品質。

研究挑戰

本研究在開發生成式 AI 備審輔助系統的過程中,面臨三大挑戰:

1.資料擷取與處理:招生資訊分散於多個網站與格式(HTML、PDF、掃描檔),需整合爬蟲與OCR技術,轉換為可查詢的結構化資料庫。

2.語意檢索與生成:審查標準不一,生成內容需精準貼合學系需求,故系統採用RAG技術,降低生成偏誤與虛構風險。

3.個人化生成:備審強調個人特色,系統需設計資料填寫與上傳機制,讓模型可依學生背景生成具真實性與表現力的建議內容,並處理資料綁定、格式轉換與語氣調整等問題。

研究成果

系統在 324 組樣本測試中表現優異,導入 SoT 與 RAG 技術後各項指標顯著提升:

4.5%
幻覺率
↓ 70.4%
93%
內容一致性
↑ 11%
24.8
生成時間
↓ 83.9%
18.55/20
邏輯性得分
↑ 8.1%

技術導入前後對比

評估指標 未使用技術 使用 SoT + RAG 改善幅度
語意錯位率 9.1% 4.7% ↓ 48.4%
段落主題一致性 84% 94% +10.0%
邏輯性與結構 17.16 / 20 18.55 / 20 +8.1%
內容完整度 15.83 / 20 17.95 / 20 +13.4%
語句重複率 28.8% 22.4% ↓ 22.2%
完整生成時間 153.6 秒 24.8 秒 ↓ 83.9%

數據來源:本研究實驗數據 (n=324),2025年3月內部測試

RAG 向量模型效能比較

向量模型 檢索數量 命中率 (Hit@5) 幻覺率
SBERT-Base Top-5 86% 15.2%
BGE-M3 Top-5 94% 4.5%
E5-Base Top-5 92% 6.3%

BGE-M3 模型在命中率與幻覺率之間取得最佳平衡

系統架構

三層式架構設計

系統採用現代化的三層架構設計,將資料處理、業務邏輯與使用者介面完全分離,確保系統的可維護性、可擴展性與穩定性。

資料處理層

整合網頁爬蟲、OCR 文字辨識與資料正規化技術,將各校招生簡章轉換為結構化資料,儲存至 PostgreSQL 資料庫。支援定期自動更新與資料品質驗證,確保招生資訊的完整性與準確性。

Python爬蟲 Tesseract OCR PostgreSQL

應用層

採用 LangChain + FAISS 實現 RAG 檢索,結合 GPT-4 與 Gemini 進行多階段內容生成。系統支援權限管理、歷史紀錄查詢,並提供 API 接口供前端調用,實現高效的內容生成與語意檢索。

LangChain FAISS向量庫 GPT-4/Gemini

使用者介面層

Flask + Jinja2 實現響應式網頁介面,提供學生端與輔導老師端雙模式。支援即時預覽、段落重生成、語氣切換與 Word 匯出,提供直觀友善的使用體驗。

Flask Jinja2模板 HTML/CSS/JS

成果介紹

Skeleton of Thought (SoT) 多階段生成技術

本系統導入 Skeleton of Thought 骨架生成技術,模擬人類「先組織後表達」的寫作邏輯,將生成流程分為四個階段:釐清任務與骨架生成 → 主體內容撰寫 → 風格潤飾 → 結構整合,有效降低語意漂移與重複生成問題。

Skeleton of Thought 多階段生成技術

技術特色

  • 澄清階段:自動檢測關鍵欄位完整性,引導使用者補充必要資訊
  • 骨架構建:先產出主題、子題與段落大綱,確保邏輯層次清晰
  • 並行生成:多段落同步處理,生成時間縮短 83.9%
  • 語意檢查:自動偵測段落間語意斷層並生成過渡句

多模型協同與個性化風格控制

採用「快速初稿 + 高質潤飾」的雙階段策略:GPT-4o-mini負責快速生成結構化內容,並由GPT-4o-mini結合Gemini-2.0-Flash執行語氣調整與事實性校正。系統提供三層自定義風格控制,讓使用者設定語氣、偏好用詞與避免詞彙,確保生成內容展現個人特色。

多模型協同與個性化風格控制

技術優勢

  • 異質模型合作:結合不同模型優勢,兼顧效率與品質
  • 語句重複率降低至 22.4% (改善 22.2%)
  • 支援自然、正式、溫暖等多種預設語氣
  • 可自定義專屬寫作風格,提升個人化表現

備審資料查詢模組

本系統運用RAG(檢索增強生成)技術,結合資料庫中各校系的結構化資料,提供使用者查詢各學校與學系的備審資料準備重點與建議。當使用者輸入查詢條件後,系統先從資料庫檢索對應的學系特色、教授關注點、書審重點等內容,並透過語言模型生成精煉段落,將準備方向以清楚直觀的方式呈現。

備審資料查詢模組 備審資料查詢模組 備審資料查詢模組

重點功能

  • 查詢校系所需繳交的備審資料項目
  • 利用RAG技術整理學系特色與培養重點
  • 提供學生備審資料準備方向與建議
  • 結構化顯示,資訊一目了然

備審段落自動生成模組

結合GPT-3.5/4、Google Gemini等大型語言模型與RAG技術,根據學生輸入與學系需求,自動產生個人化、自傳與學習歷程等段落內容,提升備審資料的針對性與真實性。

備審段落自動生成模組

重點功能

  • 多層 Prompt 設計,提升生成內容的結構性與語氣多樣性
  • 結合學系審查重點與學生輸入進行個別化生成
  • 即時預覽段落內容,支援重新生成與語氣切換
  • 支援 Word 檔下載與段落歷史紀錄管理
  • 多段落分類生成器(自傳、學習歷程、自主學習等)

RAG 檢索生成技術模組

RAG(Retrieval-Augmented Generation)技術結合向量檢索與語言模型生成,確保AI所產生的內容有明確資料來源與事實依據,降低幻覺(hallucination)風險。

RAG 檢索生成技術模組 RAG 檢索生成技術模組

重點功能

  • 整合LangChain框架與FAISS向量資料庫
  • 支援多模態生成(段落、表格、心智圖)
  • 依查詢條件自動檢索最相關校系審查標準與資料範例
  • 將檢索結果納入提示詞 context,強化生成真實性
  • 可針對個別段落執行動態檢索與生成調整,提升彈性

PDF/JPG 檔案上傳與自動解析模組

透過OCR與PDF解析技術,自動擷取學生上傳之證明文件(如獎狀、學習紀錄)內容,轉換為結構化資料,供段落生成與個人化建議使用。

PDF/JPG 檔案上傳與自動解析模組

重點功能

  • 支援PDF、Word、JPG、PNG等多種格式
  • 非純文字檔案整合OCR(Tesseract)進行圖像文字辨識
  • 解析後自動提取關鍵資訊(活動名稱、時間、獲獎內容等)
  • 搭配語意標註與分類,提升生成時資料引用準確性

團隊成員

林芝伃

林芝伃

資管3B

個人簡介

專注於生成式 AI 應用開發與系統架構設計。 在本專題中負責需求分析、技術整合與系統設計, 主導多階段 LLM 串聯架構開發, 成功整合 RAG、SoT 與多模型協同技術, 實現高效能、低幻覺率的個人化內容生成系統。

專案使用技能

  • Python
  • Flask 後端開發
  • LLM API 串接 (GPT-4, Gemini)
  • RAG 架構設計
  • LangChain 框架
  • FAISS 向量資料庫
  • Prompt Engineering
  • OCR 文件解析
  • 前端開發 (HTML/CSS/JavaScript)

負責項目

  • 系統需求分析與技術架構設計
  • Skeleton of Thought 四階段生成流程開發
  • RAG 檢索增強生成模組實作
  • 多模型協同策略設計與 Prompt 優化
  • 個性化風格控制系統開發
  • PDF/圖像文件自動解析模組
  • 前後端整合與 API 設計