生成式AI在升學備審文件製作之輔助初探

本研究整合 RAG 檢索增強生成技術與 Skeleton of Thought 多階段生成策略, 開發一站式升學備審輔助系統。透過網頁爬蟲自動擷取各校招生資訊, 結合大型語言模型(GPT-4、Gemini)提供個人化撰寫建議, 有效降低幻覺率至 4.5%、提升內容一致性達 93%,並將生成時間縮短 83%。

了解更多專題介紹

關於專題

研究動機

本研究針對台灣現行大學個人申請制度中，學生與輔導老師常面臨的資訊分散、資料整合困難與備審建議難以精準的問題，提出結合生成式AI與RAG技術之解決方案。

學生需查詢不同學校網站的招生簡章與審查標準，往往耗時費力，且可能導致資訊不完整。

輔導老師也因招生資訊更新不及時而無法提供有效建議，因此有必要建立一套智能化、一站式的輔助系統。

研究目的

本研究目標為開發一個結合「網頁爬蟲 + 生成式 AI + 檢索增強生成（RAG）」的升學備審輔助系統，實現以下目標：

1.建立能快速查詢各大學招生簡章與審查標準的智能查詢模組。

2.提供符合各學系需求的自傳與學習歷程撰寫建議。

3.支援學生與輔導老師使用，提升備審資料的撰寫效率與品質。

研究挑戰

本研究在開發生成式 AI 備審輔助系統的過程中，面臨三大挑戰：

1.資料擷取與處理：招生資訊分散於多個網站與格式（HTML、PDF、掃描檔），需整合爬蟲與OCR技術，轉換為可查詢的結構化資料庫。

2.語意檢索與生成：審查標準不一，生成內容需精準貼合學系需求，故系統採用RAG技術，降低生成偏誤與虛構風險。

3.個人化生成：備審強調個人特色，系統需設計資料填寫與上傳機制，讓模型可依學生背景生成具真實性與表現力的建議內容，並處理資料綁定、格式轉換與語氣調整等問題。

研究成果

系統在 324 組樣本測試中表現優異，導入 SoT 與 RAG 技術後各項指標顯著提升：

4.5%

幻覺率

↓ 70.4%

93%

內容一致性

↑ 11%

24.8秒

生成時間

↓ 83.9%

18.55/20

邏輯性得分

↑ 8.1%

技術導入前後對比

評估指標	未使用技術	使用 SoT + RAG	改善幅度
語意錯位率	9.1%	4.7%	↓ 48.4%
段落主題一致性	84%	94%	+10.0%
邏輯性與結構	17.16 / 20	18.55 / 20	+8.1%
內容完整度	15.83 / 20	17.95 / 20	+13.4%
語句重複率	28.8%	22.4%	↓ 22.2%
完整生成時間	153.6 秒	24.8 秒	↓ 83.9%

數據來源：本研究實驗數據 (n=324)，2025年3月內部測試

RAG 向量模型效能比較

向量模型	檢索數量	命中率 (Hit@5)	幻覺率
SBERT-Base	Top-5	86%	15.2%
BGE-M3 ⭐	Top-5	94%	4.5%
E5-Base	Top-5	92%	6.3%

BGE-M3 模型在命中率與幻覺率之間取得最佳平衡

系統架構

三層式架構設計

系統採用現代化的三層架構設計，將資料處理、業務邏輯與使用者介面完全分離，確保系統的可維護性、可擴展性與穩定性。

資料處理層

整合網頁爬蟲、OCR 文字辨識與資料正規化技術，將各校招生簡章轉換為結構化資料，儲存至 PostgreSQL 資料庫。支援定期自動更新與資料品質驗證，確保招生資訊的完整性與準確性。

Python爬蟲 Tesseract OCR PostgreSQL

應用層

採用 LangChain + FAISS 實現 RAG 檢索，結合 GPT-4 與 Gemini 進行多階段內容生成。系統支援權限管理、歷史紀錄查詢，並提供 API 接口供前端調用，實現高效的內容生成與語意檢索。

LangChain FAISS向量庫 GPT-4/Gemini

使用者介面層

Flask + Jinja2 實現響應式網頁介面，提供學生端與輔導老師端雙模式。支援即時預覽、段落重生成、語氣切換與 Word 匯出，提供直觀友善的使用體驗。

Flask Jinja2模板 HTML/CSS/JS

成果介紹

Skeleton of Thought (SoT) 多階段生成技術

本系統導入 Skeleton of Thought 骨架生成技術,模擬人類「先組織後表達」的寫作邏輯,將生成流程分為四個階段:釐清任務與骨架生成 → 主體內容撰寫 → 風格潤飾 → 結構整合,有效降低語意漂移與重複生成問題。

Skeleton of Thought 多階段生成技術

技術特色

澄清階段:自動檢測關鍵欄位完整性,引導使用者補充必要資訊
骨架構建:先產出主題、子題與段落大綱,確保邏輯層次清晰
並行生成:多段落同步處理,生成時間縮短 83.9%
語意檢查:自動偵測段落間語意斷層並生成過渡句

多模型協同與個性化風格控制

採用「快速初稿 + 高質潤飾」的雙階段策略:GPT-4o-mini負責快速生成結構化內容，並由GPT-4o-mini結合Gemini-2.0-Flash執行語氣調整與事實性校正。系統提供三層自定義風格控制,讓使用者設定語氣、偏好用詞與避免詞彙,確保生成內容展現個人特色。

多模型協同與個性化風格控制

技術優勢

異質模型合作:結合不同模型優勢,兼顧效率與品質
語句重複率降低至 22.4% (改善 22.2%)
支援自然、正式、溫暖等多種預設語氣
可自定義專屬寫作風格,提升個人化表現

備審資料查詢模組

本系統運用RAG（檢索增強生成）技術，結合資料庫中各校系的結構化資料，提供使用者查詢各學校與學系的備審資料準備重點與建議。當使用者輸入查詢條件後，系統先從資料庫檢索對應的學系特色、教授關注點、書審重點等內容，並透過語言模型生成精煉段落，將準備方向以清楚直觀的方式呈現。

備審資料查詢模組

備審資料查詢模組

備審資料查詢模組

重點功能

查詢校系所需繳交的備審資料項目
利用RAG技術整理學系特色與培養重點
提供學生備審資料準備方向與建議
結構化顯示，資訊一目了然

備審段落自動生成模組

結合GPT-3.5/4、Google Gemini等大型語言模型與RAG技術，根據學生輸入與學系需求，自動產生個人化、自傳與學習歷程等段落內容，提升備審資料的針對性與真實性。

備審段落自動生成模組

重點功能

多層 Prompt 設計，提升生成內容的結構性與語氣多樣性
結合學系審查重點與學生輸入進行個別化生成
即時預覽段落內容，支援重新生成與語氣切換
支援 Word 檔下載與段落歷史紀錄管理
多段落分類生成器（自傳、學習歷程、自主學習等）

RAG 檢索生成技術模組

RAG（Retrieval-Augmented Generation）技術結合向量檢索與語言模型生成，確保AI所產生的內容有明確資料來源與事實依據，降低幻覺（hallucination）風險。

RAG 檢索生成技術模組

RAG 檢索生成技術模組

重點功能

整合LangChain框架與FAISS向量資料庫
支援多模態生成（段落、表格、心智圖）
依查詢條件自動檢索最相關校系審查標準與資料範例
將檢索結果納入提示詞 context，強化生成真實性
可針對個別段落執行動態檢索與生成調整，提升彈性

PDF/JPG 檔案上傳與自動解析模組

透過OCR與PDF解析技術，自動擷取學生上傳之證明文件（如獎狀、學習紀錄）內容，轉換為結構化資料，供段落生成與個人化建議使用。

PDF/JPG 檔案上傳與自動解析模組

重點功能

支援PDF、Word、JPG、PNG等多種格式
非純文字檔案整合OCR（Tesseract）進行圖像文字辨識
解析後自動提取關鍵資訊（活動名稱、時間、獲獎內容等）
搭配語意標註與分類，提升生成時資料引用準確性

團隊成員

林芝伃

資管3B

個人簡介

專注於生成式 AI 應用開發與系統架構設計。在本專題中負責需求分析、技術整合與系統設計, 主導多階段 LLM 串聯架構開發, 成功整合 RAG、SoT 與多模型協同技術, 實現高效能、低幻覺率的個人化內容生成系統。

專案使用技能

Python
Flask 後端開發
LLM API 串接 (GPT-4, Gemini)
RAG 架構設計
LangChain 框架
FAISS 向量資料庫
Prompt Engineering
OCR 文件解析
前端開發 (HTML/CSS/JavaScript)

負責項目

系統需求分析與技術架構設計
Skeleton of Thought 四階段生成流程開發
RAG 檢索增強生成模組實作
多模型協同策略設計與 Prompt 優化
個性化風格控制系統開發
PDF/圖像文件自動解析模組
前後端整合與 API 設計