元智大學資訊管理學系
第三十屆專業實習期末報告

實習成果

實習公司
財團法資訊工業策進會
公司代號
O3
指導教授
王仁甫 教授
學號
1111676
姓名
林志宇
實習單位
數位轉型研究院
文化科技中心 方案應用組

📋 工作內容

工作環境

公司環境

公司環境寬敞整潔、燈光明亮,並設有完善的會議室、公共區與洗手間,提供舒適的工作空間。

交通運輸

鄰近捷運台北小巨蛋站,步行約10分鐘;外有公車站與 Ubike 租借站,交通便利。

周邊機能

公司周邊餐廳、店家許多,樓下是全聯,整體環境優。

工作時間

彈性上下班時間,配合個人需求。

工作詳述

我目前所在的單位是資策會數位轉型研究院文化科技中心的方案應用組,在1月至2月期間,我主要了解多模態AI與大型語言模型的相關概念與應用,並針對此主題製作了一份簡報與Demo,向主管及同事進行報告與分享。

多模態AI與大型語言模型

多模態AI

以我了解到的內容來說,多模態 AI 是指能夠同時處理並整合來自不同類型資料(如文字、圖像、語音等)的人工智慧技術。它透過將多種感知模態進行融合,使模型能更全面地理解和推理複雜的情境。例如,結合圖像與文字的模型可應用於圖文生成、影片字幕產生、智慧客服等領域。這類技術也常搭配大型語言模型(LLM)進行語意理解與生成,進一步提升應用效能與互動體驗。

多模態AI示意圖
多模態AI整合音訊、視訊、圖像與文字等不同資料類型,實現更全面的智能理解與應用。

大型語言模型 (LLM)

大型語言模型(Large Language Model, LLM)是一種基於深度學習的自然語言處理技術,透過大量文本資料進行訓練,使模型具備語意理解、語言生成、推理與對話等能力。LLM可應用於各種任務,例如自動摘要、問答系統、語意搜尋、程式碼輔助生成等。近期熱門的模型如 GPT-4、Gemini 和 Claude 等,已廣泛應用於產業自動化與智慧服務,並可與多模態技術結合,實現更自然直覺的人機互動。

大型語言模型示意圖
大型語言模型透過深度學習訓練,具備文本分析、對話生成、程式設計等多元能力,成為現代AI應用的核心技術。
影像辨識教案與延伸(2-4月)

我製作了一份影像辨識教案(涵蓋 SAM2、OpenCV、YOLO 基本原理與實作方式),並延伸實作深度學習研究物件追蹤SAM2 物件分割,深化模型應用與概念理解。我於 Google Colab 中整合 jupyter_bbox_widget,讓使用者可以直接用滑鼠在影像上點選或框選目標物件,系統接收框選後自動產生高精度語意遮罩。

FIND 技術觀測文章(3-4月)

於 FIND 平台發表技術觀測文章,追蹤 AI 與產業趨勢,詳見《FIND 技術觀測:AI趨勢分析》

專案管理、行政支援與產業分析(2-12月)

專案管理與行政支援:撰寫對外談參資料、會議記錄、專案簡報及計畫書彙整、資料蒐集與整合及行政支援,同時投入以下專案內容:

  • 數位發展部數位產業署衛星通訊應用服務計畫 : 首先是產業分析,從全球太空產業現況與應用趨勢出發,探索及分析成功案例: Sateliot×Sentrisense 智慧電網監控、Google 都市熱島分析、歐洲文化遺址數位分身、以色列ORCA透過電腦視覺、雷達及低軌衛星自動辨識海上障礙物等案例,並思考台灣在通訊、海事、醫療、教育與基礎設施監控等衛星應用上的發展方向;後續是專案管理,參與數位發展部數位產業署的衛星通訊應用計畫,負責專案協助與行政協調、計畫書與期中報告撰寫、RFP 技術與交付標準訂定、採購與 PEP 文件撰寫整理,以及簡報與佐證資料製作,實際執行跨單位協作與合規管控。
  • 經濟部中小及新創企業署數位轉型計畫 : 我參與「經濟部中小及新創企業署數位轉型輔導計畫」,主要協助辦理紡織業 AI 應用供需媒合會,以工作坊形式推動傳產理解 AI 應用價值並促進業者交流。同時負責成果簡報與輔導紀錄彙整、建立與更新參與企業資料並登錄專案管理系統,及撰寫 AI 應用解決方案規劃構想報告。在過程中也觀察到部分資深員工對 AI 導入仍有保留,且企業多依賴紙本流程,尚未整合資料與知識庫、生產排程不透明及庫存管理等問題,凸顯數位轉型需兼顧科技接受、組織變革與資料整合、商業智慧導入的課題。
參與專案與活動

參與政府與產業數位轉型專案,深入了解前瞻科技與數位服務轉型應用。

📊 實習期間完成之進度

👤 工作中扮演的角色

我在本次實習中,我主要扮演專案支援與協調角色。除了負責文件撰寫與資料整合,也參與多項專案之行政與內容協作,需跨單位與不同領域人員溝通。

透過協助專案管理與執行,我實際接觸到多項科技領域,如低軌衛星通訊、數位轉型、多模態AI技術等,深入了解政府與產業目前推動的數位轉型方向與政策重點。這讓我在過程中不僅提升了專案管理、溝通協調與資料分析能力,也加深了對新興科技發展趨勢的理解與興趣。

💡 學習

📚

自主安排學習進度

無任務時主動規劃學習,持續研究 AI Agent、LLM、低軌衛星與影像辨識,透過閱讀與實作吸收新知識。

📝

專案管理與資料整合

從談參、簡報、會議紀錄到 RFP、PEP 、KPI查核資料及計劃其執行報告,熟悉資料計畫管理流程,強化邏輯組織與跨部門協作能力。

🌐

科技應用與跨域連作

掌握低軌衛星、數位轉型、多模態 AI 等科技應用情境。

智慧用藥安全辨識系統

專題概述

隨著高齡化社會的到來,病患同時服用多種藥物的情形日益普遍。然而,許多藥品在外觀上相似,且病患常忘記藥物用途,容易造成用藥錯誤,甚至導致嚴重的健康風險。 為了降低誤服風險並提升用藥安全,本研究提出「智慧用藥安全辨識系統」,結合影像辨識與人工智慧技術,協助使用者快速辨識藥物名稱與用途,並提供即時的用藥提醒與安全建議。

系統技術流程

  • 資料標註 : 整理藥品影像並標註類別,建立 YAML 指定資料來源、類別數與名稱。
  • 模型訓練 : 以Yolov8 img=640batch=16、約 epochs=300 訓練,產生可輸出「類別+信心分數」之權重。
  • 推論流程 : 輸入藥品圖片 → 產生框選與標籤、各類別機率 → 取信心分數最高者作為預測。
  • 服務部署 : 以 Flask 建立輕量 API,前端透過 URL 參數或表單上傳影像;後端擷取,伺服器載入模型,進行藥物辨識,介面提供藥名稱、用途及信心分數。

訓練設定與類別

建立 8 類藥物(胃悅腸溶膜衣錠、A錠s綜合感冒藥、伯基腸溶膠囊、賜康保肝膠囊、Norvasc 脈優錠、立剋核膜衣錠、待匹力鎮糖衣錠、舒肌筋新錠)。

  • YAML 指定訓練;驗證資料夾、nc 類別數與名稱。
  • 進入 YOLO 目錄執行: yolo detect train model=yolov8s.pt data=../traindata/medicine.yaml imgsz=640 batch=16 epochs=300''
  • 訓練過程輸出指標與權重,完成後保存最佳權重,用於推論與標註產生。

成果展示(模型辨識結果示意)

偵測模型訓練曲線mAP與Loss趨勢,系統可針對輸入的藥物影像進行分類並標示最可能的藥品名稱,搭配信心分數(機率),協助使用者確認藥品資訊與用途。

🎯 自我評估與心得感想

在工作上,我認為自己已逐漸適應單位的步調與工作方式,能夠確實完成主管與同事交辦的任務。然而,在執行過程中,我也發現自己在一些細節上仍有改進空間,期望能在未來的工作中更加細心,提升執行效率與品質。

在實習期間,我除了準時完成主管交辦的工作外,也會善用空閒時間主動學習與充實自己。例如,在參與專案與會議時,經常會遇到不熟悉的技術專有名詞,我會立即查詢並記錄下來,以加深理解與應用。這樣的學習方式讓我逐步提升了資訊吸收與分析能力,也能更快理解專案的背景與技術內容。

此外,專案執行過程中常會遇到需要與同事或跨組的溝通和討論、釐清問題的情況,這讓我意識到溝通與表達能力的重要性。未來我希望能持續培養主動提問與有效表達的能力,讓自己在團隊合作中能更清楚地傳達想法與需求,進而在職場中發揮更大的貢獻。