實習成果
公司環境寬敞整潔、燈光明亮,並設有完善的會議室、公共區與洗手間,提供舒適的工作空間。
鄰近捷運台北小巨蛋站,步行約10分鐘;外有公車站與 Ubike 租借站,交通便利。
公司周邊餐廳、店家許多,樓下是全聯,整體環境優。
彈性上下班時間,配合個人需求。
我目前所在的單位是資策會數位轉型研究院文化科技中心的方案應用組,在1月至2月期間,我主要了解多模態AI與大型語言模型的相關概念與應用,並針對此主題製作了一份簡報與Demo,向主管及同事進行報告與分享。
以我了解到的內容來說,多模態 AI 是指能夠同時處理並整合來自不同類型資料(如文字、圖像、語音等)的人工智慧技術。它透過將多種感知模態進行融合,使模型能更全面地理解和推理複雜的情境。例如,結合圖像與文字的模型可應用於圖文生成、影片字幕產生、智慧客服等領域。這類技術也常搭配大型語言模型(LLM)進行語意理解與生成,進一步提升應用效能與互動體驗。
大型語言模型(Large Language Model, LLM)是一種基於深度學習的自然語言處理技術,透過大量文本資料進行訓練,使模型具備語意理解、語言生成、推理與對話等能力。LLM可應用於各種任務,例如自動摘要、問答系統、語意搜尋、程式碼輔助生成等。近期熱門的模型如 GPT-4、Gemini 和 Claude 等,已廣泛應用於產業自動化與智慧服務,並可與多模態技術結合,實現更自然直覺的人機互動。
我製作了一份影像辨識教案(涵蓋 SAM2、OpenCV、YOLO 基本原理與實作方式),並延伸實作深度學習研究、物件追蹤與 SAM2 物件分割,深化模型應用與概念理解。我於 Google Colab 中整合 jupyter_bbox_widget,讓使用者可以直接用滑鼠在影像上點選或框選目標物件,系統接收框選後自動產生高精度語意遮罩。
於 FIND 平台發表技術觀測文章,追蹤 AI 與產業趨勢,詳見《FIND 技術觀測:AI趨勢分析》。
專案管理與行政支援:撰寫對外談參資料、會議記錄、專案簡報及計畫書彙整、資料蒐集與整合及行政支援,同時投入以下專案內容:
參與政府與產業數位轉型專案,深入了解前瞻科技與數位服務轉型應用。
我在本次實習中,我主要扮演專案支援與協調角色。除了負責文件撰寫與資料整合,也參與多項專案之行政與內容協作,需跨單位與不同領域人員溝通。
透過協助專案管理與執行,我實際接觸到多項科技領域,如低軌衛星通訊、數位轉型、多模態AI技術等,深入了解政府與產業目前推動的數位轉型方向與政策重點。這讓我在過程中不僅提升了專案管理、溝通協調與資料分析能力,也加深了對新興科技發展趨勢的理解與興趣。
無任務時主動規劃學習,持續研究 AI Agent、LLM、低軌衛星與影像辨識,透過閱讀與實作吸收新知識。
從談參、簡報、會議紀錄到 RFP、PEP 、KPI查核資料及計劃其執行報告,熟悉資料計畫管理流程,強化邏輯組織與跨部門協作能力。
掌握低軌衛星、數位轉型、多模態 AI 等科技應用情境。
隨著高齡化社會的到來,病患同時服用多種藥物的情形日益普遍。然而,許多藥品在外觀上相似,且病患常忘記藥物用途,容易造成用藥錯誤,甚至導致嚴重的健康風險。 為了降低誤服風險並提升用藥安全,本研究提出「智慧用藥安全辨識系統」,結合影像辨識與人工智慧技術,協助使用者快速辨識藥物名稱與用途,並提供即時的用藥提醒與安全建議。
img=640、batch=16、約 epochs=300 訓練,產生可輸出「類別+信心分數」之權重。建立 8 類藥物(胃悅腸溶膜衣錠、A錠s綜合感冒藥、伯基腸溶膠囊、賜康保肝膠囊、Norvasc 脈優錠、立剋核膜衣錠、待匹力鎮糖衣錠、舒肌筋新錠)。
nc 類別數與名稱。yolo detect train model=yolov8s.pt data=../traindata/medicine.yaml imgsz=640 batch=16 epochs=300''
在工作上,我認為自己已逐漸適應單位的步調與工作方式,能夠確實完成主管與同事交辦的任務。然而,在執行過程中,我也發現自己在一些細節上仍有改進空間,期望能在未來的工作中更加細心,提升執行效率與品質。
在實習期間,我除了準時完成主管交辦的工作外,也會善用空閒時間主動學習與充實自己。例如,在參與專案與會議時,經常會遇到不熟悉的技術專有名詞,我會立即查詢並記錄下來,以加深理解與應用。這樣的學習方式讓我逐步提升了資訊吸收與分析能力,也能更快理解專案的背景與技術內容。
此外,專案執行過程中常會遇到需要與同事或跨組的溝通和討論、釐清問題的情況,這讓我意識到溝通與表達能力的重要性。未來我希望能持續培養主動提問與有效表達的能力,讓自己在團隊合作中能更清楚地傳達想法與需求,進而在職場中發揮更大的貢獻。