隨著生成式 AI 與多模態技術迅速發展,「Node-RED x Gemini」的結合,為影像辨識與數據自動化帶來嶄新動能。本次兩小時的實戰直播課程,將帶您深入了解 Google Gemini Vision Language Model(VLM)多模態模型、Node-RED 的高彈性整合能力,以及如何結合兩者,打造即時影像辨識與數據提取系統。從架構認識到串流實作與現場演練,協助學員掌握未來影像資料自動化的關鍵技術。
(一) 課程亮點
- 即學即用,對接產業需求
結合 Node-RED 的低程式門檻設計與 Gemini 的先進影像 AI,學完即可應用於自動監控、流程數據採集等多元場景。
- 完整實戰流程演練
涵蓋 API 串接、RTSP 影像流整合、VLM 推論到結構化數據輸出,深入解決產線、IoT、自動化等實務痛點。
- 零程式基礎也能上手 AI 影像辨識
視覺化操作介面與清晰教學,幫助資訊、製造、智慧建築等跨領域學員輕鬆掌握核心技術。
(二) 課程架構
1. Gemini 簡介
- 建立Gemini服務及取得API。
- 了解REST API串接方式及結果解析。
2. Node-RED 串接實作
- Node-RED 的安裝與擴充節點介紹(multipart-stream-decoder、Base64)。
- 詳細說明 Gemini API 申請、認證設定與 API Key 安全管理,並以模組化架構呈現。
- 實作範例:以視覺介面啟動影像分析、串接 Gemini AI 並解析回傳內容,搭配錯誤排查機制。
3. 串流影像辨識與數據提取
- 實作演練:即時影像流接入 Gemini,演示分段推送與結果擷取,並將回傳內容以表格/結構化資料呈現。
- 情境應用:整合自動化流程至設備偵測、工安監控、產業數據採集等多種實務場域。
(三) 適合對象
- 想導入 AI 多模態影像辨識、自動化流程的資訊、IoT、製造、安防與智慧建築相關從業者或工程師
- 無程式基礎但希望親自操作 AI 應用的企劃/管理者
- 有數據結構化、自動化資料捕捉需求的各產業人才
🎯讓 AI 看懂影像,數據自動入庫 — 跨領域應用盡在
本堂「Node-RED x Gemini」實戰直播課!
(四) 講者介紹
尤濬哲(夜市小霸王)
創辦「夜市小霸王」公司,專為對物聯網有興趣、零經驗的開發學習者而生的入門級AIoT教學,輕鬆開啟物聯網的大門。
曾任大學助理教授/專欄作家/知名部落客,以及點點滴滴科技研發總監等身份,專長包括人工智慧、多媒體互動(Unity)、智慧互動裝置(APP、Arduino)、虛擬實境與擴增實境互動、IoT 實做開發。
學歷:中山大學資訊管理研究所 博士
(五) 課程資訊
► 主辦單位:MakerPRO
► 上課方式:Google Meet直播
► 時間:2025年8月29日(五) 14:00-16:00 (13:50 開始報到)
► 收費方式:NTD 500元
► 聯絡方式:sherry.yang@makerpro.cc;02-23679308 楊小姐
► 注意事項:報名成功後會發ACCUPASS e-mail通知,活動前MakerPRO也會發e-mail通知,請留意並準時上線
► 請於報名表中正確填寫二聯、手機載具或三聯式發票資料,以便會後提供發票。(選取二聯發票者,如若中獎,則會寄送至填寫地址,未中獎將不另行寄送。)