Boston Dynamics導入Gemini，Spot機器人進化為自主決策系統

關鍵字：；；；；；；；；；

瀏覽次數：1053｜歡迎推文：

科技產業資訊室(iKnow) - 黃松勳發表於 2026年4月17日

圖、Boston Dynamics導入Gemini，Spot機器人進化為自主決策系統

隨著人工智慧技術快速演進，機器人正從單純執行指令的工具，逐步邁向具備理解與推理能力的「具身智慧」系統。近期，Boston Dynamics將Google DeepMind的Gemini Robotics-ER 1.6模型導入Spot機器人，使其能透過自然語言理解任務並自主執行，標誌著AI與實體機器整合邁入新階段。

此次升級的核心在於「具身推理」（embodied reasoning），讓機器人不僅能感知環境，更能理解空間關係與任務邏輯。Spot已可從指示板讀取任務、整理物品、回收物件，甚至檢查陷阱等，顯示其從單一功能設備轉型為具備通用任務能力的智慧代理。

在技術層面，Gemini Robotics-ER 1.6強化了視覺與空間推理能力，特別是在多視角理解與任務規劃上表現顯著。系統可透過多個攝影機畫面整合資訊，判斷任務是否完成（success detection），進一步提升自主決策能力，使機器人能在動態環境中持續運作。

其中，「儀表讀取」（instrument reading）能力被視為關鍵突破。Spot可辨識壓力錶、液位計等工業設備數據，透過視覺細節解析與比例估算完成判讀，這項能力直接對應到工業巡檢需求，有助於降低設備故障風險並減少人力負擔。

在應用場景上，Boston Dynamics將此技術與AIVI-Learning系統整合，推動「全場域智慧」（site intelligence）。機器人可執行安全巡檢、設備監測與物料管理等任務，並透過持續學習提升辨識準確度，實現跨部門的營運優化。

值得注意的是，此類AI系統採取雲端持續更新模式，企業無需停機即可獲得性能提升，顯示AI正從一次性部署轉向持續演進的服務型架構。同時，系統亦提供「透明推理」功能，讓使用者理解AI決策過程，提升信任度與可控性。

然而，技術仍存在限制。例如在操作物體時，機器人缺乏人類經驗導致處理方式不夠理想，顯示目前模型仍偏重視覺資訊，對觸覺與力覺資料的整合仍待突破。此外，訓練高品質物理世界數據的成本與取得難度，也成為未來發展瓶頸。

整體而言，Gemini導入Spot象徵機器人產業從「可編程」邁向「可理解」的重要轉折。當自然語言成為主要操作介面，工程師角色將從編寫程式轉為設定目標與策略。未來，隨著感測融合與數據規模擴大，具身AI(或是實體AI)將有望進一步進入家庭與服務場域，成為真正能理解世界並協助人類的智慧助手。(824字)

參考資料：
Boston Dynamics and Google DeepMind Teach Spot to Reason. IEEE Spectrum, 2026/4/14
Robot dog can now read and reason after AI upgrade. Idependent, 2026/4/16
AIVI-Learning Is Now Powered by Google Gemini Robotics. Boston Dynamics, 2026/4/8
Gemini Robotics-ER 1.6: Powering real-world robotics tasks through enhanced embodied reasoning. Google DeepMind, 2026/4/14

歡迎來粉絲團按讚！

--------------------------------------------------------------------------------------------------------------------------------------------