︿
Top

Boston Dynamics導入Gemini,Spot機器人進化為自主決策系統

瀏覽次數:72| 歡迎推文: facebook twitter wechat Linked

科技產業資訊室(iKnow) - 黃松勳 發表於 2026年4月17日
facebook twitter wechat twitter

圖、Boston Dynamics導入Gemini,Spot機器人進化為自主決策系統

隨著人工智慧技術快速演進,機器人正從單純執行指令的工具,逐步邁向具備理解與推理能力的「具身智慧」系統。近期,Boston Dynamics將Google DeepMind的Gemini Robotics-ER 1.6模型導入Spot機器人,使其能透過自然語言理解任務並自主執行,標誌著AI與實體機器整合邁入新階段。

此次升級的核心在於「具身推理」(embodied reasoning),讓機器人不僅能感知環境,更能理解空間關係與任務邏輯。Spot已可從指示板讀取任務、整理物品、回收物件,甚至檢查陷阱等,顯示其從單一功能設備轉型為具備通用任務能力的智慧代理。

在技術層面,Gemini Robotics-ER 1.6強化了視覺與空間推理能力,特別是在多視角理解與任務規劃上表現顯著。系統可透過多個攝影機畫面整合資訊,判斷任務是否完成(success detection),進一步提升自主決策能力,使機器人能在動態環境中持續運作。

其中,「儀表讀取」(instrument reading)能力被視為關鍵突破。Spot可辨識壓力錶、液位計等工業設備數據,透過視覺細節解析與比例估算完成判讀,這項能力直接對應到工業巡檢需求,有助於降低設備故障風險並減少人力負擔。

在應用場景上,Boston Dynamics將此技術與AIVI-Learning系統整合,推動「全場域智慧」(site intelligence)。機器人可執行安全巡檢、設備監測與物料管理等任務,並透過持續學習提升辨識準確度,實現跨部門的營運優化。

值得注意的是,此類AI系統採取雲端持續更新模式,企業無需停機即可獲得性能提升,顯示AI正從一次性部署轉向持續演進的服務型架構。同時,系統亦提供「透明推理」功能,讓使用者理解AI決策過程,提升信任度與可控性。

然而,技術仍存在限制。例如在操作物體時,機器人缺乏人類經驗導致處理方式不夠理想,顯示目前模型仍偏重視覺資訊,對觸覺與力覺資料的整合仍待突破。此外,訓練高品質物理世界數據的成本與取得難度,也成為未來發展瓶頸。

整體而言,Gemini導入Spot象徵機器人產業從「可編程」邁向「可理解」的重要轉折。當自然語言成為主要操作介面,工程師角色將從編寫程式轉為設定目標與策略。未來,隨著感測融合與數據規模擴大,具身AI(或是實體AI)將有望進一步進入家庭與服務場域,成為真正能理解世界並協助人類的智慧助手。(824字)


參考資料:
Boston Dynamics and Google DeepMind Teach Spot to Reason. IEEE Spectrum, 2026/4/14
Robot dog can now read and reason after AI upgrade. Idependent, 2026/4/16
AIVI-Learning Is Now Powered by Google Gemini Robotics. Boston Dynamics, 2026/4/8
Gemini Robotics-ER 1.6: Powering real-world robotics tasks through enhanced embodied reasoning. Google DeepMind, 2026/4/14


 

 
歡迎來粉絲團按讚!
--------------------------------------------------------------------------------------------------------------------------------------------
【聲明】
1.科技產業資訊室刊載此文不代表同意其說法或描述,僅為提供更多訊息,也不構成任何投資建議。
2.著作權所有,非經本網站書面授權同意不得將本文以任何形式修改、複製、儲存、傳播或轉載,本中心保留一切法律追訴權利。