在线免费观看成年人视频-在线免费观看国产-在线免费观看国产精品-在线免费观看黄网站-在线免费观看精品

產品分類

當前位置: 首頁 > 工業電氣產品 > 端子與連接器 > 線路板連接器 > FFC連接器

類型分類:
科普知識
數據分類:
FFC連接器

機器人學習-基于模擬的行為學習

發布日期:2022-05-18 點擊率:40

機器人學習-基于模擬的行為學習

機器人學習-基于模擬的行為學習

基于仿真的行為學習是一種基于響應的自主移動機器人對環境的識別。機器人在許多不同的環境中使用預先學習的行為移動,由此得到的動作序列用自組織映射(SOM)進行分類,從而可以識別環境結構。


簡單地說,機器人根據周圍環境接收到的信息執行一系列動作,這些操作是根據環境(如墻跟蹤)預先編程的。在每個環境中,獲得的動作序列被記錄并轉換成環境向量,機器人參考它的一組向量并識別它熟悉的環境。


基于模擬的行為學習的基本原理


基于行為的控制的基本原則是“思考你的行為方式”。這是基于一個定位的,具體化的系統設計。基于行為的系統是一種可觀察的活動模式,產生于機器人與環境的交互作用。這類系統包括一組生存行為,如避障,所有這些行為都與感官輸入相結合。


更復雜的行為,如追逐目標、跟蹤墻壁、尋的和探索,也是這些系統的一部分。行為以增量的方式引入系統,直到交互作用產生期望的學習結果。基于行為的系統有許多層,具有相似的表示和時間尺度。基于行為的機器人控制器能夠以一種分布式的方式存儲表示,從而實現思考和學習。


機器人學習系統的最終目標是在其生命周期內優化系統性能,機器人控制的信息被編碼在一個特定的過程中用于行為表示。所獲得的信息可用于探索多種數據結構并支持行為學習。具有學習和適應能力的機器人是機器智能的基本證明,并將繼續進化為適用于多種應用的高度復雜的結構。


雖然曾經是一個虛構的概念,但研究的發展使得教授這些機器人的概念、傳感器使用、運動技能、信息收集、導航甚至情感表達成為可能。學習是通過大量的技術,利用過去的經驗來展示更好和有效的表現。不同的機器人可能需要不同類型的學習。例如,工業機器人被設計成每天重復相同的任務,而移動辦公助理機器人需要每天學習新任務并適應新出現的情況。


學習類型


要回答的另一個主要問題是,機器人學習可以在執行任務時實時發生,還是可以在離線的模擬環境中發生。對于某些任務,機器人可能有足夠的時間進行實時學習。而在其他一些關鍵且有時間限制的任務中,機器人將需要盡早掌握基本技能,然后執行任務。混合學習方法是從離線開始訓練,然后繼續實時學習,同時在那里測試新策略。


不同類型的學習方式包括:


人工神經網絡-這是通過調整神經網絡不同節點的權值來進行監督學習。


強化學習-這包括無監督學習,機器人通過嘗試和錯誤學習。


進化學習-這也是無監督的學習,但是通過改變程序代碼的初始總體來推斷控制器。


模仿學習-這種學習是受生物學啟發的,并使用發展范式幫助機器人通過仿真學習。


人工神經網絡-這些網絡是基于擴散激活現象的松散算法。這種網絡能夠以節點連接的形式對訓練期間傳授的知識進行精確編碼。輸入節點接收通過網絡層移動的刺激并產生輸出,然后由培訓師評估,培訓師加強并改變網絡的未來響應。這種訓練通常被稱為機器人塑造,涉及到人-機器人的交互作用。與人腦類似,神經網絡允許機器人根據反復的經驗發展和調整他們的知識。


強化學習-在這種類型的學習中,機器人使用自動評判器,懲罰或強化行為。這種學習方法的目的是映射動作并最大限度地增強。強化學習改變了設計者編程的本質。在這種類型的學習中遇到的一個基本挑戰是如何訓練一個機器人來協調它的學習過程,并選擇能夠獲得回報的動作。


進化學習-這個方法是受生物進化過程的啟發。它涉及多個無監督的學習過程,這些過程使用交叉復制方法選擇合適的個體并將其組合在一起以產生連續的控制器代。進化計算包括進化策略、遺傳算法、遺傳規劃和分類器系統等多種計算系統。其中,遺傳算法是進化計算的最早形式。


模仿學習-模仿學習涉及上述任何一種學習方法,盡管它遵循一種獨特的方法。它假設機器人能夠被展示在某些情況下的行為。麻省理工學院的研究人員給了一些新的機器人以生命,這些機器人可以通過模仿人類向它們展示的動作來學習。


機器人學習的一個主要問題是需要傳授領域知識,而不允許他們在任何領域過度專業化。機器人需要正確數量的編碼和學習的知識,這在很大程度上取決于他們需要執行的任務。機器人擁有的編碼知識越多,執行一組特定任務的約束就越大。

下一篇: PLC、DCS、FCS三大控

上一篇: 機器視覺在機器人技術

推薦產品

更多