導(dǎo)航菜單

機(jī)器人“基于視覺的追蹤”實現(xiàn)像捉人等動態(tài)任務(wù)

導(dǎo)讀 加州大學(xué)伯克利分校的研究人員開發(fā)出一種新的方法,教機(jī)器人進(jìn)行“基于視覺的追蹤”,實現(xiàn)像捉人游戲等需要動態(tài)決策的任務(wù)。這種方法不同于簡單地跟蹤一個人或機(jī)器人,機(jī)器

中華網(wǎng)9月6日消息:近日,加州大學(xué)伯克利分校的研究人員開發(fā)出一種新方法,可以教會機(jī)器人進(jìn)行“基于視覺的跟蹤”,以實現(xiàn)標(biāo)簽游戲等動態(tài)任務(wù)。 決策任務(wù)。

這種方法不同于簡單地跟蹤人或機(jī)器人,機(jī)器人可以主動推斷目標(biāo)的行蹤并追捕它。 由于現(xiàn)實世界的各種限制,例如對環(huán)境和其他智能體的感知有限,很難直接通過強(qiáng)化學(xué)習(xí)來學(xué)習(xí)此類行為。

因此,研究人員使用了“特權(quán)學(xué)習(xí)”。 這是監(jiān)督學(xué)習(xí)的一種形式,其中具有附加信息的教師幫助沒有附加信息的學(xué)生。

對于機(jī)器人來說,這意味著機(jī)器人老師利用逃避者未來的軌跡來推斷逃避者的意圖。 有了這些特權(quán)信息,機(jī)器人教師可以逐步指導(dǎo)學(xué)生機(jī)器人采取哪些行動。 因此,本質(zhì)上復(fù)雜的規(guī)劃問題對于學(xué)生來說變成了一個簡單的監(jiān)督學(xué)習(xí)問題。

盡管這種方法很簡單,但機(jī)器人可以學(xué)習(xí)動態(tài)行為,例如在目標(biāo)轉(zhuǎn)動時減速,或者預(yù)測目標(biāo)的去向并攔截它。

研究人員在四足機(jī)器人上測試了該方法,該機(jī)器人僅依靠內(nèi)置攝像頭和本體感覺,成功地與人類和其他機(jī)器人玩追逐游戲。 該機(jī)器人還展示了模型在模擬環(huán)境中學(xué)到的復(fù)雜追蹤行為。

這種“特權(quán)學(xué)習(xí)”方法教會機(jī)器人執(zhí)行基于視覺的跟蹤,從而實現(xiàn)捉迷藏等復(fù)雜的動態(tài)任務(wù),這是機(jī)器人技術(shù)向現(xiàn)實世界應(yīng)用邁出的一步。

但目前該系統(tǒng)無法處理障礙,需要更廣泛的人工智能訓(xùn)練和更好的傳感器。

免責(zé)聲明:本文由用戶上傳,如有侵權(quán)請聯(lián)系刪除!

猜你喜歡:

最新文章: