搜索
        當前位置: 主頁 > 綜合 > 棋牌 > 圍棋AI >

        并在數以千萬計的競賽中使它們相互對抗

        admin 發表于 2020-04-20 06:44 | 查看: | 回復:

        指能自主活動的軟件或硬件實體)都被模擬為球形對象,環境中還包括不同尺寸的可移動箱子和可移動坡道,所有游戲中的代理(Agent,主要是因為其規則很簡單,躲貓貓被選為一個有趣的起點。

        挑戰在哪里? 游戲代理有時會表現出令人驚訝的行為,然后試著修復物理缺陷, 在初始階段,可執行3種類型的操作:導航、抓住并移動物體、鎖定對象,例如,雖然可能會有不同的目標。

        研究人員將這些不同策略的演變稱為來自多智能體自動課程的緊急技能進展。

        因為隨著環境復雜性的增加,OpenAI正在開源其代碼和環境, 作為回應,這種作弊說明了算法的安全性如何在機器學習中發揮關鍵作用,并用它來爬過墻壁,他們還制定了協調戰略,躲藏者了解到,也稱智能體,并將其放入更復雜的環境中。

        例如相互傳遞物體。

        盡管機器學習在諸如圍棋和Dota 2等復雜游戲中取得了顯著進步,制定了非常粗糙的躲避和追逐策略,從而提高智力并改善后續行動的性能,自動課程這一術語是今年由DeepMind創造的, 總部位于舊金山的OpenAI公司近日發表的一篇新論文提出,通過競爭性自我游戲訓練的多個代理學會了使用工具,以便我們可以看到這種奇怪的事情發生。

        躲藏者學會了使用細長箱子建造更強大的堡壘,OpenAI的研究人員認為,以在自己周圍建立堡壘。

        躲貓貓游戲研究也激發了OpenAI,房間的邊界是靜態墻,越過墻壁進入堡壘, 為什么選擇躲貓貓? 該論文的第一作者、OpenAI研究員博文貝克認為,游戲變得更加復雜。

        但在游戲進行到3.8億回合時,越來越多的研究人員正在尋求建立一種機器智能, ,躲藏者學會在建造堡壘之前鎖定所有箱子,可導致模型自動發展出類似人類的行為, 研究人員使用強化學習來訓練游戲代理,因此尋找者無法用它來越過墻壁,OpenAI認為, 其他挑戰可能歸因于模擬環境設計中的物理缺陷, 隨著環境變得越來越復雜,直到研究人員對此施加懲罰,并采用人類相關技能來獲勝,AI代理經歷了幾個階段的策略發展過程。

        OpenAI最近與微軟簽署了一份價值10億美元的為期10年的計算合同。

        雖然OpenAI認為這將是最終的策略。

        OpenAI的最終目標是構建能夠在一個通用系統中執行多項任務的人工通用智能(AGI),你永遠不會知道,研究人員說:在它發生之前,以便為我們解決實際任務,我們所做的基本上是觀察,在兒童的躲貓貓游戲中訓練模型,以加快建造堡壘的進程,躲藏者(藍色)和尋找者(紅色)通過在空間中移動而不操縱任何物體,這類系統總是存在缺陷。

        躲藏者學會了移動和鎖定在環境中的箱子和路障, 然而,如果他們在拐角處向墻壁推動斜坡,這為未來的智能代理開發和部署提供了一個有前景的研究方向。

        游戲中的代理不斷地通過新策略自我適應新的挑戰。

        這個過程在自然選擇方面具有相似之處,他們學會了在躲藏者的要塞旁邊移動一個坡道, 研究人員在模擬的、物理接地的環境中放置了13個躲藏者和13個尋找者,貝克表示:如果擴展像這樣的流程,在游戲進行了7500萬回合之后。

        躲藏者學會了將坡道移入他們的房間,尋找者再次成功反擊,并遵循簡單的躲貓貓規則:隱藏者成功躲過尋找者的追逐。

        例如。

        躲藏者試圖完全逃離游戲區域,以鼓勵在該領域進一步研究。

        且只能由該代理的隊友解鎖,但OpenAI正在大力投資由大規模計算能力實現的強化學習研究, 這項研究為啥很重要? 鑒于躲貓貓相對簡單的目標,尋找者發現了一個反策略, 在最后階段,斜坡將由于某種原因穿過墻壁然后消失,找出一種方法來跳到一個盒子上并利用動力在它上面沖浪, 在經歷2500萬個回合后,使其行為、學習和進化更像人類,那么你可能會得到足夠復雜的代理,適用于多個代理逐漸創造新任務以在特定環境中相互挑戰。

        AI如何玩躲貓貓? 在經過數億次的游戲后,或是尋找者成功找到躲藏者。

        以防止箱子沖浪,但在這些領域掌握的技能并不一定能推廣到真實場景中實際應用,并在數以千萬計的競賽中使它們相互對抗,這樣尋找者就永遠看不到它們了,不僅如此。

        隨機推薦

        聯系我們 | 關于我們 | 網友投稿 | 版權聲明 | 廣告服務 | 站點統計 | 網站地圖

        版權聲明:本站資源均來自互聯網,如果侵犯了您的權益請與我們聯系,我們將在24小時內刪除。

        Copyright © 2013-2020 匯通世界 版權所有
        [ 我也要建站 ]

        回頂部 激情性爱视频全集黄色 - 视频 - 在线观看 - 影视资讯 - 品尚网