首頁 -> 新聞 > 科技 > 正文

AI向真正“智能學習體”邁進 相關研究成果發表在《自然》

    來源: 科技日報  2021-02-25 14:50:17

英國《自然》雜志24日發表一項人工智能研究成果:美國團隊報告了一類增強學,可回溯過去、解決復雜任務,真正改善了對復雜環境的探索方式,有望應用于機器人、語言理解和藥物設計領域。這類算法被統稱為“Go-Explore”,其已經在一款經典游戲的算法挑戰中得分超過了人類玩家和先進的人工智能系統。該成果被認為正朝著實現真正“智能學體”邁出了重要一步。

增強學,可讓人工智能系統通過探索和理解復雜環境來進行決策,并學如何以最優的方式獲得獎勵。獎勵可以包括機器人抵達特定位置或是在電腦游戲中達到一定的等級。然而,當遇到很少給予反饋的復雜環境時,現階段的加強學算法就很容易碰壁,這讓人工智能專家們非常苦惱。

美國“OpenAI”是由諸多硅谷巨頭聯合建立的人工智能非營利組織,推動者包括美國創業孵化器Y Combinator總裁薩姆·阿爾特曼、美國太空技術探索公司(SpaceX)創始人埃隆·馬斯克等,其目標是希望能夠預防人工智能的災難影響,并推動人工智能發揮積極作用。此次,“OpenAI”的科學家艾德蘭·艾克菲特、朱斯特·赫伊津哈及團隊,提出了有效探索面臨的兩個主要障礙,并設計了一類算法來解決這些障礙。

研究人員表示,“Go-Explore”可以對環境進行全面探索,同時構建一個檔案庫來記住它去過的地方,確保自己不會忘記通往有望成功的期中階段或是最終勝利(獎勵)的路線。其在雅達利經典游戲中的得分,超過了人類玩家和先進的人工智能系統,研究人員用這類算法,解決了之前未能解決的2600個雅達利游戲,驗證了這類算法的潛力。“Go-Explore”在算法挑戰《蒙特祖馬的復仇》中的得分是之前的4倍,在另一個算法挑戰《瑪雅人的冒險》中的得分也超過了人類玩家的均水。而相對的,此前的算法一分都拿不到。

“Go-Explore”算法還能完成一個模擬機器人任務,在這項任務中,它必須用機械臂把東西撿起來并放到4個架子中的一個架子上,其中兩個架子被關在兩扇門的后面。

研究人員指出,記住并回到有望成功的探索區域的簡單原則是一種強大、通用的探索方法。他們認為最新的算法有望應用于機器人、語言理解和藥物設計。

【免責聲明】

1、凡本網注明出處非(巨潮財經網)的作品,均轉載于自其它媒體,并不代表本網贊同其觀點和對其真實性負責,目的在于信息的傳遞,本網不承擔稿件侵權行為的連帶責任,如對稿件有質疑請與本網客服聯系。

2、刊發此文目的在于傳遞更多信息,文章內容僅供參考,不構成投資建議,投資者據此操作,風險自擔。

3、如涉及作品內容、版權等其它問題,請在15日內聯系本網客服。

閱讀延展

AI向真正“智能學習體”邁進 相關研究成果發表在《自然》

英國《自然》雜志24日發表一項人工智能研究成果:美國團隊報告了一類增強學習,可回溯過去、解決復雜任務,真正改善了對復雜...

2021-02-25 14:50:17

“超海森堡極限”與海森堡極限的量子精密測量可同時實現 研究成果發表在《物理評論快報》上

2月22日,記者從中國科學技術大學獲悉,該校郭光燦院士團隊李傳鋒、項國勇研究組與香港中文大學袁海東教授合作,在量子精密測...

2021-02-25 14:45:49

科學家揭示水稻葉形調控新機制 相關研究論文發表于《植物生理(Plant Physiology)》雜志

葉片在植物的光合作用、蒸騰作用等過程中扮演著重要角色,那么葉子的卷曲度會影響其作用的發揮嗎?記者2月上旬從中國農業科學...

2021-02-25 14:44:11

鈉離子電池或成我國能源超車新賽道 新能源新星正在產業化路上加速

日前,中國科學院物理研究所孵化的高新技術企業中科海鈉科技有限責任公司(以下簡稱中科海鈉)、華陽新材料科技集團有限公司與...

2021-02-24 14:40:02

傳統電廠華麗轉身,用智慧點亮萬家燈火 實現人機結合遠程“問診”

他正在輔助人工,進行7、8號爐380伏除灰段配電室的無人值守智能巡檢監測。這個認真工作的員工就是國家能源集團江蘇太倉電廠(...

2021-02-24 14:37:22