【識港網訊】日前騰訊宣布,其人工智能球隊摘得足球AI比賽——首屆谷歌足球Kaggle競賽冠軍,該冠軍球隊來自騰訊AI Lab研發的絕悟WeKick版本。騰訊方面表示,“AI+遊戲”是騰訊攻克AI終極研究難題——通用人工智能(AGI)的關鍵一步。從圍棋機器人“絕藝”到“絕悟”,不斷讓AI從0到1去學習進化,未來有望在醫療、製造等領域帶來更為深遠的影響。
11個智能體的合作與對抗
一直以來,足球運動團隊策略以其複雜性、多樣性和高難度,成為長期困擾世界頂尖AI研究團隊的難題。 Kaggle創立於2010年,是全球最大的數據科學社區和數據科學競賽平台。此次比賽由Google Research與英超曼城俱樂部在Kaggle平台上聯合舉辦,吸引了來自世界頂級院校和研究機構的1100多支科研強隊參與挑戰。
這不是一場真實的足球賽,比賽使用Google Research Football 環境,更像是一款由AI操作的FIFA遊戲。比賽採取11vs11的賽制,參賽團隊需要控制其中1個智能體與10個內置智能體組成球隊。這場比賽規則與正常足球賽一樣,雙方擁有一樣的球員,沒有主客場、狀態好壞的數值差異,沒有替補球員、沒有加時賽、進球多獲勝(否則平局),目標都是將球踢入對方球門。
比賽中,每個球員都各由一個單獨的智能體控制,參賽團隊需要實時選擇並控制其中一個智能體,與其他內置智能體配合。因此,每個“球員”不僅需要觀察對手的行為,還需要留意己方隊員的情況,這需要非常複雜的團隊協作和競爭策略,以及高速的實時決策能力。最終,來自騰訊AI Lab研發的絕悟WeKick版本,憑藉1785.8的總分在與全球頂級技術團隊的競技中以顯著優勢勝出。
能打“王者”也能踢足球
實際上,這次奪冠的“絕悟”正是《王者榮耀》中的那個AI。 “絕悟”為何要在遊戲領域四處征戰?騰訊花大力氣研發“絕悟”有何原因?
據騰訊AI Lab專家介紹,AI研究近年成為國際科技公司必爭之地,遊戲則是檢驗AI能力的試金石。 1997年DeepBlue戰勝國際象棋第一人,2016年的圍棋AI AlphaGo戰胜李世石,這兩大AI劃時代事件都與遊戲相關。
業內普遍認為,複雜策略遊戲可能會是下一塊寶地。 AI能學會類似於人的長期策略規劃和協作能力,代表著多智能體決策最高水準。正因為在挑戰性和應用性的巨大價值,騰訊長期關注並持續投入該領域。
早在2016年,騰訊AI Lab就已開始了“AI+遊戲”的研究之路。當時研發的圍棋AI“絕藝”相繼在UEC杯、AI龍星戰以及圍棋人工智能大賽等頂級賽事中3次奪冠,並成為中國國家隊圍棋訓練專用AI。圍棋AI的難點在於大規模離散決策空間探索,突破強化學習理論實踐瓶頸,探索超過人類的優化策略。
2017年,騰訊開始在星際爭霸2這類RTS遊戲(即時戰略遊戲)中進行“AI+遊戲”研究。與圍棋相比,星際爭霸2是一個不完全信息博弈場景,需在復雜連續的決策空間下進行面向長期決策的決策。同年,AI Lab還與王者榮耀展開AI聯合研究,並取得了喜人的成績。
據介紹,“絕悟”作為策略協作型AI,寓意擁有絕佳領悟力的AI。 2018年8月,“絕悟”已達到王者業餘頂尖水平,並在2019年8月的王者榮耀世界冠軍杯半決賽上通過了5v5賽區聯隊測試,達到電競職業水平。 2020年11月底,“絕悟”首次讓AI精通了所有英雄的技能,而此次絕悟WeKick版本的整體設計正是基於絕悟完全體遷移得到,並針對足球任務進行了一些針對性的調整,驗證了“絕悟”AI底層架構與方法的通用性。
攻克AI終極難題關鍵一步
騰訊AI Lab表示,長遠來看,“AI+遊戲”將是騰訊攻克AI終極研究難題——通用人工智能(AGI)的關鍵一步。如果在模擬真實世界的虛擬遊戲中,AI學會跟人一樣快速分析、決策與行動,就能執行更困難復雜的任務並發揮更大作用。實際上,從圍棋AI“絕藝”到策略決策型AI“絕悟”,再到如今的AI足球隊絕悟WeKick版本,體現了AI Lab的深度強化學習智能體步步進化,逐漸向更複雜更多樣化的問題遷移,而每一次進展,都離AGI這一終極目標更近一步。
此外,AGI代表研發能在通用系統中執行多種複雜命令,達到或超越人類水平的AI,從絕藝到絕悟,不斷讓AI從0到1去學習進化,並發展出一套合理的行為模式,這中間的經驗、方法與結論,長期來看,有望在大範圍內,如醫療、製造、無人駕駛、農業到智慧城市管理等領域帶來更為深遠的影響。
騰訊AI Lab於2016年4月成立。官網顯示,作為騰訊公司級AI實驗室,AI Lab基礎研究方向包括計算機視覺、語音識別、自然語言處理和機器學習,應用探索結合了騰訊場景與業務優勢,為內容、遊戲、社交和平台工具型AI四類。 2020年,AI Lab重點在虛擬集成世界與機器人兩大研究方向上的重要探索,除AI+遊戲外,還在AI+醫療、AI+醫藥等領域取得一系列成果。
除“絕悟”外,2020年4月,圍棋AI“絕藝”與中國國家圍棋隊續約3年。作為“教練”,絕藝能從對弈、复盤、拆解、分析等多個維度,為中國圍棋事業的發展提供助力,與人類頂尖棋手一起探索圍棋的更多可能。
原文鏈接:http://szsb.sznews.com/PC/layout/202101/07/node_A03.html#content_974056