人工智能“零”生萬物?不存在!
10月19日,英國《自然》雜志發表論文報道,一款新版的“阿爾法狗”(AlphaGo)計算機程序能夠從空白狀態起,在不需要任何人類輸入的條件下,無師自通,自學成才。
創造者給它起名叫“Zero(零)”。道家說,道生一,一生二,二生三,三生萬物。這從零開始,能超越人類頂尖棋手的圍棋技藝,聽起來顛覆常理,讓很多人心生畏懼。
加上被AlphaGo擊敗的世界知名圍棋選手柯潔不久后在社交平臺上表示:“一個純凈、純粹自我學習的AlphaGo是最強的……對于AlphaGo的自我進步來講……人類太多余了(請聯系上下文,注意語境)。”
“人類多余”的概念被斷章取義,一個算法僅憑自己就能學習出高超的棋藝,人工智能能夠“零”生萬物,就這樣被解讀出來,然而事實是這樣嗎?科技日報記者專訪了業內學者,聽聽他們怎么說。
正聽:Zero也需要數據庫
“Zero可以自己產生數據,下一秒的數據和上一秒的數據‘對打’,贏了就再生成,如此循環往復,勝招就逐漸被‘進化’出來了。”中國首席數據官聯盟專家組成員、瀚思科技創始人高瀚昭說。
那么,沒有數據庫的支持,Zero是如何產生數據、又如何知道產生何種數據的呢?難道真的有了“聰明才智”?
華大基因CEO尹燁并不贊成“自學成才”的說法。他將AlphaGo Zero,和AlphaGo就學習源頭進行了對比。“后者被輸入了人類歷史上的3000萬個棋局、一步一步從中學到了對應圍棋規則的算法,Zero就是站在AlphaGo的‘肩膀’上,繼承了后者規則明確的確定算法,才能懂得圍棋的規則,遵循這個規則,左右互搏。”
也就是說,Zero從前輩處學習規則,“它不需要的只是以往人類的比賽數據,并不意味著不需要數據庫。”高瀚昭說。
北京語言大學教授荀恩東將Zero之所以能“棋高一著”解讀為兩個原因,一是“在同樣的規則下,機器抓到的落子策略,和人抓到的不同”;二是“它的運算速度比人快,因此能夠進行更深入的、甚至窮舉的計算,完全知道后招。”
也就是說,既找對了路,還跑得快。但是,這樣的狀況是有前提的——“規則是簡單的!勝負是明確的!策略是可以窮舉的!”荀恩東說。
分析一下Zero的學習過程,就能了解為什么必須是這類問題,它們才能勝出。
根據規則,它不斷產生新數據,進而新舊數據相互對抗比賽,最終產生一個勝負結果。也就是說,在固定的規則下,不斷地對“勝負”進行驗證,讓Zero獲得了精進的棋藝,而當把這些策略全部驗證一遍的時候,它就無敵了。
1997年,電腦“深藍”戰勝了國際象棋著名棋手卡斯帕羅夫。“這個事件當時也引起了轟動,”尹燁說,“那個時候國際象棋還不能窮舉,但是隨著硬件運算速度的進步和算法的提升,到2005年前后,國際象棋已經能夠窮舉了,意味著不管走哪一步,電腦都可以‘走一步看N步’,算出所有可能,進而給出所有對應的方法。”隨著量子計算的應用,圍棋走法的窮舉也是可能的。
“在算法方面,Zero采用對抗的強化學習,是機器學習算法的最新進展。它對推動人工智能發展有著重大理論和應用意義。”荀恩東說。
定位:仍處于計算智能階段
“其實下圍棋是簡單的‘計算智能’,之所以它這么受關注,是因為圍棋一直以來是策略的象征。”荀恩東說。
“運籌帷幄之中,決勝千里之外”總能讓人聯想到這樣一幕——中軍帳中,一炷香煙霧繚繞,擺定棋盤棋子,帳內是黑白子對弈,帳外千軍萬馬搏殺。
圍棋是智慧的象征,當人類無法進行全樣本分析的時候,如何根據部分樣本選取最優策略,體現了判斷的智慧,而當計算能力能夠計算全樣本時,智能的類型發生了轉變——
“通過卓越的計算能力,Zero根據算法能有一個快速的收斂(趨向準確),按照策略能達到接近全局優的結果。”荀恩東說,這意味著它不需要判斷選擇,而需要不知疲倦地找最優解、不斷嘗試。“由于計算深度更深了,采用了優化的參數計算策略、優化過程得到了加速、得到了更好的計算模型。”
“目前為止,落地應用的AI是從速度、自動化、易部署等方向入手‘進化’——速度進化基于硬件提升、分布式處理等;自動化是指無需人工大量標記,AI可自動選擇有用的信息進行記憶訓練,這也是易部署的一部分。”高瀚昭說,這樣的“進化”是Zero使用4個TPU(神經網絡訓練所需的專業芯片)、嘗試490萬盤棋局就可以超越前任的原因。
但是,它并不比人類更擅長處理復雜問題。還記得小時候無窮盡的考試嗎?更有明確答案的選擇題和判斷題AI可以做,作文題差點。
荀恩東給出了更專業的分類,“人工智能發展分三個層次:能存會算的計算智能、有視聽觸覺的感知智能、能理解會思考的認知智能。Zero仍處于計算智能這個階段。”
尹燁也認為,不依賴數據庫的互搏算法無法應對規則不明確的計算,“比如醫療健康行業,依然是數據為王,算法會根據數據的積累而不斷修正,從人工智能(AI)走向真智能(RI)。”
展望:更高級的智能還在路上
荀恩東舉了一個詼諧的例子。“比如‘你妹’這個詞,什么時候是指代人物、什么時候是在表達一種情感,讓AI分清楚就非常難做到。”
尹燁也認為,語言有兩種,僅為了交流而存在的語言無需再學,但為了表達思想和情感的語言學習會更加受重視。
事實上,讓AI獲得感知、認知智能等的研究一直在進行,“目前認知智能需要走的路還很長。”荀恩東說。
數據顯示,AI產業中的技術類企業有55%在計算機視覺領域、13%在自然語言處理領域。力觸覺的研究也被納入到了國家重點研發計劃中。
感知智能的視覺、聽覺、觸覺、正在產業研究、基礎研究等領域不斷拓展。荀恩東說,“語言智能是人工智能的重要研究方向,中文句法語義分析是語言智能的核心技術。計算機缺少足夠的特征去捕捉中文上下文語言信息,在分析準確度上始終未取得實質性突破。”
為了讓中文能夠不落人后地納入到AI語系,北京語言大學語言資源高精尖中心開展中文語義分析攻關,以期獲得具有高魯棒性、高正確率和線速計算復雜度的中文句法語義分析器。“魯棒性就是讓機器具有處理各種語言形式,包括不規范表達的能力。”荀恩東說,“我們建立了TB級別以上的漢語分析大數據,未來AI可以聽懂書面語、口語、雙關語、玩笑話……”
視覺方面,公安部上海消防研究所等單位已經做到可以看火苗發送火警警報了。觸覺方面,手勢、體態、觸控、語音、表情、眼動、生理等非精確交互信息正在被捕捉、認知、理解,甚至綜合呈現。
“這些都不僅僅是端對端的問題,而是需要復雜策略解決的問題。AI系統需要多要素的輸入,也期待多要素的輸出。”荀恩東說,在這些領域,人類經驗的數據庫仍不能被拋開,“就比如砌墻,Zero可以被看作是砌一道新墻,而更高的階段是彌補一道殘缺不全的墻。”
?
?
相關鏈接:
北京兒科協同發展中心啟動 將引入人工智能輔助診療?
·凡注明來源為“海口網”的所有文字、圖片、音視頻、美術設計等作品,版權均屬海口網所有。未經本網書面授權,不得進行一切形式的下載、轉載或建立鏡像。
·凡注明為其它來源的信息,均轉載自其它媒體,轉載目的在于傳遞更多信息,并不代表本網贊同其觀點和對其真實性負責。
網絡內容從業人員違法違規行為舉報郵箱:jb66822333@126.com