不是為瞭輸贏!柯潔VS AlphaGo大戰之前,你需要知道的幾大看點
原標題:不是為瞭輸贏!柯潔VS AlphaGo大戰之前,你需要知道的幾大看點
編者按:AlphaGo 終於又來瞭。5月23日,也就是明天,曾在去年以一己之力將“人工智能”浪潮帶到新層次的圍棋人工智能AlphaGo就將再次出馬。在這次為期5天的活動當中,AlphaGo將會與世界最頂尖圍棋選手柯潔展開正式對決,同時還會進行耳目一新的“配對賽”以及“團體賽”。
目前的具體賽程如下:
?5月23日,開幕式、柯潔 vs AlphaGo三番棋第一場;
?5月24日,人工智能論壇;
?5月25日,柯潔 vs AlphaGo三番棋第二場;
?5月26日,配對賽,團隊賽(相談棋);
?5月27日,柯潔 vs AlphaGo三番棋第三場。
這次比賽核心目的隻有一個——在公開場合驗證AlphaGo的實力,看是否已經打造出瞭在圍棋上超越所有人類的“AI”。
在比賽正式開始前,有幾個問題你可能需要瞭解一下:
1.這主動式重低音電容次的“新AlphaGo”跟“老AlphaGo”有什麼不同?
2.柯潔能否戰勝“新AlphaGo”?
3. AlphaGo和柯潔對弈是否有意義?
4.比賽相關直播應該如何觀看?
新AlphaGo:砍斷“人類束縛”
作為一個從2014年發展至今的圍棋人工智能項目,其實AlphaGo在發展歷程中使用過多個名字,比如最早期亦城圍棋上的“DeepMind”,又或者是之前在野狐平臺上的“Master”。那麼這次的“新AlphaGo”是否也隻是一個新名字?
答案必然是否定的,之前起新名字很可能有保密、個人喜好等原因,但這次新添加的“新”字隻為瞭突出一點——這是“機器自學”為主的一版AlphaGo。
這一點判斷的線索,來自於今年初,Master在網絡上一口氣橫掃60名人類棋手的時候。當時Master第二次戰勝柯潔之後,棋聖聶衛平曾表示:
Master改變瞭我們傳統的厚薄理念,顛覆瞭多年的定式。圍棋遠不像我們想象的那麼簡單,還有巨大的空間等著我們人類去挖掘,阿法狗也好,Master也罷,都是‘圍棋上帝’派來給人類引路的。
著名棋手古力在成為Master的第60個手下敗將,之後,也在微博發表瞭自己的感受:
作為第 60 個勇士,犧牲瞭。。。經過這幾天的對局,我深深的感受到圍棋的神秘,似乎 Master 給我們打開一道圍棋的神秘之門,不論勝負,人類與人工智能共同探索圍棋世界的大幕即將拉開,新一次的圍棋革命正在進行著。。。
這種表現,與將近一年前的“老AlphaGo”可謂天差地別。想要達成這樣的成績隻有一種可能——DeepMind尋找到瞭一種機制來擺脫圍棋中的“人類束縛”。
迷之改進:一舉讓AlphaGo成為人類老師
作為一個極其特殊的棋類和任務,圍棋擁有數量極其龐大的可能性,總的局面數量達到10^172,而可觀測宇宙范圍內的原子數量不過10^80。這也意味著窮舉絕對不是一條明智的路線。
最終DeepMind給出瞭一套能夠“模擬”出人類頂尖高手的方案:深度學習+蒙特卡洛搜索樹+自我進化。
這一套架構在DeepMind發佈在《自然》雜志中的論文中已經有詳細敘述,
(https://www.nature.com/nature/journal/v529/n7587/full/nature16961.html)
如果你對其中的細節感興趣,推薦閱讀國內人工智能創業公司彩雲AI創始人、CEO袁行遠在知乎上的相應回答。
(https://www.zhihu.com/question/41176911/answer/90118097)
深度學習用以分析人類棋盤,蒙特卡洛搜索樹用來減輕工作量,自我進化用來提升能力。但有限的運算能力還是給DeepMind出瞭一個不小的難題,後者最終想出瞭一個辦法:隻對學習到的人類棋招進行蒙特卡洛搜索樹運算,這恰如人類棋手依賴定式。
定式,又名定石,指的是人類下圍棋長久積累下來的一種經驗,對弈雙方在特定情況下會遵循固定下法。著名棋手吳清源則將簡單描述為“在角部彼我棋子接觸時最合理的走法”。
這些定式被記載在各式各樣的棋譜當中,成為新手入門必看的書籍。
雖然定式是某種意義上是最合理的走法,但它卻是理想化條件下的產物,想要完整復現定式,意味著雙方都必須抱有同樣的理想化思路。而歷史上並不缺乏不遵守定式,或者用新定式打敗對方的事例。
問題來瞭,為什麼千變萬化的圍棋會出現定式?而且死守定式會輸,不學習定式也會輸。答案隻有一個——人類需要定式來減少圍棋上面的變化,這樣進入中盤之後人類才能利用自身能力掌握棋局走向。
湊巧的是,這回我們遇到的是運算能力遠超人類的計算機,讓掌握更多乃至全部圍棋奧秘擁有瞭一絲可能。
但究竟新AlphaGo怎麼樣擺脫“人類束縛”?參考之前“老AlphaGo”的工作方式,排除運算過程中所有人類元素可能是最徹底的方法。但這樣一來就必須找到另外一種減輕運算壓力的策略。目前來看,這個秘密也隻能等DeepMind方面稍後公開瞭。
人機大戰意義何在?
這個問題的答案是肯定的,但並不是外界理解的“這對Google來說是一種宣傳行為”。
Google的大中華區總裁石博盟解釋說,AlphaGo在圍棋方面已經做得很好瞭,但今天的結果是DeepMind的人工智能科學傢和世界各國的圍棋頂尖選手共同探索的結果。在這個過程中,其實並不是人類在與人工智能對戰,而是科學傢和圍棋選手在共同探索。
科學傢探索的是人工智能,而圍棋選手探索的是圍棋藝術。AlphaGo的每一次升級,都意味著DeepMind的人工智能科學傢對“如何在有限信息下做出更優選擇”這一問題有瞭更深刻的認識,而這一問題正是讓人工智能理解人類、產生思維的關鍵。
對棋手而言,柯潔也談到,與人工智能的多次對弈是十分有收獲的。在AlphaGo勝過李世乭後,中國圍棋隊的成員多次復盤瞭所有比賽,從中發現瞭很多新的思路。
在以往的圍棋比賽過程中,總有一些“套路”是不會被打破的,這些套路曾被奉為人類經驗知識的聖殿,是不可更改的。但AlphaGo正是通過突破這些規矩,達到瞭新的高峰,這對人類本身來說也是一種啟發。
人類敗局重低音一定要裝電容嗎已定?
2016年,AlphaGo對戰李世石,賽前,谷歌對自己開發的機器人信心很足,聲稱根據電腦計算的結果,李世石打敗“阿爾法狗”的概率為0。而圍棋界則多數站在李世石這一邊,中國棋聖聶衛平認為李世石敗北是不可能的事情。
最終,比賽以1:4李世石輸給AlphaGo結束(值得一提的是,李世石雖然以0:3宣告失敗,但仍需要和AlphaGo下完剩餘兩場。)。賽後,AlphaGo戰勝傳奇圍棋選手李世石的消息立刻成瞭全世界各傢媒體的頭條。同時,這也是人工智能歷史上最重要的時刻之一。
“我非常吃驚,我沒想到會輸,AlphaGo的實力居然如此強悍。”李世石賽後說道。
事實上,在跟李世石下棋之前,AlphaGo已經集中學習瞭半年,比如谷歌為其輸入瞭3000萬步人類圍棋大師的走法,讓其自我對弈3000萬局,積累勝負經驗,同時它還要在自我對弈的訓練中形成全局觀,並對局面作出評估。經過上述深度學習後,AlphaGo展示出瞭強大的選擇能力。當然更可怕的是,隨著訓練時間的增加,AlphaGo還在不斷進步之中。
盡管去年人類代表是韓國選手,但明眼人都可以看出當下和去年圍棋人機比賽的熱度差別。這從另外一個側面也反映出瞭絕大部分觀眾的看法:這次人類要輸。而去年3月李世石1:3扳回一局時,柯潔還曾在直播中表示:
我們必須承認谷歌就是瞭不起, AlphaGo 確實是超一流的水平,但是也沒有到不可戰勝的地步。
而在上個月的發佈會上,柯潔卻顯得尤為謙遜:
有點小緊張,但我不會輕易言敗,在阿爾法圍棋出現之前,我以為計算力是AI的優勢,後來讓我震驚的是他的大局觀,AI的宏觀思維讓我很佩服。AlphaGo圍棋讓我們重新思考,這麼下是不是錯的,會給我們很多啟發,輸的痛苦是外界無法想象的,我會不惜一切去追求勝利。
“輕易言敗”這樣的措辭與其在央視節目上的慷概激昂形成瞭強烈對比。客觀公正地說,柯潔的勝算很小,三番棋中哪怕有一盤能夠獲勝都是成功。
而另外兩場比賽(配對賽、團隊賽)同樣值得認真關註,這兩場比賽中,人類棋手將首先與AlphaGo配對比賽、然後再“群毆”AlphaGo。這不僅體現瞭DeepMind的自信,同時也再次突出本次本次圍棋峰會的主題:
頂尖棋手以賭局開創性的方式為世人帶來精彩絕倫的棋藝展示,挑戰人類智慧的極限。同時AlphaGo與世界最優秀的棋手相互啟發,共同探索圍棋背後的深遠奧秘。
不管最終的結果是什麼樣,就像谷歌所說的那樣,“這場人機圍棋大戰的最大贏傢還是人類”。 (文章來源:雷鋒網)
另外,比賽直播通道將於明天上午10點在本公眾號推送,敬請關註!
本公眾號長期接受投稿,一經采用將註明作者來源,歡迎投稿。
投稿請郵件至editor@ourbot.org。
公眾號對話框回復1109可獲取【人工智能產業全景圖】和【中國人工智能應用市場研究報告】
推薦閱重低音電容推薦讀
“AI教父”黃仁勛:如何在連續創業失敗後成功逆襲返回搜狐,查看更多
責任編輯:
聲明:本文由入駐搜狐號的作者撰寫,除搜狐官方賬號外,觀點僅代表作者本人,不代表搜狐立場。
閱讀 ()
- 音響換電容 【Mobile01專家分享】汽車音響後級分為哪些呢?專家告訴你如何安裝
- 汽車音響後級 【Mobile01專家分享】汽車後級擴大機推薦~汽車音響改裝必看
- 後級擴大機推薦 重低音電容推薦~專家解析分享
AUGI SPORTS|重機車靴|重機車靴推薦|重機專用車靴|重機防摔鞋|重機防摔鞋推薦|重機防摔鞋
AUGI SPORTS|augisports|racing boots|urban boots|motorcycle boots
留言列表