欧美96视频在线,亚洲嫩草影院久久精品,欧美成人精品第一区首页

·發(fā)展方向
·程序原理
·主要成績
·主要設(shè)計者
·相關(guān)評論

阿爾法狗AlphaGo

阿爾法狗AlphaGo是一款圍棋人工智能程序，由位于英國倫敦的谷歌（Google）旗下DeepMind公司的戴維·西爾弗、艾佳·黃和戴密斯·哈薩比斯與他們的團(tuán)隊開發(fā)，這個程序利用“價值網(wǎng)絡(luò)”去計算局面，用“策略網(wǎng)絡(luò)”去選擇下子。2015年10月阿爾法圍棋以5：0完勝歐洲圍棋冠軍、職業(yè)二段選手樊麾；2016年3月對戰(zhàn)世界圍棋冠軍、職業(yè)九段選手李世石，并以4：1的總比分獲勝。

發(fā)展方向

　　谷歌Deep mind首席執(zhí)行官(CEO)德米斯·哈薩比斯宣布“要將Alpha Go和醫(yī)療、機器人等進(jìn)行結(jié)合”。

程序原理

　　阿爾法圍棋（AlphaGo）是一款圍棋人工智能程序。這個程序利用“價值網(wǎng)絡(luò)”去計算局面，用“策略網(wǎng)絡(luò)”去選擇下子。

　　深度學(xué)習(xí)

　　阿爾法圍棋（AlphaGo）的主要工作原理是“深度學(xué)習(xí)”。“深度學(xué)習(xí)”是指多層的人工神經(jīng)網(wǎng)絡(luò)和訓(xùn)練它的方法。一層神經(jīng)網(wǎng)絡(luò)會把大量矩陣數(shù)字作為輸入，通過非線性激活方法取權(quán)重，再產(chǎn)生另一個數(shù)據(jù)集合作為輸出。這就像生物神經(jīng)大腦的工作機理一樣，通過合適的矩陣數(shù)量，多層組織鏈接一起，形成神經(jīng)網(wǎng)絡(luò)“大腦”進(jìn)行精準(zhǔn)復(fù)雜的處理，就像人們識別物體標(biāo)注圖片一樣?！?/p>

　　兩個大腦

　　阿爾法圍棋（AlphaGo）是通過兩個不同神經(jīng)網(wǎng)絡(luò)“大腦”合作來改進(jìn)下棋。這些大腦是多層神經(jīng)網(wǎng)絡(luò)跟那些Google圖片搜索引擎識別圖片在結(jié)構(gòu)上是相似的。它們從多層啟發(fā)式二維過濾器開始，去處理圍棋棋盤的定位，就像圖片分類器網(wǎng)絡(luò)處理圖片一樣。經(jīng)過過濾，13 個完全連接的神經(jīng)網(wǎng)絡(luò)層產(chǎn)生對它們看到的局面判斷。這些層能夠做分類和邏輯推理。

　　這些網(wǎng)絡(luò)通過反復(fù)訓(xùn)練來檢查結(jié)果，再去校對調(diào)整參數(shù)，去讓下次執(zhí)行更好。這個處理器有大量的隨機性元素，所以人們是不可能精確知道網(wǎng)絡(luò)是如何“思考”的，但更多的訓(xùn)練后能讓它進(jìn)化到更好。

　　第一大腦：落子選擇器（MovePicker）

　　阿爾法圍棋（AlphaGo）的第一個神經(jīng)網(wǎng)絡(luò)大腦是“監(jiān)督學(xué)習(xí)的策略網(wǎng)絡(luò)（Policy Network）” ，觀察棋盤布局企圖找到最佳的下一步。事實上，它預(yù)測每一個合法下一步的最佳概率，那么最前面猜測的就是那個概率最高的。這可以理解成“落子選擇器”。

　　第二大腦：棋局評估器（Position Evaluator）

　　阿爾法圍棋（AlphaGo）的第二個大腦相對于落子選擇器是回答另一個問題。不是去猜測具體下一步，它預(yù)測每一個棋手贏棋的可能，在給定棋子位置情況下。這“局面評估器”就是“價值網(wǎng)絡(luò)（Value Network）”，通過整體局面判斷來輔助落子選擇器。這個判斷僅僅是大概的，但對于閱讀速度提高很有幫助。通過分類潛在的未來局面的“好”與“壞”，AlphaGo能夠決定是否通過特殊變種去深入閱讀。如果局面評估器說這個特殊變種不行，那么AI就跳過閱讀在這一條線上的任何更多落子。

主要成績

　　研究者讓“阿爾法圍棋”和其他的圍棋人工智能機器人進(jìn)行了較量，在總計495局中只輸了一局，勝率是99.8%。它甚至嘗試了讓4子對陣CrazyStone、Zen和Pachi三個先進(jìn)的人工智能機器人，勝率分別是77%、86%和99%。

　　對戰(zhàn)樊麾

　　據(jù)國際頂尖期刊《自然》封面文章報道，谷歌研究者開發(fā)的名為“阿爾法圍棋”（Alpha Go）的人工智能機器人，在沒有任何讓子的情況下，以5：0完勝歐洲圍棋冠軍、職業(yè)二段選手樊麾。在圍棋人工智能領(lǐng)域，實現(xiàn)了一次史無前例的突破。計算機程序能在不讓子的情況下，在完整的圍棋競技中擊敗專業(yè)選手，這是第一次。

　　對戰(zhàn)李世石

　　阿爾法圍棋程序的下一個挑戰(zhàn)對象是世界圍棋冠軍李世石。這場人工智能與人類的博弈于2016年3月9日在首爾舉行，獎金是由Google提供的100萬美金。

　　2016年3月15日，“人機大戰(zhàn)”最后一場對弈中，“AlphaGo”在一度不利的情況下于收官階段中盤戰(zhàn)勝李世石，總比分被定格為1：4，五番棋最終以“AlphaGo”勝出而告終。

　　醫(yī)療領(lǐng)域

　　谷歌Deep mind首席執(zhí)行官（CEO）德米斯·哈薩比斯宣布“要將Alpha Go和醫(yī)療、機器人等進(jìn)行結(jié)合”。

　　據(jù)韓國《朝鮮日報》3月17日報道，為實現(xiàn)該計劃，哈薩比斯今年初在英國的初創(chuàng)公司“巴比倫”投資了2500萬美元。巴比倫正在開發(fā)醫(yī)生或患者說出癥狀后，在互聯(lián)網(wǎng)上搜索醫(yī)療信息、尋找診斷和處方的人工智能APP（應(yīng)用程序）。如果Alpha Go和巴比倫結(jié)合，診斷的準(zhǔn)確度將得到劃時代性提高。

　　巴比倫以年底實現(xiàn)商業(yè)化為目標(biāo)，在英國艾賽克斯的兩家醫(yī)院進(jìn)行示范服務(wù)。谷歌在最近幾年間，還收購了15家機器人初創(chuàng)公司。如果將Alpha Go搭載于機器人身上，就能制造出觀察人類感情的家庭用機器人。

　　臉書CEO馬克·扎克伯格今年初宣布：“今年的目標(biāo)是制造像電影《鋼鐵俠》中的賈維斯一樣幫助我工作的簡單人工智能。”這是去年臉書收購擁有聲音識別技術(shù)的初創(chuàng)公司W(wǎng)it.ai時所預(yù)見的事情。擁有聲音識別秘書“Siri”的蘋果公司，去年起接連收購了擁有表情識別技術(shù)的初創(chuàng)公司“Emotient”、擁有可識別不準(zhǔn)確聲音技術(shù)的初創(chuàng)公司“Vocal IQ”等。想將其和Siri結(jié)合，制造出更為完美的人工智能秘書。

　　微軟（MS）2014年收購了瑞典游戲企業(yè)魔贊。微軟正在通過魔贊的《我的世界》游戲訓(xùn)練人工智能?！段业氖澜纭肥菆?zhí)行建設(shè)、登山、料理等各種任務(wù)的游戲。讓人工智能在進(jìn)入日常之前，通過游戲進(jìn)行事前學(xué)習(xí)。

主要設(shè)計者

　　大衛(wèi)·席爾瓦（David Silver），劍橋大學(xué)計算機科學(xué)學(xué)士，碩士，加拿大阿爾伯塔大學(xué)計算機科學(xué)博士?，F(xiàn)為倫敦大學(xué)學(xué)院講師及Google DeepMind研究員。

　　黃士杰（Aja Huang），臺灣交通大學(xué)計算機科學(xué)學(xué)士，臺灣師范大學(xué)計算機科學(xué)碩士和博士，加拿大阿爾伯塔大學(xué)計算機科學(xué)博士后。現(xiàn)為Google DeepMind研究員。

阿爾法狗AlphaGo

發(fā)展方向

程序原理

深度學(xué)習(xí)

兩個大腦

主要成績

主要設(shè)計者

相關(guān)評論

　　深度學(xué)習(xí)

　　兩個大腦