AlphaGo挑戰股神能成功嗎

2016年3月,發生瞭圍棋界的 世紀之戰 ,這也是近些年來人工智能與人類之間的巔峰一決。Google Deepmind開發的人工智能AlphaGo完美亮相:從連下三城,到出現bug,AlphaGo最終以4:1的光鮮成績戰勝人類頂尖圍棋大師李世石。

這局比賽充分讓人們看到瞭深度學習的強大,甚至有網友玩笑,Skynet0.1版本已經誕生。

然而從科幻電影回到現實,我認為從技術本質來說,這是集人類智慧大成的數據科學、工程學技術、加上長久的探索,讓人工智能在信息處理和反應能力上,更接近人類設計的理想水平。

我們來回顧一下近幾年棋類人工智能的發展階段。

1) 初級階段,國際象棋。根據棋盤上剩餘棋子的數目和棋子距離對手底線的距離,簡單加權求和來評估局面,再去搜索對應的策略。機器天生的計算速度和記憶能力在這個階段顯示出驚人的優勢:最厲害的棋手號稱 一步十算 ,也不過在腦海中算出十步以後的棋局,但是計算機可以嘗試十多種走法幾十步後的局面。然而這種方法連基本的智能都稱不上:不過碰巧找到瞭一個可以評估棋局雙方勝率的簡單函數,再運用工程學的規劃算法找到找出最優的下棋走法。

2) 進階階段,棋類的最高領域:圍棋。人工智能進入圍棋領域主要有兩個障礙。最大的一個麻煩就是如何評估棋盤狀態。早期的圍棋智能通過檢索當前棋盤與數據庫中哪一個佈局、定式最為相似,將數據庫中記錄的局部棋形的好壞評分匯總在一起得到整個局面的評價。然而,這種方法並沒有什麼類比能力,遇到不在圖形數據庫中的棋局,機器臭招頻出。另外這種方法沒有考慮任何 上下文 狀態和全局狀態,所以機器也沒有在各個局部中取舍做出最優抉擇的能力,出現無謂脫先、無謂爭劫、提早收官的失誤,面對盤中絞殺就更是無能為力瞭。

另一個還有一個大麻煩是,因為圍棋太過復雜,即便是運算能力最強的機器也不能在有限的時間遍歷搜索所有可能的走法。圍棋高手們相信,機器永遠不可能掌握他們稱之為的 棋感 的這種直覺,最終將被淹沒在龐大的可能性中。

對此AlphaGo的兩大絕殺計是:並聯瞭走子策略網絡(Policy Network)和走子評價網絡(Value Network),然後加瞭一個無比強大的外掛:加快計算速度的快速走子模塊到它的概率決策系統中。兩大絕殺計加外掛的運作模式是:評價網絡負責評估不同局面獲勝的概率,策略網絡來預測頂尖的人類棋手下一步下哪裡,讓計算機可以僅僅針對對手的行為思考,大大縮減的搜索空間從而加快瞭速度;而快速走子類似於直覺,使AlphaGo可以以犧牲下棋質量代價達到快速選擇的目的,在不需要精細思考的搜索中使用以進一步加快計算的速度。

可以看到,到此AlphaGo走法已經很接近人類思維:評估不同時刻棋局狀態,猜測對手行棋,根據假想的雙方行棋幾步以後的狀態決定走法。AlphaGo通過3萬局真人棋手的棋局和3000萬局的左右互搏自我對弈,從真實棋局記錄出發訓練兩個神經網絡,最大限度的學習人類棋手的行棋想法,最終可以在任意局面作出獲得最高勝率的判斷。

人類對人工智能的期待其實不隻是在棋類這種陶冶情操的娛樂愛好中,其實在更廣泛的商業領域,人工智能的嘗試早已不是新鮮事物。其中一個就是大傢都會感興趣的:股票交易。

傳統的股票交易中技術分析流派也主張從蠟燭圖總結規律,因此出現瞭箱體盤整、支撐、破位、趨勢、波浪等等名詞。近年來大放異彩的量化交易,則是通過人工設定的交易規則對歷史數據回測,通過統計指標來尋找最佳的交易策略,逐步也用到瞭一些機器學習算法。

但是目前人工智能在股票交易領域的嘗試還處在類似國際象棋的初級階段,在這個領域的進階還需要克服很多挑戰:

1) 與更高階的圍棋類似,全球金融資產交易市場的數據復雜度可以用數以萬計的公開交易資產數量,乘以數十年的精確到每秒甚至每毫秒的時間跨度來簡單估算,這裡還不包括數以億計的交易對手方的下單和成交明細。單單是看4000種A股股票買或者不買,狀態復雜度就已經超過圍棋瞭。這些信息量之大,自由度之高,根本無法完全放入到傳統的數據模型中估計,隻能人工提取特征再細分問題,最後建模。

2) 另一方面,如果不把宏觀經濟和大盤走勢納入模型考慮,就會如同缺少圍棋中 勢 的感覺,過於關註局部而可能被大盤走熊拖累。但如果納入考慮,則會降低針對個股的預測能力。這種平衡現在機器很難隨著時間的推移自動調整於是就需要依賴基金經理或者交易員的主觀判斷,使用一些聚類算法來輔助交易決策。

3) 同時,傳統量化假定瞭歷史是簡單重復的,沒有考慮所有的交易員都是市場的一部分,交易員下單的反身性可能引發蝴蝶效應,使得策略失效甚至是出現巨大的虧損。

但是Alphago的兩大絕殺計加外掛的運作模式讓我們看到瞭希望。比如我們可以通過把全局特征--也就是大盤所有的價格走勢、其他宏觀經濟信息、財務信息等可以反應市場信息的數據轉換成向量作為輸入,經過卷積神經網絡的深度學習能力,自動提取各個層級圖形特征,讓機器可以自己學習出包括量價關系在內海量信息的升級版 技術特征 ,預測當前持倉最後盈利的概率。

AlphaGo可以基本上完全不懂圍棋是什麼的情況下,簡單粗暴的根據棋譜訓練出神經網絡,那麼深度學習也可以在毫無金融領域知識的情況下,精準識別不同經濟背景不同股價走勢的特征,並評估出現在持倉的盈利潛力。而且,如果人類能通過經驗整理出厚厚一本的技術分析指南,那麼機器則可以學習出整部四庫全書厚的高階形態特征,以更為精準的預測。

當然僅僅知道瞭市場變化還是不夠的。如前面提到,金融的交易有數不清的對手方,他們之間的信心、判斷、操作都會相互影響。投機套利需要抓住對手方轉瞬即逝的 錯誤 定價,不然就會被其他人搶走。我們可以再訓練另外一個策略網絡,來模擬最優秀的交易員面對同樣的環境會如何抉擇。最後,結合兩者到一顆蒙特卡洛搜索樹中,就可以在瞬息萬變市場中抓住市場的滯後賺到大錢。

在股票交易領域,人工智能還有一個契機可以利用。人類的圍棋高手可以在棋局上刻意地制造復雜的局面,通過有意識的 做局 騙過機器。但是單一投資機構左右金融市場的難度太大,這反而給瞭人工智能更廣闊的應用空間。

但是另一方面,股票市場缺充斥著非公開信息,不同水平投資者的主觀判斷、信念抑或是沖動、貪婪。如何界定數據邊界,避免機器在邊界外的過度擬合而犯下讓人啼笑皆非的低級錯誤,還需要一定的探索。所以至少目前階段,AlphaGo作為股票交易者,尤其來到中國A股市場進行實操,還為時過早,即使不用斷掉google服務器連接,估計也贏不瞭中國大媽。(作者系前海征信總經理)

作者:邱寒來源一財網)


3063

2016年3月,發生瞭圍棋界的 世紀之戰 ,台中推薦月子中心這也是近些年來人工智能與人類之間的巔峰一決。台中產後月子中心GoogleDeepmind開發的人工智能Alp

台中月子中心收費台中月子中心比較>台中產後之家推薦

台灣電動床工廠 電動床

台灣電動床工廠 電動床

AUGI SPORTS|重機車靴|重機車靴推薦|重機專用車靴|重機防摔鞋|重機防摔鞋推薦|重機防摔鞋

AUGI SPORTS|augisports|racing boots|urban boots|motorcycle boots

arrow
arrow

    trsdwgsd2u 發表在 痞客邦 留言(0) 人氣()