新聞中心
人物動態 | 王小川:人工智能技術有不足 阿法狗現在仍贏不了輸的那一局
搜狗公司CEO王小川今日在奇點大會上發表演講,他圍繞“人工智能”談到了最近的思考和感受,并認為目前國內對人工智能的發展有所高估,應該有一些理性的反思。不過王小川也結合搜狗的探索,談到了他認為的人工智能的未來發展和應用方向。
王小川稱,自己近期去美國硅谷和AlphaGo的開發團隊有了交流,但對方告訴他,在3個月以后,不斷進化的AlphaGo還是贏不了輸給李世石的那一局比賽。
“AlphaGo就像一場啟蒙運動,所有的公司所有的投資把眼光都看向了人工智能,在全球范圍內的投資異常地活躍,中國也一樣。那在這個時候我更多想談到,我們得小心什么地方是陷阱,什么地方是真的人工智能的未來?”王小川說。
這位搜狗CEO認為,目前情況來看,人工智能的陷阱主要有兩個,一是技術上存在缺陷,無論是自動駕駛還是語音識別,都存在技術上的缺陷,需要去完善;二是對于很多人工智能創業團隊來講,會存在“帶著技術找市場”的問題,但在這個過程中還沒找到市場就出局了,或者找到市場后,技術已經落后。
王小川認為合理的解決方式是帶著技術應用到現有的產品中,不斷通過人工智能技術提升產品體驗,并且在原有市場的基礎上實現更大的價值。王小川還透露說,這也是目前搜狗在搜索、輸入法等領域的發展思路和方向。
“其實有朋友跟我談搜索的時候說王小川你今天挺高調的,不停談人工智能,你們要轉型做人工智能了么?我說不是,搜索本身就是一種人工智能,而且是有幸福感的人工智能,因為它能讓每個人變的更加地強大。”王小川解釋道。
值得一提的是,王小川全程演講中,同步使用了“實時語音識別”,他每講的一句話都會實時被識別成文字投射到主屏幕上,而最后演講完,演講全文速記也實時完成。王小川稱語音識別現在還不完美,需要繼續解決“噪音”和“多人說話識別”的問題,但他也樂觀表示,會一步步被技術和產品解決。
在今日演講會前,新浪科技在早餐中和王小川偶遇,他告訴新浪科技:“人工智能太火了,我要往回拉一拉,拿點實際的產品出來。”(李根)
以下為搜狗CEO王小川實時演講速記全文:
大家好,我本人是人工智能的鼓吹者。在大家談互聯網的時候,我們就開始談產品;大家談產品的時候,我們就開始談技術;大家開始談技術的時候;我們已經開始談人工智能。那今天大家都在談人工智能,我要談一些什么東西呢?
感謝李志飛,其實他的演講我非常喜歡,我很感謝他把我想講的東西都已經講完了,很多理解是一樣的。李志飛在最后說,今天沒有給大家帶來一個演示,搜狗帶來了,請看大屏幕!我們預料到了今天網絡可能有故障,所以我們把服務器搬到了現場!
那么我們在談人工智能的時候,我會談一些反思,因為今天大家可能過多高估了人工智能的未來。在今年上半年,我是鼓吹AlphaGo這樣一場跨世紀的比賽,4:1的比分。那么之后就像一場啟蒙運動,所有的公司所有的投資把眼光都看向了人工智能,在全球范圍內的投資異常地活躍,中國也一樣。那在這個時候我更多想談到,我們得小心什么地方是陷阱,什么地方是真的人工智能的未來?
就在前一個月,我去谷歌跟AlphaGo的工程師做了深度的溝通。有件事情我得告訴大家,AlphaGo并沒有停止研發,還繼續在往前進步。但是我跟他們聊的時候,談到到今天為止,跟李世乭下棋的第四局,機器還是贏不了。我是非常驚訝的,已經過了3個月的時間,所以我跟他們說,有什么樣的算法可以改進贏得第四局的比賽?谷歌的工程師跟我苦笑,他說你講的方法我們都試過了。
回到我們深度學習。今天大家知道有一個巨大的危險,因為傳統做人工智能的專家就在預言,深度學習有一些缺點,穩定性不夠,在一些需要可靠性的場景里面,沒有完整的數學的計算和證明。所以這種情況里面即便是99的正確性,也可能會帶來不確定,比如在無人駕駛,這1的不確定性,就可能帶來汽車的失速,而且不知道怎么修正。所以我們今天會知道,深度學習我們認為可以做很多的事情,但是到現在我們人類的技術掌握還是比較淺的。
那么我也談到在語音識別這樣的一個話題,今天語音識別已經到了比較高的準確度,已經接近實用,但是其實還是很多的限制。比如說我們需要安靜的環境,當有噪音的時候同時有兩個人說話機器就搞不定了,我們的辦法是,比如說在汽車環境里面,預先錄制發動機引擎的聲音,或者是噪音加到識別里面去,就把沒有見過的環境變成機器能夠見過的環境,就能夠做識別。
但是我跟工程師聊,那其它的環境,如果有兩個人說話怎么辦?總有一個人的聲音是聽不到的?我們的解決方案是用麥克風舉證,有一種麥克風可以定向識別,如果兩個人不同的位置不同的聲音,聲音的音源可以分離開。人是這樣嗎?人是靠兩只耳朵定聲音嗎?如果只有一只耳朵,或者兩個人在同一個方向說話會怎么樣?人是能識別的對吧?機器就做不到了。所以我在這張圖里面跟大家演示,我也問了搞神經科學的人,他們說人跟機器有本質的區別,如果兩個人說話的時候位置不一樣,人可以分離開,如果位置一樣,一個人聲音大,一個人聲音小也能分開。如果兩個人的聲音一樣大,一個是男聲,一個女聲也可以分開,如果都是男聲,但一個人說中文,一個人說英文也能分開。所以人是在一個環境當中,只要能夠找到一線機會,把兩個聲音的不同找到一個特征,就能動態地去分離。但對不起,今天在全球范圍內,我們號稱在語音識別有重大的各種各樣的突破,還是解決不了這樣的問題,所以我們知道今天的計算機離人還有巨大的距離。
那么除了這樣的一個技術本身的瓶頸以外,我們在創業當中有很多領先的技術公司還會面臨什么樣的瓶頸?很危險的一種可能性就是有技術,帶著這種技術找市場。比如說我們做了人臉識別,就開始想象人臉識別怎么去使用?就去找市場的方向,但是很有可能在這個過程當中沒有找到,我們公司就死掉了。也有一種可能性是在找市場的過程當中,我們花了很多力氣組建我們的銷售團隊,我們嘗試跟各個領域結合,但是這個時候忘記了技術的源頭,因為技術是不斷地迭代更新,如果不能跟高效、前沿的技術保持同步,可能我們偶爾找到一點市場,但是我們的技術已經落后。
今天在中國的人工智能領域里面,做語音識別、圖象處理的公司有好多已經掉到這樣的陷阱里面去了。所以這個創業的道路,我跟投資人講沒有那么容易,技術本身不那么靠譜,即便技術靠譜可能沒有市場,即便有了市場可能我的技術已經丟掉了。
還有一種我們的做法,已經有廣大的市場,搜狗的輸入法、搜索已經有千萬的用戶使用,這樣的情況下,我們找技術的時候就會更加踏實。所以我在這里畫了一個簡單的樹,就是市場技術跟產品之間的關系:樹根是技術,樹干是產品,真正開花結果是最后的市場。所以有一些情況里面,是當我們有根的時候要努力發芽長樹干,等它能開花結果,中間的困難是非常多的。而還有很大的困難是,如果我們有了這樣一些果實,我們有了市場的時候,或者我們認為我們有市場的時候,把根基丟了。
人工智能跟高校、跟學術界的聯絡非常多,國內需要的做法,不是從國外學成歸來之后我們做技術,也忘記了這樣一個研發的進展就去找市場,而是不斷地跟技術的前沿保持同步。比如李志飛一定有他的工程師團隊讀論文,甚至在這個里面寫自己的論文,把前沿跟上。人工智能創業不像有互聯網的創業一樣,而是不斷地把技術更迭起來。
那么這個里面也提到一個命題的作文,我們怎么討論技術跟幸福之間的關系?我做了一張簡圖,左邊是我們提的一些技術,包括語音識別、人臉識別、人機交互、服務機器人等等。大家覺得這個詞跟幸福有關系嗎?在座大多數的人本身不是搞技術的,因為大家敬仰技術,崇拜技術,所以我們會過度地在技術里面想象它無限的光環,其實跟幸福沒有關系,其實是因為我們的不理解,恐懼和向往帶來一種誤解。看右邊,右邊這些聽起來我就覺得比較酷了,自動駕駛、能聽懂我說話、診斷疾病、一鍵送咖啡。聽著怎么樣?是不是有幸福感?左下角的詞大家看到了嗎?活捉皮卡丘,大家知道我要說什么嗎?最近非常火的虛擬現實的游戲,不是在像左邊一樣講虛擬現實,而是講帶來了一個把活生生的卡通形象放在我們面前,這是我們看到的幸福。
所以對比左右兩個圖,無論創業者,還是媒體人,還是投資人,我們應該看到當我們的技術能夠讓我們有幸福的時候,那它更有可能成為一個技術變成一個產品,變成一個市場成功的應用。跟大家講講我們對于搜狗技術跟幸福之間聯系的理解。其實有朋友跟我談搜索的時候說王小川你今天挺高調的,不停談人工智能,你們要轉型做人工智能了么?我說不是,搜索本身就是一種人工智能,而且是有幸福感的人工智能,因為它能讓每個人變的更加地強大。
有時候我跟一個90后走在一塊,我發現他很厲害,他無所畏懼,因為他知道擁有了搜索之后,他能解決所有的問題。上面一搜索就有答案,所以今天的這些年輕人利用技術,利用搜索變的更加地強大,擁有了更大的幸福感。
那么再多補一句,為什么說搜索就是一種AI呢?先看一個簡圖,搜索第一部分是讓用戶先要去做一個關健詞的搜索,然后給它提供10條鏈接,這是搜索今天產品運行的基本方式。但是這個關健詞是我們最好的輸入模式嗎?今天大家已經很習慣了,我回顧1999年到2000年,搜索剛剛出現的時候我觀察過,那個時候大家更愿意敲整句話,但發現機器不能識別,所以大家被訓練使用這樣的關健詞。這個就像計算機使用鼠標一樣,大家都會很習慣用鼠標,但是今天我們發現喬布斯告訴我們,更好的方式是用手指直接在屏幕上戳,所以關健詞的輸入相對于自然語言的輸入就像鼠標和用手指自然表達一樣,是需要繼續提升的。因此搜索引擎往下的進展方向就是把讓人去想一個關健詞,變成讓人去表達一個完整的句子,機器找出中間的含義。同樣的10條鏈接也不是我們最想用的方式,而是應該通過用戶的問句直接給出答案或者是命令,機器做執行。
因此今天搜索的進化對搜索引擎公司是一個漸進的過程,就像谷歌,他已經提到自己從一個移動互聯網公司變成一個人工智能公司,那為什么他沒有做到這個東西呢?聽著很好聽對吧?是因為今天全人類的技術,距離做到讓機器去理解人,能變成一個句子給出答案還是有距離的,只是我們在這條道路上一直走。人工智能引入不是顛覆性的市場,而是原有的需求漸進的改進,對谷歌,對我們一樣,包括對百度也是這樣的邏輯。
所以我們提到搜索公司本身就在做人工智能,如果大家看搜狗覺得不過癮可以看谷歌,他已經代表了人工智能在今天運用的最高峰。因此在現在的應用里面類似于Siri還有其他的交互功能是我們的夢想,我們判斷這樣的未來是屬于搜索公司的。好,給大家看一個我剛剛提到的美妙的動畫。這個片子我相信大家都看過,其實是代表未來人工智能在我心中的方向,搜索公司未來走的方向也是向這里發展的。
我們談到語音輸入,今天是被大家吐槽特別嚴重的領域,也是我們發展的一個重要環節。大家知道訊飛,但可能不知道搜狗是中文語音識別用戶量最大的應用,我們一天有1.4億次的語音識別量,準確率超過97,搜狗輸入法的用戶,剛剛提到做語音識別是不夠的,我們還會在上面做什么呢?給大家看一段視頻。我們怎么把97繼續提升?
OK,最后大家剛剛已經看到,我的演講已經被翻譯成了文字,所以應該是可以給大家一個二維碼做下載的。