新浪科技專訪搜狗CEO王小川
新浪科技 李根
搜狗CEO王小川在烏鎮(zhèn)演講時“炫”了一把技術(shù),在現(xiàn)場,他一邊講,實時文字轉(zhuǎn)錄一邊在屏幕顯示——但這還不算結(jié)束,考慮到現(xiàn)場有不少老外,這項實時轉(zhuǎn)錄技術(shù)還加入了“翻譯”。
也就是說,在王小川用“川普”(四川普通話)發(fā)表對人工智能的看法時,老外們直接看實時字幕就能知道他在講什么。實際上,現(xiàn)場的效果是,那些老外看到有“英文字幕”時,紛紛摘下了同聲傳譯設(shè)備。
在其后新浪科技向王小川描述這一幕時,這位搜狗CEO顯得非常開心,不過他也不忘謙虛了一句:“也不枉我們背了服務(wù)器過來?!边€笑稱調(diào)試時去掉了機(jī)器對口頭禪“是的”的翻譯,“因為中間有翻譯的時候說是的時候,它說 yes I am?!?/p>
王小川認(rèn)為這種翻譯不僅會顯得“傻”,而且會導(dǎo)致更大的問題,“做翻譯的時候?qū)φZ音識別要求特別高,你放個火箭的事,把衛(wèi)星打到預(yù)定軌道上絲毫不能錯,語音錯一點(diǎn)在翻譯上就會疊加了,所以這對語音要求特別高?!?/p>
然而,對于王小川和他的技術(shù)團(tuán)隊來說,今年的“炫酷”表演顯然不止于此。在采訪現(xiàn)場,他開心之余還向新浪科技展示了自己手機(jī)里的最新Demo:一個實時傳譯功能。
當(dāng)新浪科技說出“好的,這個新產(chǎn)品,是不是意味著以后出國采訪再也不用帶翻譯啦”時,軟件很快給出了翻譯并“讀”道:“OK, this new product, isn`t it meant to be able to go abroad and do not have to translate it again?!?/p>
這將是王小川和他的搜狗團(tuán)隊在今年將交出的又一個人工智能功能和產(chǎn)品。
這一年以來,王小川和搜狗高管被問到最多的問題是“怎么搜狗也轉(zhuǎn)向做人工智能了?”
這位搜狗CEO每每都感到哭笑不得。一方面,他覺得外界對于人工智能的技術(shù)原理還沒得到普及,進(jìn)而忽略了搜狗從搜索和輸入法到“人工智能”的自然而然;另一方面,他害怕強(qiáng)調(diào)技術(shù)立身的搜狗被外界誤解,認(rèn)為“也玩概念”了。
從清華校園出發(fā),通過搜索、瀏覽器和輸入法,拿下中國搜索市場第二份額和輸入法市場第一份額,王小川認(rèn)為搜狗的人工智能“到時候了”。
一方面,搜索的核心本質(zhì)是通過人機(jī)交互獲取信息,而人工智能會讓這種交互更加自然且高效;另一方面,搜索資源、和輸入法語料積累的大數(shù)據(jù),也可以通過機(jī)器算法和模型,有了進(jìn)一步發(fā)揮價值的時候。
2016年下半年以來,搜狗先在輸入法中推出了“快速分享”和“智能推薦”,解決聊天場景中不同App切換的問題,比如雙方約定餐廳吃飯,但需要來回在聊天應(yīng)用和點(diǎn)評App間分享切換;或者分享一首最近發(fā)現(xiàn)的新歌,需要在聊天應(yīng)用和音樂App間切換;再或者使用瀏覽器搜索資料時再分享時,都無法直接利用輸入法解決問題。
其后,搜狗在輸入方式上,開始把此前隱而不宣的“語音輸入”加強(qiáng)權(quán)重,并開始在公開活動上,頻頻展示目前“實時轉(zhuǎn)錄”的速度和準(zhǔn)確率。
王小川認(rèn)為這也和大環(huán)境息息相關(guān),他表示互聯(lián)網(wǎng)和移動互聯(lián)網(wǎng)對于“連接”已經(jīng)實現(xiàn)得差不多了,接下來要靠數(shù)據(jù)驅(qū)動,而數(shù)據(jù)中間則會產(chǎn)生智能。搜狗將主要在社會連接、商業(yè)形態(tài)提升效率方面進(jìn)一步下功夫。
這位搜狗CEO還表示,年內(nèi)會正式宣布新戰(zhàn)略,詳細(xì)談下后“三級火箭”時代里,搜狗將會成為一家什么樣的公司。
當(dāng)然,對于搜狗來說,今年的重大事件或許還不止于“戰(zhàn)略”。
今年6月,搜狗內(nèi)部晉升了三位副總裁,分別出任COO、CTO和CMO。對于這種組織架構(gòu)的完善,當(dāng)時官方給出的說法是“內(nèi)部激勵”。但在新浪科技采訪現(xiàn)場,王小川的回答顯得意味深長。
這位一手在搜狐內(nèi)部實現(xiàn)搜狗從無到有、從弱到強(qiáng)的CEO表示:“我覺得時間到了吧?!?/p>
值得一提的是,在說完“時間到了”之后,他略帶詭異地笑了一下,“其他考慮不能告訴你,背后有很深的思考,但是不能說?!蓖跣〈ㄑa(bǔ)充道。
另附經(jīng)新浪科技編輯的采訪實錄節(jié)選:
新浪科技:除了實時轉(zhuǎn)錄和翻譯,這個還能怎么應(yīng)用?
王小川:你和老外就可以聊天。
新浪科技:有平臺考慮嗎?我輸中文給對方直接翻英文?
王小川:平臺都可以,因為我是輸入法。我們最終會把翻譯的過程干掉,在你這兒顯示的全是中文,在對方那兒顯示的全是英文,把中間翻譯的過程去掉,你也能用語音直接輸入。
新浪科技:也會和搜索有關(guān)系?比如你之前談到的“跨語言”問答。
王小川:有關(guān)系,而且翻譯過來了,你看到的全是中文的,但背后是絕對的信息。因為你要知道中文信息是不靠譜的,我們做醫(yī)療就知道,醫(yī)療現(xiàn)在不是廣告問題,廣告去掉一樣很爛,中國網(wǎng)頁上充斥不靠譜的內(nèi)容,西方世界則靠譜很多,你原材料不好,怎么都加工不出東西了,所以我們是去檢索全球內(nèi)容。
還有輸入法也是,現(xiàn)在你輸入中文,但是你一發(fā)布就是英文出來了,發(fā)出去就是英文。我給你們看一個東西,這都是內(nèi)部的東西,都沒有發(fā)的。今天我們參加了烏鎮(zhèn)世界互聯(lián)網(wǎng)大會,點(diǎn)這個鍵,然后在這兒,這個翻譯,這個網(wǎng)比較慢,它翻譯這個東西了,內(nèi)部你可以輸入中文然后往英文轉(zhuǎn)。
新浪科技:現(xiàn)在人工智能大家都從語音這方面入手,為什么?
王小川:第一,用深度學(xué)習(xí)的方法解決語音是最合適的武器。深度學(xué)習(xí)用來解決語音圖像問題很適合,解決文字特別難,文字里面唯一能夠干的東西,唯一能夠往實用走的東西就是翻譯,翻譯不是要讀懂,只是需要把兩段話變過去就可以了,省略中間過程。
第二,傳統(tǒng)翻譯是靠規(guī)則的,是靠概率計算,那個翻譯的結(jié)果:一是翻譯的磕磕巴巴,讀起來非常難受,但意思不會錯,這是傳統(tǒng)翻譯的好處。我們現(xiàn)在用的這套技術(shù),讀起來特別流暢,但有可能意思完全不對,完全可能遇到。因為它和AlphaGo第四局棋一樣,到它不會的時候是發(fā)瘋的,可以完全翻成相反的意思,這套翻譯技術(shù)都有這個問題。
新浪科技:所以做人工智能還是得有核心數(shù)據(jù)?
#p#分頁標(biāo)題#e#王小川:要么是核心數(shù)據(jù)要么是核心技術(shù),但一般來講我覺得比較靠譜的是升級你的商業(yè),你原來商業(yè)上已經(jīng)跑通了,機(jī)器只是把它的效率跑得無比高,比如放貸這件事,機(jī)器以后做小額貸款就比人貸款效率高。它其實是商業(yè)的升級,純粹從技術(shù)出發(fā)做這個事很難的。
新浪科技:認(rèn)同移動互聯(lián)網(wǎng)時代過去了的說法嗎?怎么看趨勢?
王小川:連接這件事情差不多了,剩下要靠數(shù)據(jù)驅(qū)動了,數(shù)據(jù)中間產(chǎn)生智能。往下兩個方向:一個方向是虛擬體驗,不僅是VR眼鏡,但總能帶你暢想一個新的世界。我們看小說、看視頻、玩游戲都是虛擬體驗,這是人性的一部分,人就喜歡玩自己沒有經(jīng)歷過的事,這是方向一,手機(jī)游戲也在這個體驗里面。
方向二是機(jī)器智能或者商業(yè)智能,大家在商業(yè)社會中由于本身的技術(shù)提升,機(jī)器開始參與做決策,使得整個社會連接、商業(yè)形態(tài)里產(chǎn)生更高的效率。我認(rèn)為大體往這兩個方向走。
具體搜狗來說的話,虛擬體驗我其實不太會,不在我們這里。我們是商業(yè)智能。
新浪科技:那目前人工智能有缺點(diǎn)嗎?
王小川:人工智能,第一,要靠數(shù)據(jù)驅(qū)動。它本身不是具有推理,有通用學(xué)習(xí)能力,有人的歷史數(shù)據(jù)用來做復(fù)制,現(xiàn)在技術(shù)就到這一步。
第二,必須靠學(xué)習(xí),大量數(shù)據(jù)的學(xué)習(xí),不是說一點(diǎn)數(shù)據(jù)或者推理就能得到結(jié)果的,什么事能被機(jī)器取代?就是一件事情,人在里面靠經(jīng)驗重復(fù)做,這時候機(jī)器只要數(shù)據(jù)大了,就可以取代。
新浪科技:現(xiàn)在就人工智能而言,中國和硅谷差距在什么地方?
王小川:我覺得基礎(chǔ)研究上差距巨大,包括學(xué)校和學(xué)校上研究出來的,像Google招的那些科學(xué)家,他們真的能夠發(fā)明新的算法和新的體系結(jié)構(gòu)來解決人工智能的問題,像CNN這次聽過嗎,LSPM那些新的算法,都是人家發(fā)明的。我們基本是看論文,看誰能夠最快把論文的這些東西用到我們系統(tǒng)里去。我給你個數(shù)據(jù),全球前十大互聯(lián)網(wǎng)上市公司,中國占了4家,但全球前100所高校,中國只有兩家,一個清華一個北大,還只是中不溜的。在這種研究能力上你的差距是巨大的。
學(xué)校是什么原因呢?因為我們學(xué)校還需要去行政化才行,老師的目標(biāo)不是真正出成果,而是為了這種怎么去升職,怎么去發(fā)論文,怎么去成國家的重點(diǎn)項目,所以它的目標(biāo)不一樣就做不好,其實老師都挺聰明的。
我們做天工智能研究院就希望給他們開個口子,因為他們有時候有的人追求的目標(biāo)是升學(xué)校教授,要拿多少的科研經(jīng)費(fèi),我們幫他們解決問題,看看能不能喚醒一些人。但總的來講氛圍上,就是沙漠上滴了兩滴水,還是特別難。
新浪科技:但整體而言今年是人工智能大爆發(fā)的一年,變化很大。
王小川:第一,今年是個啟蒙運(yùn)動,大家開始認(rèn)識到了人工智能偉大的意義,所以也會有更多的資金、人才投入到人工智能的研究或者商業(yè)中去,因此人工智能真正啟蒙運(yùn)動后的大爆發(fā)剛剛開始。但是我們又有時候會高估人工智能現(xiàn)在的能力,開始想象人工智能是否會威脅人取代人,這是不存在的。但凡你和一些比較嚴(yán)肅的做學(xué)問的人聊的時候,大家都會不斷給你降低這里面的預(yù)期。
第二,有一些酷炫的東西很酷,但其實智能性或?qū)嵱眯允遣粔虻?,比如像我講的圖像合成,拿兩個圖合成第三幅圖,比如你拿個風(fēng)景畫或者一個人的照片,背后你再把中間像搞一些著名的畢加索的風(fēng)格放進(jìn)去,聲稱一幅畫是畢加索風(fēng)格,大家說好厲害,或者一幅圖片里識別出里面有熊、長頸鹿,這種技術(shù)上的突破確實是很大的,但到整個產(chǎn)品實用的路徑是非常遠(yuǎn)。
所以,今天我提出一個概念,我們在產(chǎn)品層面上人工智能有三個幫助:一是識別,語音識別和文字識別;二是生成,你能夠合成圖像、語音和文字,但這些可能都不夠重要,真正重要的方向是讓機(jī)器做決策,就是做準(zhǔn)確決策。
新浪科技:在搜狗而言,你認(rèn)為人工智能會有什么坑嗎?
王小川:我們覺得是好用,想得比較清楚,對技術(shù)真正了解,有些對技術(shù)不了解的公司,可能投了一個技術(shù)覺得技術(shù)做不到,或者技術(shù)轉(zhuǎn)化不了產(chǎn)品,或者產(chǎn)品沒有商業(yè)模式,我覺得我們以前在歷史的積累中對這些問題都有自己的思考。老周踩得坑,你要看我以前的一些講話里都提前講了,就是這些坑他會遇到的,硬件免費(fèi),做兒童手表那會兒又是打安全牌,這些就不靠譜嘛,但他自己實踐一次才知道。
另外的話,開放性,因為對我們而言,我們是一家 to C 的公司,最終是給普通的消費(fèi)者提供我們的服務(wù)。
新浪科技:今年你們設(shè)了CMO、CTO和COO,主要是為了激勵還是有一些其他方面的考慮?
Copyright @ 2005-2020 南京同傳翻譯公司 版權(quán)所有