
編者注:Maria Johnsen是一位備受贊譽的AI搜索引擎專家,專注于搜索引擎技術研發和市場營銷相關領域。本文為BuzzFeed對她的專訪,具體談到AI的歷史發展以及技術要點。
人工智能是如何形成的?
在過去的200年,哲學家們一直都在嘗試理解和解決兩大問題:人類意識的工作原理和非人類是否存在意識。一些哲學家偏向于被稱為人工智能的計算方式。人工智能之父John McCarthy認為這是一種制造智能機器的科學和工程,屬于計算機科學的一個分支,旨在讓計算機、機器人以及智能化軟件按照人類的智慧進行操作。
然而,針對人工智能仍然存在諸多爭議,有一些科學家認為諸如愛、創造性發現和道德性選擇等高度復雜的行為是遠遠超出機器的能力范圍的。一些人甚至認為人工智能將是機器統治人類的方式。有些人則認為這不過是一個毫無意義的技術術語,只是正好組成了當今技術的重要基礎,解決了計算機科學領域內的眾多難題。但是AI將通過研究人腦的思考、學習和決策方式來達成解決問題的目標。
大數據在AI中扮演了什么樣的角色?
大數據包含高頻數字數據的數量和多樣性。處理大數據需要綜合編碼技能、領域知識和統計技能。大數據由互聯網、元數據(標簽)、翻譯和土耳其機器人構成。大數據本身并不是很有用。就是一堆信息而已,除非你能夠找到一種方法利用它。
你無法理解大數據。我們不會有人去看一本電話簿,那是沒有用的。只有你使用了,大數據才是有意義的。例如,以往沒有一個搜索引擎程序員會查看數據來給出諸如房屋、狗、貓等輸出,因為用戶過去并不會使用這些標簽。而現在,即使是我的祖母也知道如何使用標簽和話題。
如今,我們每天都可以看到大數據的作用。Facebook能夠處理超過400億張的用戶照片,CERN的LHC系統可以每年給沃爾瑪創造出15PB的數據,可以在一小時內處理超過10億次客戶交易。
我們可以處理沒有數據的大數據嗎?
不,你不能。搜索引擎的工作不僅僅是索引數據,F在大家對搜索引擎收集數據這件事感到有些擔憂。從安全的角度來看,這個問題通常與在系統中復制敏感文件有關。如果數據是被直接寫入索引的,那么它會更加安全些,因為這些都是難以瀏覽和讀取的二進制文件。不過其中一些信息可以被公司或政治家利用。
有關搜索系統中的隱私和搜集信息,你有什么建議嗎?
創新在人工智能搜索引擎的發展中起著非常重要的作用。一個智能化的搜索引擎應該理解來自意外地點的異常處理。不幸的是,如今99.9%的搜索引擎還沒有這樣的系統。我所指的異常并不是在Java編程中所使用的“拋出異常”術語。
熱門搜索引擎將如何在人工智能過程中演變?
目前,Google的AI流程RankBrain對領域有著非常重要的影響,預計這種影響會繼續擴大。而其他搜索引擎,如必應、百度、Yandex等也開始將AI流程納入其搜索排名中。RankBrain會使用每個查詢的用戶歷史紀錄,這意味著會有更多的信息被用于確定合適的搜索排名。
相信這些搜索引擎也將會很快追趕上谷歌的步伐。
未來AI將會如何改變搜索引擎?
對于用戶來說,人工智能的發展意味著我們找到所需要的東西將會更加容易,尤其是你曾經搜索過相關信息的時候。通過結合其他技術,搜索引擎將會變得更加高效,并創建出更友好的用戶界面。對于營銷人員來說,AI算法讓內容營銷占據了主導地位。這意味著他們需要將關注焦點從關鍵詞和關鍵短語上轉到和用戶背景和興趣相關的內容上。由于在線業務成了網站的重點,想要吸引具有真正興趣的潛在客戶可能需要時間的積累。
雖然目前還不了解人工智能的全部影響,但是可以確定的是,它已經在決定搜索排名的算法中扮演了一定的角色。對于熟悉SEO的營銷人員來說,目前對關鍵字的關注正在減少,急需采用其他的技巧來創造一個有效的營銷策略。
人工智能如何影響語言?
為了創造出更好的翻譯系統,神經語言和機器學習被大量的應用。雖然現在有很多在線翻譯程序,但是大多數都會有語法錯誤,其數據結構也是很原始的。然而,Google創造了一種與舊版本完全不同的神經機器翻譯(Neural Machine Translation)系統。我測試了一下,發現仍然會有語法問題,但是系統會逐漸學習到錯誤所在,并進行改善。我有時間的時候就會幫它糾正一些語法問題。不過現在依賴神經機器翻譯系統還為時過早。隨著人工智能的加入,經過一段時間,它將會學習到正確的語法和發音。這一點主要是因為它的神經系統主要是根據生物大腦來開發的。
你對搜索引擎和大數據有什么看法?
搜索引擎提供商已經提供了統計分析。一些搜索引擎提供商采用多種方式從每個交互中收集長期數據,并對大數據進行處理。他們創造了一種大數據處理框架,可以兼容搜索引擎。它們具有可擴展性,并可以處理極大量的內容。
如今的搜索引擎趨勢是什么?
進行實時分析和搜索是搜索引擎的重要組成部分,云的出現讓這一部分的實現不再是問題。云計算正在以非常深刻的方式改變著計算機世界。
目前搜索引擎趨勢主要包含三部分:大數據、搜索實時個性化和機器學習。以實時個性化為例,公司可以提升客戶的體驗。
你對如今的搜索引擎有什么看法?它們很完美嗎?
搜索引擎能夠了解非常廣泛和通用的信息。這就是為什么許多搜索引擎提供商會不斷使用不同的算法來更新他們的搜索系統。例如,谷歌搜索可以理解諸如電影、地圖、照片等請求,但是這些都不是用戶所想要的。用戶希望獲得更多信息,而這一點谷歌搜索還無法做到。每家公司都有自己的術語和數據。當他們進行搜索時,會得到不一樣的結果。如果一家網絡安全公司創造了一個安全領域的搜索應用,或者一家軟件公司創造了專屬的搜索引擎,他們是無法找到想要的信息的。因為所有的信息都是很寬泛的。
搜索引擎可以創建一系列與查詢匹配的模式。他們可以使用大數據來創建這些模式。這意味著搜索引擎應該創建與查詢匹配的模式數據庫。而這些在如今的搜索引擎及技術中仍是缺少的。
搜索引擎提供商應該對用戶有著更好的了解。我們需要一個可以讓我們能夠理解的搜索引擎。所以谷歌的個性化搜索引擎仍然是原始的。但是一個個性化的AI搜索系統可以讓我們不再需要輸入搜索,而是以更加深刻的方式說出和接受結果。
當然,這也有一個缺點,那就是如果用戶之前從未進行過相關搜索,那他們就無法找到所需的信息。由于搜索引擎幾乎沒有可用的信息用作參考,可能導致最終的搜索結果并不是最優化的。