搜索引擎收錄是搜索引擎收錄一個網站頁面具體的數量值,收錄的數量越多,收錄的時間越快,證明此網站對搜索引擎比較友好。
微軟于12日宣布了一種全新的名為“Catapult”的構件,它可大幅提升微軟旗下搜索引擎必應(Bing)的搜索性能,其內置有一個專門的可重復編程芯片。據稱微軟準備在2015年將這一技術應用到自家所有數據中心。無獨有偶,中國最大的搜索引擎百度也宣布了相似的消息。百度在加利福尼亞州庫比蒂諾召開的HotChips學術大會上遞交了論文,該大會致力于分享微處理器及其相關技術方面所取得的成果。
如今,圖形芯片被認為是個人電腦和游戲機的重要組成部分,正如幾年前,音頻加速器也被人們認為是必不可少的。這些芯片各司其職、效率極高,共同為我們的電腦服務。還有一類芯片,也就是我們常說的微處理器,如英特爾的酷睿處理器、AMD的A系列APU(加速處理單元)和ARM的Cortex處理器,它們屬于通用芯片,這意味著它們能夠勝任各種復雜任務。
FPGAs(現場可編程門陣列)的定位恰好位于兩者之間,比起專一功能的芯片,它在更低的性能條件下,具有一定的可編程性。微軟的高級研究設計工程師AndrewPutnam說,最初的想法是用FPGAs讓老舊服務器重獲新生,同時“增加服務器的靈活性”。用他的話來說,“一旦數據中心采購了一臺服務器,這臺服務器往往得工作到壽終正寢。”
靈活性對于軟件算法的提升至關重要,搜索算法就是一個典型的例子,搜索算法本身需要不斷地微調和優化。AndrewPutnam說,隨著時間的推移,固定功能的服務器加速器效率會變得越來越低,浪費空間和電力。
AndrewPutnam的團隊曾嘗試使用6臺賽靈思公司(Xilinx)的FPGAs,但最終放棄。因為這會使服務器的設計復雜化、易產生單點故障以及散熱過大,這些問題讓支撐Bing和微軟云服務的數據中心的管理者頗為不安。于是微軟轉向了“Catapult”,其內置AlteraStratixVG5D5,擁有8GB內存、32MB閃存和PCIGen3x8通路。
Catapult會出現在微軟的開放式服務器中,“開源計算”(OpenComputeProject)這一想法最早由Facebook提出并發揚光大,該項目旨在為面向運行互聯網服務的高效節能計算機提供技術參數和設計信息,并將其進行共享,從而通過共享設計參數來促進專業服務器的有效性和需求。這也就意味著,戴爾、惠普這些硬件供應商將無法再繼續完全掌控服務器產品的設計流程。微軟的服務器擁有兩個主頻為2.1GHz的8核因特爾至強(Xeon)處理器,一個64GBDRAM(動態隨機存取存儲器),4個2TB硬盤及兩個512GBSSD。微軟將一塊FPGA芯片插入到每臺服務器中,同時將服務器又插入到半機架(48臺服務器)中。FPGA芯片通過6x8的圓環形網絡中的電纜相連。
微軟隨后擴大了FPGA芯片的試驗范圍,對數據中心的1632個服務器進行了試驗。AndrewPutnam說,微軟發現了FPGA芯片提高了Bing的搜索性能。Bing的搜索處理量提升了一倍,搜索時間縮短了29%,隨之而來的好處是微軟的服務器數量可以削減一半。
AndrewPutnam說道,這個測試非常成功,將在2105年覆蓋所有的Bing服務器。目前所面臨的挑戰是繼續挖掘FPGA技術的其它應用場景。
讓我們再來看看中國的搜索巨頭百度。百度在中國有數萬個服務器,它也采用了FPGAs來提升深度神經網絡(DeepNeuralNetworks)的性能,這種算法涵蓋了傳統搜索、語音識別乃至圖片搜索和識別。百度使用搭載了賽靈思公司(Xilinx)K7480t-2lFPGA芯片的主板,可以在任何類型的IU和2U服務器上實現拔插。在不同的工作負載下,FPGA比CPU和GPU的效率都要高出好幾倍。
從用戶的角度出發,他們關心的是必應(Bing)和百度搜索服務的質量。目前Bing和百度都致力于提升自家搜索算法的效率和性能,這對廣大用戶來說無疑是個好消息。