背景 對于快手人而言,他們更愿意稱自己的公司為AI公司而非短視頻聚合平臺。對快手來講,是要構建一整套以AI技術為核心的基礎設施,能夠用科技的力量提升每一個人獨特的幸福感覺,能夠讓每一個人更多更好地感受這個世界,也能夠更好地被這個世界所感受到。快手基于用戶行為的AI特征分析會隨著用戶的深入使用變得越來越細致、越來越具體,而用戶則驚喜地發現,他們總是能夠刷到喜歡的短視頻,上傳的短視頻也能得到更多的點贊。這背后,是快手AI平臺對數十億視頻內容的深刻理解。內容理解,是快手在AI領域的核心技術之一,通過快速解析用戶上傳的短視頻內容,對內容的各個維度進行精確置化,從而衍伸出匹配、推薦、搜索、廣告投放、安全監控等一系列功能。事實上, AI平臺已成為快手實現各類酷炫功能時不可或缺的基礎平臺。針對快手的需求,引領AI領域計算平臺創新的英特爾為其提供了從產品到技術的全方位支撐。一方面,英特爾向快手提供了包括英特爾® 至強® 可擴展處理器在內的各類先進硬件產品,為快手AI平臺打造算力更為強勁的基礎設施。另一方面,為其導入英特爾® 數學核心函數庫 (Intel® Math Kernel Library,英特爾® MKL) 以及來自英特爾的高性能編譯器,來幫助快手進一步優化其AI算法。雙方的通力協作取得了良好效果,一系列測試與實際部署數據都表明,英特爾產品與技術的引入,無論是在圖像檢索、還是在語音識別能力上,都幫助快手AI平臺獲得了數倍的性能提升,這為快手業務的進一步拓展與用戶體驗的改善,提供了良好的技術助力。
快手AI平臺面臨的挑戰
良好用戶反饋的背后,是快手強大的技術支撐能力。從成立伊始,快手就積極組建AI團隊,推出智能推薦、人臉識別、自動美顏、視頻即時特效等功能,深得用戶青睞。隨著業務的高速增長,尤其當其日播放量已達百億次級,日上傳視頻量已達千萬條級時,快手的AI平臺也開始經受嚴峻的性能考驗, 亟需尋求更強勁的計算力和更優化的算法予以應對。構建強大高效的AI平臺井非易事。眾所周知,在深度學習等AI方法中,隨著數據處理量的增加,所需的計算力將呈幾何級數增長。早在2012年Google Brain*進行的一次測試中,為了利用深度神經網絡來識別視頻中的貓,系統共使用了 16,000個通用處理器。如今,快手的短視頻發布總量已達70億條,每天新增視頻達到千萬量級,其所面臨的計算量可想而知。因此,要應對這一挑戰,快手AI平臺需要做的是:配備更強的計算力,對AI算法進行更深入的優化。
英特爾® 至強® 可擴展處理器為快手AI平臺提供更強算力
無論是智能推薦,還是精準營銷,或者是智能鑒黃,短視頻應用背后的AI平臺,都需要對用戶上傳的視頻進行有效的分析和感知。圖像和語音是其中兩個核心維度。在圖像維度,通過圖像檢索技術,平臺可以實現內容特征庫的構建,并建立高效的特征庫索引;在語音維度,通過語音識別技術,平臺可以對人物的情緒、年齡等屬性進行精準分析。因此,圖像檢索和語音識別是目前快手AI平臺的兩大核心功能。K-Means*聚類算法是目前快手AI平臺重要的圖像檢索算法之一。通過對圖像內的信息進行向量轉化,再通過K-Means聚類算法計算聚類中心,從而快速得到索引。利用這一算法,快手AI平臺可以迅速將用戶上傳的視頻進行索引歸類,加入特征庫,并通過推薦系統向用戶推薦匹配度和相關性最高的視頻。可以說, AI平臺圖像檢索的處理速度,將直接影響快手多項用戶功能的使用體驗。實施K-Means聚類算法時, AI平臺需要執行大置的迭代計算。當需要處理的圖像數據集達到一定規模后,快手發現,其AI平臺在多線程計算處理上開始顯現出不足。為此,英特爾團隊一方面幫助快手對其算法進行優化,通過重構數據結構和完全矢量化的方法,使算法的數據處理效率得以提高。另一方面,英特爾為快手AI平臺提供的新一代英特爾® 至強® 可擴展處理器,也極大地提升了K-Means聚類算法的處理效率,擁有多達28個內核的英特爾® 至強® 可擴展處理器,可以輕松應對上文所述的多線程計算能力不足問題。同時,其全新的內核微架構,包括所有內核共用末級高速緩存 (Last Level Cache, LLC) 、 六內存通道以及多達48個PCIP通道等特性,也能有效地對K-Means聚類算法的優化內容予以支持,令其在處理海置圖像數據時獲得更優性能。在英特爾® 至強® 金牌6130處理器上進行的一頂圖像檢索對比測試中,基準測試組與優化測試組分別采用優化前后的K-Means聚類算法對10億張圖片進行圖像檢索處理。測試數據如圖 1 所示,經過優化的K-Means聚類算法,可使快手AI平臺的性能增至原有的2.22倍。
圖1. K-Means聚類算法用于圖片檢索處理的對比測試英特爾® MKL與高性能英特爾® 編譯器全方位優化釋放快手AI平臺潛能 針對海量視頻內容進行語音識別也是快手AI平臺的重要職責之一。目前,快手采用業界流行的Kaldi*語音識別工具箱來進行這一工作。而在Kaldi處理語音的各個環節中,有多處需要用到大量的矩陣計算。傳統上, Kaldi會調用其內置的BLAS*/LAPACK*模塊來執行這些計算,但實踐證明,這些模塊還有大量值得優化的空間。為幫助快手AI平臺進一步提升在語音識別上的工作效能,除引入新一代的英特爾® 至強® 可擴展處理器外,英特爾還為快手提供了英特爾® MKL與高性能編譯器兩頂“尖端武器”,前者包含了一系列經過深度優化、線程化和矢量化的數學函數,能夠最大化地發揮基于英特爾® 架構的處理器的性能潛力,同時其也能與Kaldi中的其它模塊相互兼容。來自英特爾的高性能編譯器自帶的大量高性能可用設置,也可與新一代英特爾® 至強® 可擴展處理器相互配合,為矩陣計算帶來更高的計算效率,從而大大提高語音識別在解碼等流程上的性能。為驗證優化后的效果,快手基于最新的英特爾® 至強® 金牌6148處理器對語音識別優化前后的性能進行了對比測試。 基準測試組采用了操作系統內置的GCC編譯器和Kaldi內置的BLAS/LAPACK模塊,而優化測試組采用了英特爾® MKL與高性能英特爾® 編譯器的組合,并根據快手在不同場景下語音識別需求,結合不同算法和數據集設計了 6種工作負載。測試數據如圖 2 所示,經過優化的語音識別,處理性能可提升至優化前的1.92倍到2.46倍不等。
圖2. 優化前后的語音識別對比測試更多部署方案,更大發展空間 快手的愿景,是以科技的力量提升每一個人獨特的幸福感。幫助用戶記錄自己的生活。讓每個人都有機會被世界看到,這些都離不開背后AI系統的支撐。通過對海量視頻、圖片和語音進行高速進理,快手實現了通過一個小小的應用,來拉近人與人之間的距離,提升用戶的幸福感。快手與英特爾的工程師們正攜起手來,以先進的產品與技術為這一愿景添磚加瓦。現在,快手已幵始引入英特爾® 至強® 金牌6130處理器作為其AI平臺的核心計算引擎,并逐漸引入性能更為強勁的英特爾® 至強® 金牌6148處理器。英特爾產品與技術的加入,尤其是新一代英特爾® 至強® 可擴展處理器的采用,幫助快手更好地實現了提升用戶幸福感這一目標。未來,雙方還計劃在AI基礎設施構建,軟件、算法優化等多個維度幵展更深層次的合作,以技術之“芯”,幫助人們記錄和分享在這個美好世界中的點點滴滴。
文章摘自英特爾精英匯
想購買及了解更多英特爾產品詳情,歡迎咨詢以下聯系方式!
寶通集團聯系方式
咨詢熱線:0755-88603572
寶通官網:www.btibt.com
客戶垂詢郵箱:cuifang.mo@ex-channel.com
客戶垂詢QQ:1627678462
地址:深圳市福田區深南大道1006號國際創新中心C座11樓
郵編:518026