何必另起爐灶？英特爾讓AI公有云服務構建走“捷徑”

發表日期：2018-12-03 文章編輯：閱讀次數：

人工智能（AI）真火，火到全球70%的企業，都希望在2018年實施AI應用[1]；AI也真難，難到91%的企業預計會在采用AI的過程中遇到重大障礙[2]。

這種冰與火般的矛盾，根源就在于AI太新，新到如Tara Data所說的那樣：企業用戶還普遍缺乏相關的IT基礎設施，以及專業的人才和知識積累[3]。

用戶欠缺的，正是公有云所具備的——背靠互聯網開源社區生生不息的創新活力，及其在AI算法研發上的先發優勢，坐擁大規模或超大規模的數據中心以及用戶多年積累的海量數據；調動麾下久經考驗的基礎設施運維、應用和服務開發人才，領先的云服務提供商們正忙著打磨自己的AI云服務。

不過，即使是實力較強的云服務提供商，這種打磨也不是一帆風順的。AI的三要素——數據、算法和算力中，數據和算法無須太多擔憂，但算力，也就是AI云服務所需的基礎設施，卻讓人煞費思量。畢竟，目前用于AI的硬件包括了通用的CPU，還有專用的GPGPU和FPGA及ASIC，架構不一，很容易讓人挑花眼。

那么，有沒有什么策略或者方法，能幫助云服務提供商更便捷地選擇和構建AI云服務呢？

當然有！那就是要充分利用好他們既有的基礎設施，即基于英特爾架構處理器的云基礎設施！

原因如下：
首先，不論是全球還是在中國，不論是眼前還是長期，AI云服務的主要目標受眾，多數是希望采用AI既有創新成果，而非推動AI技術演進的普通企業，這些企業使用AI，目標也主要是將智能技術引入到他們現有業務數據處理和分析的流程和工具鏈條中，來實現更高級的、預測型的分析。

這種應用，多是推理型的應用，也多基于機器學習而非深度學習技術，畢竟，智能化數據分析的輸出，要做到透明化和可解釋才有意義。

而這種情況，也就決定了云服務提供商面向這些用戶打造AI云服務時，完全不必改弦更張、更起爐灶。

畢竟目前的公有云服務，包括數據存儲、處理和分析類服務，多是構建在英特爾架構基礎設施上，因此將AI云服務構建在同一平臺上，復用其資源，并與既有的數據處理工具對接的做法，與另尋其他架構來搭臺，且需要將海量數據在導構平臺間移動的做法相比，無疑用時更短、技術門檻、風險和成本也更低。

此外，保持基礎設施的同質，或同構性，也能大大減少云服務提供商在系統管理、維護和保障上投入的工作量。

省時省力省錢是一方面，性能輸出上，基于英特爾至強處理器的基礎設施，也不輸專有架構平臺，尤其是在優化之后。

UCloud的AI在線服務就是例證，它的算力主要源自既有基礎設施中常處于閑置狀態的至強E5處理器AVX處理單元，在搭配面向英特爾架構優化的Caffe框架后，整體執行性能提高了10倍以上。

在人臉表情識別的測試中，在有并發的前提下，其性能也可媲美，甚至是超越專有架構平臺[4]。

而今，全新的英特爾至強可擴展處理器，憑借全新的微架構、進一步增強的硬件特性，特別AVX512技術，為那些打算利用既有基礎設施架構構建AI云服務的服務商帶來了更大的福音：

在導入了針對英特爾架構優化的框架和軟件工具后，其推理性能可比上一代平臺實現最高超百倍的提升[5]！

來自科大訊飛AI開放平臺的實踐也證明：該處理器可提供在高性能工作負載下的高可擴展性和可靠性，適用于深度學習中的復雜神經網絡快速推理[6]。