1. 內容簡介
現如今,各種大小視頻異軍突起。面對如此龐大的視頻容量和存儲,如何高效精準地對視頻等新媒體進行云端處理,這既是視頻開發人員的責任,也是云服務商的責任。云服務提供商 (Cloud Service Providers) 從視頻處理、分析、搜索以及流媒體處理的性能方面出發,旨在提升媒體云計算的應用和服務。在流媒體中,視頻和圖像處理會占用大量計算和存儲資源。本文在基于英特爾® 至強® 可擴展平臺的新技術上,介紹了新型 SIMD(單一指令多數據流) AVX-512 指令集,并闡述了該指令集是如何幫助提升視頻、圖像處理以及視頻深度學習應用等各方面的性能。
2. 背景
SIMD向量化技術已經在 x86 處理器上得到了廣泛支持,在數代不同的 x86 平臺上從 MMX、 SSE、 AVX、 AVX2 演進到了 AVX-512指令集。快速增長的媒體云計算應用和服務給云服務提供商提供了各種機遇。如圖1所示的思科流量預測數據,到 2020 年,全球視頻流量將占到互聯網用戶消費流量總量的 82%。層出不窮的新興媒體云計算應用,例如視頻轉碼、視頻分析等,隨著4K/8K 視頻格式而逐漸興起,并將趨向成熟,但這對視頻處理能力提出了更高的要求,同時也對更多的存儲和網絡帶寬資源能力也給予一定的厚望,這就要求媒體云不斷地提升計算性能。
圖1 思科VNI: 全球IP流量預測
3. 利用AVX-512提升媒體云計算性能
在基礎的媒體云計算模塊中,處理好視頻轉碼、編輯、特征抽取和分析等環節都需要消耗大部分計算資源,特別是在視頻轉碼方面,并且視頻轉碼也是進行其他進一步處理和分析的基礎。優化這些計算密集型運算,英特爾的 SIMD(單指令多數據流)向量化技術關鍵性地解決掉了這個問題。隨著英特爾架構平臺的演進和代代升級,全新英特爾®至強®可擴展處理器已經成功集成了 AVX-512 技術, 本文簡單介紹了AVX-512 這一新技術為媒體云計算客戶提供的以下優勢:a.提供高效視頻處理解決方案。基礎視頻編碼和轉碼性能將提升 2到 4倍,顯著提升媒體處理集群的計算能力。b. 提供各種高性能圖像處理解決方案。有效減小在線圖像處理延遲和帶寬問題。c. 提高深度學習算法的性能,幫助消除新興云服務提供商應用程序的性能瓶頸。3.1 傳統視頻處理程序的性能提升離線視頻轉碼應用程序屬于典型的 CPU 和內存密集型的應用,通過SIMD 向量化技術可優化其最耗時的核心代碼。目前部分函數可以被編譯程序自動優化為使用SIMD向量化技術,或者通過調用高性能的API來優化,如果前面兩種方式都不可用,那么就需要分析代碼并根據開發手冊和相關文檔用 SIMD 的向量化指令手動重寫。我們手動重寫以下四個函數x264_pixel_satd_8x4、x264_pixel_satd_8x8、x264_pixel_satd_8x16、x264_pixel_satd_16x16。為了測試 SIMD 向量化實現的性能,我們使用 rand()% 10 隨機生成兩個像素矩陣中的元素的實驗對比結果,得到如表一所示的實驗結果。
表 1. SSE、 AVX2 和 AVX512 實現結果 從表1 中我們可以看到,與初始相比,最優的 SIMD向量化實現方案獲得了3 倍到 5倍的性能加速。3.2 提升HEVC/H.265 程序性能視頻云服務提供商可利用HEVC/H.265技術幫助以較小的帶寬提供高質量視頻, 并進一步支持 4k和 8k 的超高分辨率視頻服務。這里,我們使用 rand()%40 - rand()%40 隨機生成源矩陣,測試結果如表 2所示。
表 2. SSE、 AVX2 和 AVX512 DCT 實現結果 從表2中我們可以看到,對于 4x4/8x8/32x32/ 數據集, AVX-512 代碼是最高效的選擇,能夠分別比初始代碼提供 44.46%、70.45% 和 37.60% 的性能提升。 因此, 在具體的視頻處理應用中, 需要綜合考慮每種 SIMD 指令集的執行效率和性能,然后選擇最高效的一種進行優化。3.3提升圖像處理程序性能
圖 2.在英特爾® 至強® 可擴展 平臺上使用 SIMD 提升圖像縮放性能 圖 2 是使用 IPP 圖像縮放 API 來優化初始的 GraphicsMagick 函數的結果。在這 5 種標準圖像的縮放加速4 倍以上,而 AVX-512 也比 AVX2 要高出 20% 以上。3.4加速視頻和圖像深度學習程序我們以 caffe 的評分和訓練程序為例,測試AVX-512對英特爾® 數學函數庫(英特爾® MKL)的優化效果。如圖3和圖4所示,在英特爾® 至強® 可擴展平臺上,AVX-512 指令可比AVX2 提供高 10% 到 40%的性能。
圖 3. Caffe 評分應用程序通過 SIMD 實現的性能提升
圖 4. Caffe 應用程序通過 SIMD 向量化實現的性能提升
4.總結
本文簡單闡述了英特爾® 至強®可擴展平臺上的全新 AVX-512 技術和指令集,演示了如何利用它來優化媒體云應用程序。
文章摘自英特爾精英匯
歡迎聯系寶通集團咨詢英特爾產品信息
寶通集團聯系方式
咨詢熱線:0755-88603572
寶通官網:www.btibt.com
客戶垂詢郵箱:cuifang.mo@ex-channel.com
客戶垂詢QQ:1627678462
地址:深圳市福田區深南大道1006號國際創新中心C座11樓
郵編:518026