亚洲av伊人久久青青草原-奇米777四色影视在线看-欧美牲交a欧美牲交aⅴ免费下载-国产超碰人人爽人人做-久久精品午夜一区二区福利

新聞 動態 ·
News Center
關注我們 關注前沿

構建高性能視頻云服務--英特爾新型SIMD AVX-512技術

發表日期:2018-07-05        文章編輯:         閱讀次數:

 1. 內容簡介
現如今,各種大小視頻異軍突起。面對如此龐大的視頻容量和存儲,如何高效精準地對視頻等新媒體進行云端處理,這既是視頻開發人員的責任,也是云服務商的責任。云服務提供商 (Cloud Service Providers) 從視頻處理、分析、搜索以及流媒體處理的性能方面出發,旨在提升媒體云計算的應用和服務。在流媒體中,視頻和圖像處理會占用大量計算和存儲資源。本文在基于英特爾® 至強® 可擴展平臺的新技術上,介紹了新型 SIMD(單一指令多數據流) AVX-512 指令集,并闡述了該指令集是如何幫助提升視頻、圖像處理以及視頻深度學習應用等各方面的性能。
2. 背景
SIMD向量化技術已經在 x86 處理器上得到了廣泛支持,在數代不同的 x86 平臺上從 MMX、 SSE、 AVX、 AVX2 演進到了 AVX-512指令集。
快速增長的媒體云計算應用和服務給云服務提供商提供了各種機遇。如圖1所示的思科流量預測數據,到 2020 年,全球視頻流量將占到互聯網用戶消費流量總量的 82%。層出不窮的新興媒體云計算應用,例如視頻轉碼、視頻分析等,隨著4K/8K 視頻格式而逐漸興起,并將趨向成熟,但這對視頻處理能力提出了更高的要求,同時也對更多的存儲和網絡帶寬資源能力也給予一定的厚望,這就要求媒體云不斷地提升計算性能。

圖1 思科VNI: 全球IP流量預測
3. 利用AVX-512提升媒體云計算性能
在基礎的媒體云計算模塊中,處理好視頻轉碼、編輯、特征抽取和分析等環節都需要消耗大部分計算資源,特別是在視頻轉碼方面,并且視頻轉碼也是進行其他進一步處理和分析的基礎。優化這些計算密集型運算,英特爾的 SIMD(單指令多數據流)向量化技術關鍵性地解決掉了這個問題。隨著英特爾架構平臺的演進和代代升級,全新英特爾®至強®可擴展處理器已經成功集成了 AVX-512 技術, 本文簡單介紹了AVX-512 這一新技術為媒體云計算客戶提供的以下優勢:
a.提供高效視頻處理解決方案。基礎視頻編碼和轉碼性能將提升 2到 4倍,顯著提升媒體處理集群的計算能力。
b. 提供各種高性能圖像處理解決方案。有效減小在線圖像處理延遲和帶寬問題。
c. 提高深度學習算法的性能,幫助消除新興云服務提供商應用程序的性能瓶頸。
3.1 傳統視頻處理程序的性能提升
離線視頻轉碼應用程序屬于典型的 CPU 和內存密集型的應用,通過SIMD 向量化技術可優化其最耗時的核心代碼。目前部分函數可以被編譯程序自動優化為使用SIMD向量化技術,或者通過調用高性能的API來優化,如果前面兩種方式都不可用,那么就需要分析代碼并根據開發手冊和相關文檔用 SIMD 的向量化指令手動重寫。我們手動重寫以下四個函數x264_pixel_satd_8x4、x264_pixel_satd_8x8、x264_pixel_satd_8x16、x264_pixel_satd_16x16。
為了測試 SIMD 向量化實現的性能,我們使用 rand()% 10 隨機生成兩個像素矩陣中的元素的實驗對比結果,得到如表一所示的實驗結果。
表 1. SSE、 AVX2 和 AVX512 實現結果
從表1 中我們可以看到,與初始相比,最優的 SIMD向量化實現方案獲得了3 倍到 5倍的性能加速。
3.2 提升HEVC/H.265 程序性能
視頻云服務提供商可利用HEVC/H.265技術幫助以較小的帶寬提供高質量視頻, 并進一步支持 4k和 8k 的超高分辨率視頻服務。這里,我們使用 rand()%40 - rand()%40 隨機生成源矩陣,測試結果如表 2所示。
表 2. SSE、 AVX2 和 AVX512 DCT 實現結果
從表2中我們可以看到,對于 4x4/8x8/32x32/ 數據集, AVX-512 代碼是最高效的選擇,能夠分別比初始代碼提供 44.46%、70.45% 和 37.60% 的性能提升。 因此, 在具體的視頻處理應用中, 需要綜合考慮每種 SIMD 指令集的執行效率和性能,然后選擇最高效的一種進行優化。
3.3提升圖像處理程序性能

圖 2.在英特爾® 至強® 可擴展 平臺上使用 SIMD 提升圖像縮放性能
圖 2 是使用 IPP 圖像縮放 API 來優化初始的 GraphicsMagick 函數的結果。在這 5 種標準圖像的縮放加速4 倍以上,而 AVX-512 也比 AVX2 要高出 20% 以上。
3.4加速視頻和圖像深度學習程序
我們以 caffe 的評分和訓練程序為例,測試AVX-512對英特爾® 數學函數庫(英特爾® MKL)的優化效果。如圖3和圖4所示,在英特爾® 至強® 可擴展平臺上,AVX-512 指令可比AVX2 提供高 10% 到 40%的性能。

圖 3. Caffe 評分應用程序通過 SIMD 實現的性能提升
圖 4. Caffe 應用程序通過 SIMD 向量化實現的性能提升
4.總結
本文簡單闡述了英特爾® 至強®可擴展平臺上的全新 AVX-512 技術和指令集,演示了如何利用它來優化媒體云應用程序。

文章摘自英特爾精英匯

歡迎聯系寶通集團咨詢英特爾產品信息

寶通集團聯系方式

咨詢熱線:0755-88603572

寶通官網:www.btibt.com
客戶垂詢郵箱:cuifang.mo@ex-channel.com

客戶垂詢QQ1627678462

地址:深圳市福田區深南大道1006號國際創新中心C11
郵編:518026

電話:0755-82964380
郵件:Customer@ex-channel.com
地址:深圳市福田區深南大道1006號國際創新中心C座10樓

  • 官方微信

  • 官方微博
  • 服務熱線

    0755-83647532

    微信服務號

    [!--page.stats—] 主站蜘蛛池模板: 色妞ww精品视频7777| 好男人www免费高清视频在线观看| 精品乱人伦一区二区三区| 久久午夜无码鲁丝片| 欧美成人在线视频| 午夜网站在线观看免费完整高清观看 | 大香伊蕉在人线国产最新75| 国产精品女同一区二区| 久久综合给合久久狠狠狠97色 | 国产精品无套内射迪丽热巴| 国产综合久久久久久鬼色| 亚洲色欲色欲www在线播放| 无码人妻久久一区二区三区免费丨| 国产精品自产拍在线观看花钱看| 日本丰满熟妇hd| 中国凸偷窥xxxx自由视频妇科| 偷偷色噜狠狠狠狠的777米奇| 国产在视频线精品视频| 国产精品欧美福利久久| 亚洲av人无码激艳猛片| 无码国内精品久久人妻蜜桃| 美女把尿口扒开让男人桶| 亚洲欧洲无卡二区视頻| 国产亚洲色视频在线| 97av麻豆蜜桃一区二区| 国产乱人伦av麻豆网| 护士被强女千到高潮视频| 亚洲爆乳www无码专区| 国产女人被狂躁到高潮小说| 国产激情一区二区三区| 免费人成视频在线播放| 激情第一区仑乱| 亚洲成a人v欧美综合天堂下载 | 亚洲熟妇久久国内精品| 青草青草久热精品视频在线观看 | 性一交一乱一伦在线播放| 久久精品无码专区免费青青 | 日韩精品人成在线播放| 亚洲av成人精品日韩一区| 又大又黄又粗高潮免费| 激情综合色综合久久综合|