亚洲av伊人久久青青草原-奇米777四色影视在线看-欧美牲交a欧美牲交aⅴ免费下载-国产超碰人人爽人人做-久久精品午夜一区二区福利

新聞 動態 ·
News Center
關注我們 關注前沿

構建高性能視頻云服務--英特爾新型SIMD AVX-512技術

發表日期:2018-07-05        文章編輯:         閱讀次數:

 1. 內容簡介
現如今,各種大小視頻異軍突起。面對如此龐大的視頻容量和存儲,如何高效精準地對視頻等新媒體進行云端處理,這既是視頻開發人員的責任,也是云服務商的責任。云服務提供商 (Cloud Service Providers) 從視頻處理、分析、搜索以及流媒體處理的性能方面出發,旨在提升媒體云計算的應用和服務。在流媒體中,視頻和圖像處理會占用大量計算和存儲資源。本文在基于英特爾® 至強® 可擴展平臺的新技術上,介紹了新型 SIMD(單一指令多數據流) AVX-512 指令集,并闡述了該指令集是如何幫助提升視頻、圖像處理以及視頻深度學習應用等各方面的性能。
2. 背景
SIMD向量化技術已經在 x86 處理器上得到了廣泛支持,在數代不同的 x86 平臺上從 MMX、 SSE、 AVX、 AVX2 演進到了 AVX-512指令集。
快速增長的媒體云計算應用和服務給云服務提供商提供了各種機遇。如圖1所示的思科流量預測數據,到 2020 年,全球視頻流量將占到互聯網用戶消費流量總量的 82%。層出不窮的新興媒體云計算應用,例如視頻轉碼、視頻分析等,隨著4K/8K 視頻格式而逐漸興起,并將趨向成熟,但這對視頻處理能力提出了更高的要求,同時也對更多的存儲和網絡帶寬資源能力也給予一定的厚望,這就要求媒體云不斷地提升計算性能。

圖1 思科VNI: 全球IP流量預測
3. 利用AVX-512提升媒體云計算性能
在基礎的媒體云計算模塊中,處理好視頻轉碼、編輯、特征抽取和分析等環節都需要消耗大部分計算資源,特別是在視頻轉碼方面,并且視頻轉碼也是進行其他進一步處理和分析的基礎。優化這些計算密集型運算,英特爾的 SIMD(單指令多數據流)向量化技術關鍵性地解決掉了這個問題。隨著英特爾架構平臺的演進和代代升級,全新英特爾®至強®可擴展處理器已經成功集成了 AVX-512 技術, 本文簡單介紹了AVX-512 這一新技術為媒體云計算客戶提供的以下優勢:
a.提供高效視頻處理解決方案。基礎視頻編碼和轉碼性能將提升 2到 4倍,顯著提升媒體處理集群的計算能力。
b. 提供各種高性能圖像處理解決方案。有效減小在線圖像處理延遲和帶寬問題。
c. 提高深度學習算法的性能,幫助消除新興云服務提供商應用程序的性能瓶頸。
3.1 傳統視頻處理程序的性能提升
離線視頻轉碼應用程序屬于典型的 CPU 和內存密集型的應用,通過SIMD 向量化技術可優化其最耗時的核心代碼。目前部分函數可以被編譯程序自動優化為使用SIMD向量化技術,或者通過調用高性能的API來優化,如果前面兩種方式都不可用,那么就需要分析代碼并根據開發手冊和相關文檔用 SIMD 的向量化指令手動重寫。我們手動重寫以下四個函數x264_pixel_satd_8x4、x264_pixel_satd_8x8、x264_pixel_satd_8x16、x264_pixel_satd_16x16。
為了測試 SIMD 向量化實現的性能,我們使用 rand()% 10 隨機生成兩個像素矩陣中的元素的實驗對比結果,得到如表一所示的實驗結果。
表 1. SSE、 AVX2 和 AVX512 實現結果
從表1 中我們可以看到,與初始相比,最優的 SIMD向量化實現方案獲得了3 倍到 5倍的性能加速。
3.2 提升HEVC/H.265 程序性能
視頻云服務提供商可利用HEVC/H.265技術幫助以較小的帶寬提供高質量視頻, 并進一步支持 4k和 8k 的超高分辨率視頻服務。這里,我們使用 rand()%40 - rand()%40 隨機生成源矩陣,測試結果如表 2所示。
表 2. SSE、 AVX2 和 AVX512 DCT 實現結果
從表2中我們可以看到,對于 4x4/8x8/32x32/ 數據集, AVX-512 代碼是最高效的選擇,能夠分別比初始代碼提供 44.46%、70.45% 和 37.60% 的性能提升。 因此, 在具體的視頻處理應用中, 需要綜合考慮每種 SIMD 指令集的執行效率和性能,然后選擇最高效的一種進行優化。
3.3提升圖像處理程序性能

圖 2.在英特爾® 至強® 可擴展 平臺上使用 SIMD 提升圖像縮放性能
圖 2 是使用 IPP 圖像縮放 API 來優化初始的 GraphicsMagick 函數的結果。在這 5 種標準圖像的縮放加速4 倍以上,而 AVX-512 也比 AVX2 要高出 20% 以上。
3.4加速視頻和圖像深度學習程序
我們以 caffe 的評分和訓練程序為例,測試AVX-512對英特爾® 數學函數庫(英特爾® MKL)的優化效果。如圖3和圖4所示,在英特爾® 至強® 可擴展平臺上,AVX-512 指令可比AVX2 提供高 10% 到 40%的性能。

圖 3. Caffe 評分應用程序通過 SIMD 實現的性能提升
圖 4. Caffe 應用程序通過 SIMD 向量化實現的性能提升
4.總結
本文簡單闡述了英特爾® 至強®可擴展平臺上的全新 AVX-512 技術和指令集,演示了如何利用它來優化媒體云應用程序。

文章摘自英特爾精英匯

歡迎聯系寶通集團咨詢英特爾產品信息

寶通集團聯系方式

咨詢熱線:0755-88603572

寶通官網:www.btibt.com
客戶垂詢郵箱:cuifang.mo@ex-channel.com

客戶垂詢QQ1627678462

地址:深圳市福田區深南大道1006號國際創新中心C11
郵編:518026

電話:0755-82964380
郵件:Customer@ex-channel.com
地址:深圳市福田區深南大道1006號國際創新中心C座10樓

  • 官方微信

  • 官方微博
  • 服務熱線

    0755-83647532

    微信服務號

    [!--page.stats—] 主站蜘蛛池模板: 粗大的内捧猛烈进出视频| 国产精品va无码二区| 精品国产午夜理论片不卡| y111111少妇影院无码| 亚洲av无码专区首页| 国产精品青青在线观看爽香蕉| 夜夜躁狠狠躁日日躁| 久久精品国产亚洲av成人| 99精品国产高清一区二区麻豆| 亚洲日韩精品无码av海量| 成人午夜亚洲精品无码网站| 好爽毛片一区二区三区四| 精品不卡一区二区| 久久夜色精品国产噜噜| 日本特黄特色特爽大片| 国产美女自慰在线观看| 精品乱码久久久久久久| 国产精品无圣光一区二区| 亚洲av日韩av欧v在线天堂| 国产成人av一区二区三区| 亚洲一区二区三区av天堂| 99久久精品免费看国产| 国产伦理一区二区| 国产成人精品日本亚洲11| 午夜爽爽爽男女污污污网站| 性高朝久久久久久久| 国产高清在线a视频大全| 欧洲成人午夜精品无码区久久| 中文字幕日本人妻久久久免费| 国产精品久久久久久超碰| 色先锋av资源中文字幕| 欧洲熟妇色 欧美| 亚洲成在人线视av| 桃花影院理论片在线| 国产男小鲜肉同志免费| 粗长挺进新婚人妻小怡| 97se亚洲国产综合自在线| 无码国产精品一区二区免费式影视 | 国产粗话肉麻对白在线播放 | 国产良妇出轨视频在线观看| 国产青榴视频在线观看|