亚洲av伊人久久青青草原-奇米777四色影视在线看-欧美牲交a欧美牲交aⅴ免费下载-国产超碰人人爽人人做-久久精品午夜一区二区福利

新聞 動態 ·
News Center
關注我們 關注前沿

優化 Apache Spark 以提升工作負載吞吐量

發表日期:2019-02-21        文章編輯:         閱讀次數:

Apache Spark作為一種常見的數據處理引擎,可用于對超大數據集進行高級分析。Spark采用了一個通用的集群計算框架,能夠獲取和處理實時的超大數據流,即時處理和分析事件和異常情況,從而支持企業快速制定決策,更好地響應用戶需求。

 

Spark作為類Hadoop Map Reduce的通用并行框架,擁有Hapdoop Map Reduce所具有的優點。目前,大多數Hadoop發行版中都包含了Spark。但是由于Spark本身的兩大優勢,使Spark在處理大數據時已經成為首選框架,超越了Hadoop 引入MapReduce范例。

 

簡單比較一下Spark和Hadoop的區別。

從以上對比我們可以發現,Spark的數據存儲受到限制。

 

為了使Spark能夠在運行不同工作負載(例如機器學習應用)時實現卓越性能,Spark內置了內存數據存儲功能。因此,Spark的性能要明顯優于其他大數據處理技術。但是,Spark內存功能受到服務器中可用內存的限制;受此影響,執行 Spark作業期間經常出現系統內存已經飽和,但計算資源卻處于閑置狀態的情況。要消除這種限制,一種辦法為在節點集群上運行Spark的分布式架構,以充分利用所有節點中的可用內存。雖然采用更多節點可以解決服務器DRAM容量問題,但會增加成本。因為DRAM不僅成本高昂,而且還要求各企業配置額外的服務器以獲得更多內存。

 

英特爾® IMDT助力Spark擴展系統內存

 
 

英特爾® IMDT(Intel® Memory Drive Technology)是一種軟件定義內存(SDM)技術,與英特爾® 傲騰™ 固態盤相結合使用時,可有效擴展系統內存。這種英特爾® 傲騰™ 固態盤與英特爾® IMDT的結合,可以透明地為操作系統和Spark 作業提供更多內存,消除Spark應用所固有的內存限制。為了演示此功能,英特爾使用了一種當前名為TeraSort的 Spark性能指標評測程序。 該程序測試得出的初始數值顯示,英特爾® IMDT能夠有效提升資源利用率,改進系統性能。

 

Spark TeraSort性能指標評測

 
 

TeraSort是一種常見的性能指標評測程序,用于測量在特定計算機系統上對1TB隨機分布數據進行排序所需的時間。它最初是一種用于測量 Apache Hadoop集群的 MapReduce性能的常用方法,并且有一些用于Spark的變體。在數據處理中,傳入的數據必須先排序才能進行分析或處理,因此排序性能至關重要。而這也說明了該性能指標評測套件如此流行的原因所在。

 

 
 
 

系統配置

 
 
 

表1列出了測試的三個不同場景的系統配置。這三種配置包括:基準DRAM配置;基準配置加英特爾® IMDT,以增加內存容量;以及與僅增加DRAM的比較。

表 1:比較配置

 
 
 

測試方法

 
 
 

圖1展示了軟件堆棧的構成。Spark驅動器和執行器是JVM(Java虛擬機)進程。Spark執行器使用的內核和內存均可配置;在這些測試中,Spark驅動器的內存為7.5GB,Spark執行器的內存為21GB。

圖 1:軟件堆棧

 

Spark執行器進程包含兩個部分:用戶提交‘spark作業’和驅動器向執行器分配‘任務’,如圖2所示。

圖 2:Spark 執行器進程

 

在Spark TeraSort性能指標評測的實驗中,實驗的排序數據共有4種大小:100GB、250GB、500GB和1TB。使用表1中給出的3種不同場景(128G DRAM、使用英特爾® IMDT的DRAM擴展和增加DRAM容量)的系統配置,在這4種排序數據(100GB、250GB、500GB和1TB)的上使用不同數量的執行器(4個執行器、8個執行器和8個執行器)來進行實驗測評。執行器的數量與場景一一對應。

圖 3:性能指標評測結果

 

這一內存擴展方法可通過使用英特爾® IMDT顯著加大系統內存,同時通過運行更多的Spark執行器,充分利用系統計算容量。該性能指標評測程序表明,在具有相同內存和計算能力的系統上,通過添加英特爾® IMDT軟件,可以將 Spark作業吞吐量提高一倍。相對于使用英特爾® IMDT,另一種方法是為系統添加更多DRAM。如圖3的性能指標評測結果所示,添加更多DRAM只能略微提高性能,但成本卻要顯著高于英特爾® IMDT。

 

測試表明,通過在運行基于Spark的TeraSort工作負載的單個服務器節點上,使用英特爾® IMDT添加兩塊英特爾® 傲騰™ 固態盤DC P4800X,吞吐量提高了一倍,同時運行時間縮短了多達40%。而在向系統添加更多DRAM的方案中,性能相比于IMDT的方案略有提高。然而,要實現這一不到6%的性能提升,成本需要增加大約50%。

 

相比之下,英特爾® IMDT軟件憑借更低的成本(在本文的比較中,成本大約是DRAM成本的一半),以及所能實現的更高容量(英特爾® IMDT可在雙路節點中添加1280-3200GB的系統內存),在總體擁有成本方面明顯具有更高的優勢。

文章摘自英特爾精英匯

 

想購買及了解更多英特爾產品詳情,歡迎咨詢以下聯系方式!

寶通集團聯系方式

咨詢熱線:0755-88603572

寶通官網:www.btibt.com
客戶垂詢郵箱:cuifang.mo@ex-channel.com

客戶垂詢QQ1627678462

地址:深圳市福田區深南大道1006號國際創新中心C11

郵編:518026

電話:0755-82964380
郵件:Customer@ex-channel.com
地址:深圳市福田區深南大道1006號國際創新中心C座10樓

  • 官方微信

  • 官方微博
  • 服務熱線

    0755-83647532

    微信服務號

    [!--page.stats—] 主站蜘蛛池模板: 美女内射毛片在线看3d| 国产麻豆md传媒视频| 国产一区二区三区久久精品| 国产freesexvideos中国麻豆| 天天操夜夜操| 久久天天躁夜夜躁狠狠| 人妻精品久久久久中文字幕69| 午夜a级理论片在线播放琪琪 | 国产av无码专区亚洲av琪琪| 久久亚洲精品成人无码网站| 亚洲视频在线观看| 老汉色av影院| 亚洲精品无码久久| 色视频www在线播放国产人成| 国产午夜无码视频在线观看| 日本一区二区三区免费播放| 东北少妇不戴套对白第一次| 亚洲av无码一区二区三区在线| 国语自产少妇精品视频| 日本xxxx色视频在线观看| 蜜桃日本免费观看mv| 国产av熟女一区二区三区| 国产精品福利一区二区久久| 久久久久亚洲精品男人的天堂| 竹菊影视欧美日韩一区二区三区四区五区| 日韩一卡2卡3卡4卡2021免费观看国色天香 | 午夜家庭影院| 日本三级理论久久人妻电影| 欧美牲交videossexeso欧美| 国产精品久久久亚洲| 国产午夜人做人免费视频| 国产欧美日韩综合精品一区二区| 亚洲av成本人无码网站| 国内精品久久久久影院优| 香港日本三级亚洲三级| 无码性午夜视频在线观看| 亚洲国产欧美在线人成| 92国产精品午夜福利| 日本老熟妇xxxxx| s级爆乳玩具酱国产vip皮裤| 亚洲中文字幕精品久久久久久直播|