米奇影院888奇米色99在线,丰满少妇一区二区三区,97久久五月丁香婷婷

當前位置： OFweek 智能制造網(wǎng) > 大數(shù)據(jù) > 正文

如何評測一個大數(shù)據(jù)系統(tǒng)

2018-12-04 06:27

來源：科多大數(shù)據(jù)

數(shù)據(jù)的爆炸式增長掀起了大數(shù)據(jù)的研究熱潮，越來越多的應用領(lǐng)域涉及到大數(shù)據(jù)的處理和存儲，其所蘊藏的科學價值和商業(yè)價值逐漸體現(xiàn)。為了挖掘大數(shù)據(jù)中隱藏的知識，各種大數(shù)據(jù)系統(tǒng)應運而生，例如Hadoop、MapReduce、Hive、Spark等。如何客觀地評價眾多的大數(shù)據(jù)系統(tǒng)以及從中選擇適合自身需求的系統(tǒng)成為學術(shù)界和工業(yè)界普遍關(guān)心的問題，大數(shù)據(jù)工業(yè)界和研究社區(qū)迫切需要一套公認的大數(shù)據(jù)評測基準。

Jim Gray認為：特定領(lǐng)域的評測基準應選擇典型應用，并滿足領(lǐng)域內(nèi)應用的多樣性。據(jù)此他進一步提出了一套成功的評測基準需要滿足的４個條件：系統(tǒng)相關(guān)性、可移植性、可擴展性和簡單。其中，系統(tǒng)相關(guān)性是指能夠評測領(lǐng)域相關(guān)的系統(tǒng)性能，包括系統(tǒng)的峰值性能，性價比等；可移植性是指評測基準能夠移植到不同的平臺上，易于在不同的系統(tǒng)和架構(gòu)上實現(xiàn)；可擴展性是指能夠適應不同的系統(tǒng)規(guī)模；簡單是指評測基準易于理解，評測結(jié)果具有可靠性。

參考Gray提出的４條標準，并結(jié)合大數(shù)據(jù)海量、高速、多樣的特性，我們提出了針對大數(shù)據(jù)領(lǐng)域的評測基準需要滿足的需求。

可代表性

大數(shù)據(jù)領(lǐng)域具有非常廣的覆蓋范圍，信息時代的來臨使得越來越多的應用領(lǐng)域涉及到大數(shù)據(jù)的處理和存儲，因此一個完整而全面的評測基準不可能一蹴而就。如何盡可能提高負載覆蓋度又不失評測的簡易性是很大的挑戰(zhàn)，這也就要求評測基準具有領(lǐng)域代表性。
我們認為大數(shù)據(jù)領(lǐng)域的代表性主要體現(xiàn)在３個方面：

①代表性負載。

眾所周知，目前應用領(lǐng)域極其繁多，領(lǐng)域之間有一定的共有特性，但每個領(lǐng)域有其獨特性，因此應用領(lǐng)域和負載的代表性在一定程度上也就決定了評測基準的代表性；

②代表性數(shù)據(jù)。

大數(shù)據(jù)領(lǐng)域與傳統(tǒng)數(shù)據(jù)庫等領(lǐng)域的一個顯著區(qū)別即是數(shù)據(jù)類型多元化，傳統(tǒng)的結(jié)構(gòu)化數(shù)據(jù)不再占據(jù)主導地位，半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)爆炸性增長，因此評測基準不能忽略復雜而多樣的數(shù)據(jù)類型；

③代表性軟件棧。

數(shù)據(jù)迅猛增長催生了眾多的大數(shù)據(jù)處理和存儲系統(tǒng)，然而不同的軟件棧對大數(shù)據(jù)負載的行為特征具有很大的影響，因此大數(shù)據(jù)評測基準需要涵蓋代表性軟件棧。

可移植性

大數(shù)據(jù)評測基準不僅需要能夠縱向地評測大數(shù)據(jù)系統(tǒng)，而且需要能夠?qū)Σ煌南到y(tǒng)進行橫向的對比。這就要求相同的負載能夠提供不同的實現(xiàn)方式，評測基準能夠便利地移植到其他平臺。為了使不同的實現(xiàn)方式具有公平的可比性，針對不同平臺的實現(xiàn)，需要具有相同的輸入和輸出，以及相同的算法處理邏輯。如今，一系列針對大數(shù)據(jù)處理和存儲的開源產(chǎn)品被發(fā)布，例如MapReduce、Spark等，所以在評測基準的實現(xiàn)過程中需要考慮基于這些不同的軟件棧的實現(xiàn)。

可擴展性

大數(shù)據(jù)評測基準需要提供可擴展的數(shù)據(jù)集和負載。大數(shù)據(jù)的一個顯著特征即是數(shù)據(jù)量大，單一節(jié)點的存儲已逐步轉(zhuǎn)變成分布式存儲，因此評測基準所提供的數(shù)據(jù)和負載需要適應不同規(guī)模的平臺。然而如今大多數(shù)的大數(shù)據(jù)持有者視數(shù)據(jù)為重要的商業(yè)機密，因而能夠提供符合真實數(shù)據(jù)特性的可擴展數(shù)據(jù)集是大數(shù)據(jù)評測基準重要而基本的需求。

可理解性

評測基準需要具有簡易性，易于理解，并易于部署和評測，同時評測結(jié)果能夠指導系統(tǒng)的評價、改進和優(yōu)化。然而，大數(shù)據(jù)系統(tǒng)本身非常復雜。僅僅從簡單性的角度來選擇典型負載，可能會使基準程序喪失代表性。因此，我們用可理解性來取代原有的簡單性需要�？衫斫庑杂校滁c含義：能從基本操作單元和負載模式的角度理解典型負載；評測結(jié)果需要簡單直觀，評測人員能夠根據(jù)負載的特性分析結(jié)果的合理性并判斷系統(tǒng)的瓶頸或者優(yōu)劣；評測結(jié)果需要具有穩(wěn)定性，其結(jié)果必須是可靠的并且可重現(xiàn)的。

大數(shù)據(jù)系統(tǒng)的蓬勃發(fā)展催生了大數(shù)據(jù)基準測試的研究，如何公正地評價不同的大數(shù)據(jù)系統(tǒng)以及怎樣根據(jù)需求選取合適的系統(tǒng)成為了熱點問題。大家在使用的過程中，不妨也動腦筋想一想，為什么選擇這些系統(tǒng)？按照評測的基準還有哪些系統(tǒng)也值得了解？這樣你的編程之旅才不容易迷茫。

本地收藏打印推薦給朋友

聲明： 本文由入駐維科號的作者撰寫，觀點僅代表作者本人，不代表OFweek立場。如有侵權(quán)或其他問題，請聯(lián)系舉報。

發(fā)表評論

共0條評論，0人參與

登錄登錄即可訪問所有OFweek服務(wù)

用戶名/郵箱/手機：
密碼：
忘記密碼？
用其他賬號登錄： QQ | 微信 | 新浪微博

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

暫無評論

暫無評論

圖片新聞

最新發(fā)布

最新活動更多

一周熱點月點擊榜

1 加速行業(yè)智能化——華為AI+制造行業(yè)峰會2025成功舉辦

企業(yè)服務(wù) 廣告服務(wù) 獵頭服務(wù) 薪酬報告

智能制造獵頭職位更多

文章糾錯

x

_*文字標題：

_*糾錯內(nèi)容：

聯(lián)系郵箱：

_*驗證碼：

看不清，點擊換一張

粵公網(wǎng)安備 44030502002758號

感谢您访问我们的网站，您可能还对以下资源感兴趣：

精品剧情v国产在线观看

精品一区二区三区在线观看视频肉体奉公hd中文字幕看片在线男女h视频