軟硬件解耦的分布式存儲(chǔ)在性能設(shè)計(jì)上存在兩大天然缺陷:標(biāo)準(zhǔn)服務(wù)器不具備機(jī)房突然斷電時(shí)保護(hù)內(nèi)存數(shù)據(jù)的電池(BBU),所以只能用SSD卡/盤來做數(shù)據(jù)緩存。SSD的時(shí)延遠(yuǎn)高于內(nèi)存,導(dǎo)致業(yè)界絕大多數(shù)的軟硬解耦的分布式存儲(chǔ)時(shí)延無法和生產(chǎn)存儲(chǔ)媲美。單獨(dú)采購的分布式存儲(chǔ)軟件無法和第三方服務(wù)器的SSD盤緊密配合,從而無法像業(yè)界先進(jìn)的全閃存存儲(chǔ)一樣實(shí)現(xiàn)全局垃圾回收,控制數(shù)量眾多的SSD盤各自的垃圾回收導(dǎo)致的生產(chǎn)應(yīng)用時(shí)延波動(dòng)。軟硬件一體的分布式存儲(chǔ)有機(jī)會(huì)克服如上兩大缺陷。我們看到業(yè)界先進(jìn)的分布式存儲(chǔ)產(chǎn)品,采用了類似于全閃存存儲(chǔ)的電池保護(hù)(BBU)、系統(tǒng)級(jí)全局垃圾回收,達(dá)到了媲美傳統(tǒng)生產(chǎn)存儲(chǔ)的高并發(fā)壓力下...
從技術(shù)的角度,分布式存儲(chǔ)的發(fā)力點(diǎn)在大規(guī)模的擴(kuò)展性,基于此逐步優(yōu)化性能、可靠性,讓海量數(shù)據(jù)存得下、用得起;集中式存儲(chǔ)的技術(shù)方向在于保持穩(wěn)定性的基礎(chǔ)上,利用更快的介質(zhì)、更低時(shí)延的網(wǎng)絡(luò)為核xin業(yè)務(wù)提供加速,讓業(yè)務(wù)更穩(wěn)、效率更高。因此,從技術(shù)方向上來看,二者也是各有側(cè)重的。云和分布式存儲(chǔ)一樣,這些年正在大行其道、炙手可熱。CloudFirst、AllinCloud、CloudNative等概念風(fēng)靡業(yè)界,CIO見面不提云貌似都不好意思打招呼。早期人們也習(xí)慣把分布式存儲(chǔ)叫做“云存儲(chǔ)”,那么分布式存儲(chǔ)和云是什么關(guān)系?筆者認(rèn)為,分布式存儲(chǔ)是一種技術(shù)架構(gòu),而云是一種商業(yè)模式。分布式存儲(chǔ)可以被用作各...
分布式存儲(chǔ)系統(tǒng)中還可能使用基于寫多個(gè)存儲(chǔ)節(jié)點(diǎn)的復(fù)制協(xié)議(Replicated-writeprotocol)。比如Dynamo系統(tǒng)中的NWR復(fù)制協(xié)議,其中,N為副本數(shù)量,W為寫操作的副本數(shù),R為讀操作的副本數(shù)。NWR協(xié)議中多個(gè)副本不再區(qū)分主和備,客戶端根據(jù)一定的策略往其中的W個(gè)副本寫入數(shù)據(jù),讀取其中的R個(gè)副本。只要W+R>N,可以保證讀到的副本中至少有一個(gè)包含了的更新。然而,這種協(xié)議的問題在于不同副本的操作順序可能不一致,從多個(gè)副本讀取時(shí)可能出現(xiàn)。這種方式在實(shí)際系統(tǒng)中比較少見,不建議使用。 難言之隱,分布式存儲(chǔ)軟硬件解耦究竟難在哪里?蘇州聯(lián)想分布式存儲(chǔ)的一般架構(gòu) 正所謂長江后浪推前浪,分布...
分布式存儲(chǔ)是一種數(shù)據(jù)存儲(chǔ)技術(shù),通過網(wǎng)絡(luò)使用企業(yè)中的每臺(tái)機(jī)器上的磁盤空間,并將這些分散的存儲(chǔ)資源構(gòu)成一個(gè)虛擬的存儲(chǔ)設(shè)備,數(shù)據(jù)分散的存儲(chǔ)在企業(yè)的各個(gè)角落。分布式存儲(chǔ)系統(tǒng),是將數(shù)據(jù)分散存儲(chǔ)在多個(gè)du立的設(shè)備上。傳統(tǒng)的網(wǎng)絡(luò)存儲(chǔ)系統(tǒng)采用集中的存儲(chǔ)服務(wù)器存放所有數(shù)據(jù),存儲(chǔ)服務(wù)器成為系統(tǒng)性能的瓶頸,也是可靠性和安全性的焦點(diǎn),不能滿足大規(guī)模存儲(chǔ)應(yīng)用的需要。分布式網(wǎng)絡(luò)存儲(chǔ)系統(tǒng)采用可擴(kuò)展的系統(tǒng)結(jié)構(gòu),利用多臺(tái)存儲(chǔ)服務(wù)器分擔(dān)存儲(chǔ)負(fù)荷,利用位置服務(wù)器定位存儲(chǔ)信息,它不但提高了系統(tǒng)的可靠性、可用性和存取效率,還易于擴(kuò)展。 分布式存儲(chǔ)、數(shù)據(jù)湖、數(shù)據(jù)治理之間有何關(guān)系呢?江蘇視頻分布式存儲(chǔ)系統(tǒng)原理 分布式云閃塊存儲(chǔ)系統(tǒng)將...
分布式存儲(chǔ)的興起與互聯(lián)網(wǎng)的發(fā)展密不可分,互聯(lián)網(wǎng)公司由于其數(shù)據(jù)量大而資本積累少,而通常都使用大規(guī)模分布式存儲(chǔ)系統(tǒng)。與傳統(tǒng)的高duan服務(wù)器、高duan存儲(chǔ)器和高duan處理器不同的是,互聯(lián)網(wǎng)公司的分布式存儲(chǔ)系統(tǒng)由數(shù)量眾多的、低成本和高性價(jià)比的普通PC服務(wù)器通過網(wǎng)絡(luò)連接而成。其主要原因有以下三點(diǎn)(1)互聯(lián)網(wǎng)的業(yè)務(wù)發(fā)展很快,而且注意成本消耗,這就使得存儲(chǔ)系統(tǒng)不能依靠傳統(tǒng)的縱向擴(kuò)展的方式,即先買小型機(jī),不夠時(shí)再買中型機(jī),甚至大型機(jī)。互聯(lián)網(wǎng)后端的分布式系統(tǒng)要求支持橫向擴(kuò)展,即通過增加普通PC服務(wù)器來提高系統(tǒng)的整體處理能力。(2)普通PC服務(wù)器性價(jià)比高,故障率也高,需要在軟件層面實(shí)現(xiàn)自動(dòng)容錯(cuò),...
在整個(gè)結(jié)構(gòu)中,機(jī)頭中是整個(gè)分布式存儲(chǔ)系統(tǒng)的核xin部件,整個(gè)存儲(chǔ)系統(tǒng)的高級(jí)功能都在其中實(shí)現(xiàn)。控制器中的軟件實(shí)現(xiàn)對(duì)磁盤的管理,將磁盤抽象化為存儲(chǔ)資源池,然后劃分為LUN提供給服務(wù)器使用。這里的LUN其實(shí)就是在服務(wù)器上看到的磁盤。當(dāng)然,一些集中式存儲(chǔ)本身也是文件服務(wù)器,可以提供共享文件服務(wù)。無論如何,從上面我們可以看出集中式存儲(chǔ)比較大的特點(diǎn)是有一個(gè)統(tǒng)一的入口,所有數(shù)據(jù)都要經(jīng)過這個(gè)入口,這個(gè)入口就是存儲(chǔ)系統(tǒng)的機(jī)頭。這也就是集中式存儲(chǔ)區(qū)別于分布式存儲(chǔ)明顯的特點(diǎn)。 分布式存儲(chǔ)系統(tǒng),是將數(shù)據(jù)分散存儲(chǔ)在多臺(tái)單獨(dú)的設(shè)備上。無錫聯(lián)想分布式存儲(chǔ)系統(tǒng)架構(gòu) 目測分布式存儲(chǔ)領(lǐng)域有兩個(gè)派系,一派是SDS(軟件定義存...
分布式存儲(chǔ)傳統(tǒng)數(shù)據(jù)存儲(chǔ)模型需要支持盡可能多的應(yīng)用,因此需要具備較好的通用性。大數(shù)據(jù)具有大規(guī)模、高動(dòng)態(tài)及快速處理等特性,通用的數(shù)據(jù)存儲(chǔ)模型通常并不是能提高應(yīng)用性能的模型.而大數(shù)據(jù)存儲(chǔ)系統(tǒng)對(duì)上層應(yīng)用性能的關(guān)注遠(yuǎn)遠(yuǎn)超過對(duì)通用性的追求。針對(duì)應(yīng)用和負(fù)載來優(yōu)化存儲(chǔ),就是將數(shù)據(jù)存儲(chǔ)與應(yīng)用耦合。簡化或擴(kuò)展分布式文件系統(tǒng)的功能,根據(jù)特定應(yīng)用、特定負(fù)載、特定的計(jì)算模型對(duì)文件系統(tǒng)進(jìn)行定制和深度優(yōu)化,使應(yīng)用達(dá)到比較好性能。這類優(yōu)化技術(shù)在谷歌、Facebook等互聯(lián)網(wǎng)公司的內(nèi)部存儲(chǔ)系統(tǒng)上,管理超過千萬億字節(jié)級(jí)別的大數(shù)據(jù),能夠達(dá)到非常高的性能。 相較于傳統(tǒng)存儲(chǔ)黑盒子的管理方式,分布式存儲(chǔ)實(shí)現(xiàn)了標(biāo)準(zhǔn)硬件的交付,標(biāo)準(zhǔn)硬件...
分布式存儲(chǔ)采用分布式的系統(tǒng)結(jié)構(gòu),將數(shù)據(jù)以切片式或粉碎式分散在多個(gè)du立存儲(chǔ)服務(wù)器。它不但提高了系統(tǒng)的可靠性、可用性和存取效率,還易于擴(kuò)展,將通用硬件引入的不穩(wěn)定因素降到比較低。優(yōu)點(diǎn)如下:1、高性能。2、支持分級(jí)存儲(chǔ)。3、多副本的一致性。4、容災(zāi)與備份。5、彈性擴(kuò)展。6、存儲(chǔ)系統(tǒng)標(biāo)準(zhǔn)化。隨著分布式存儲(chǔ)的發(fā)展,存儲(chǔ)行業(yè)的標(biāo)準(zhǔn)化進(jìn)程也不斷推進(jìn),分布式存儲(chǔ)優(yōu)先采用行業(yè)標(biāo)準(zhǔn)接口進(jìn)行存儲(chǔ)接入。在平臺(tái)層面,通過將異構(gòu)存儲(chǔ)資源進(jìn)行抽象化,將傳統(tǒng)的存儲(chǔ)設(shè)備級(jí)的操作封裝成面向存儲(chǔ)資源的操作,從而簡化異構(gòu)存儲(chǔ)基礎(chǔ)架構(gòu)的操作,以實(shí)現(xiàn)存儲(chǔ)資源的集中管理,并能夠自動(dòng)執(zhí)行創(chuàng)建、變更、回收等整個(gè)存儲(chǔ)生命周期流程,...
分布式存儲(chǔ)系統(tǒng)中還可能使用基于寫多個(gè)存儲(chǔ)節(jié)點(diǎn)的復(fù)制協(xié)議(Replicated-writeprotocol)。比如Dynamo系統(tǒng)中的NWR復(fù)制協(xié)議,其中,N為副本數(shù)量,W為寫操作的副本數(shù),R為讀操作的副本數(shù)。NWR協(xié)議中多個(gè)副本不再區(qū)分主和備,客戶端根據(jù)一定的策略往其中的W個(gè)副本寫入數(shù)據(jù),讀取其中的R個(gè)副本。只要W+R>N,可以保證讀到的副本中至少有一個(gè)包含了的更新。然而,這種協(xié)議的問題在于不同副本的操作順序可能不一致,從多個(gè)副本讀取時(shí)可能出現(xiàn)。這種方式在實(shí)際系統(tǒng)中比較少見,不建議使用。 分布式存儲(chǔ)系統(tǒng)需要使用多臺(tái)服務(wù)器共同存儲(chǔ)數(shù)據(jù),隨著服務(wù)器數(shù)量的增加,出現(xiàn)故障的概率也在不斷增加。連云港...
分布式存儲(chǔ)構(gòu)建存儲(chǔ)系統(tǒng)時(shí).需要基于成本和性能來考慮,因此存儲(chǔ)系統(tǒng)通常采用多層不同性價(jià)比的存儲(chǔ)器件組成存儲(chǔ)層次結(jié)構(gòu)。大數(shù)據(jù)的規(guī)模大,因此構(gòu)建高效合理的存儲(chǔ)層次結(jié)構(gòu),可以在保證系統(tǒng)性能的前提下,降低系統(tǒng)能耗和構(gòu)建成本,利用數(shù)據(jù)訪問局部性原理.可以從兩個(gè)方面對(duì)存儲(chǔ)層次結(jié)構(gòu)進(jìn)行優(yōu)化。從提高性能的角度,可以通過分析應(yīng)用特征,識(shí)別熱點(diǎn)數(shù)據(jù)并對(duì)其進(jìn)行緩存或預(yù)取,通過高效的緩存預(yù)取算法和合理的緩存容量配比,以提高訪問性能。從降低成本的角度,采用信息生命周期管理方法,將訪問頻率低的冷數(shù)據(jù)遷移到低速廉價(jià)存儲(chǔ)設(shè)備上,可以在小幅犧sheng系統(tǒng)整體性能的基礎(chǔ)上,大幅降低系統(tǒng)的構(gòu)建成本和能耗。 分布式存儲(chǔ)“避坑”指...
分布式存儲(chǔ)架構(gòu)由三個(gè)部分組成:客戶端、元數(shù)據(jù)服務(wù)器和數(shù)據(jù)服務(wù)器。客戶端負(fù)責(zé)發(fā)送讀寫請(qǐng)求,緩存文件元數(shù)據(jù)和文件數(shù)據(jù)。元數(shù)據(jù)服務(wù)器負(fù)責(zé)管理元數(shù)據(jù)和處理客戶端的請(qǐng)求,是整個(gè)系統(tǒng)的核xin組件。數(shù)據(jù)服務(wù)器負(fù)責(zé)存放文件數(shù)據(jù),保證數(shù)據(jù)的可用性和完整性。該架構(gòu)的好處是性能和容量能夠同時(shí)拓展,系統(tǒng)規(guī)模具有很強(qiáng)的伸縮性。分布式存儲(chǔ)分為文件存儲(chǔ)、對(duì)象存儲(chǔ)和塊存儲(chǔ),但它們?nèi)N存儲(chǔ)方式的基本架構(gòu)都是大同小異的。即客戶端或應(yīng)用端、元數(shù)據(jù)(MDS)服務(wù)器和數(shù)據(jù)節(jié)點(diǎn)服務(wù)器。客戶端和元數(shù)據(jù)服務(wù)器之間交互是“信令交互”,而客戶端到數(shù)據(jù)節(jié)點(diǎn)是“媒體交互”。元數(shù)據(jù)服務(wù)器或通過數(shù)據(jù)節(jié)點(diǎn)服務(wù)器獲取各節(jié)點(diǎn)服務(wù)器的基本配置情況和狀態(tài)信...
分布式存儲(chǔ)系統(tǒng),是將數(shù)據(jù)分散存儲(chǔ)在多個(gè)du立的設(shè)備上。傳統(tǒng)的網(wǎng)絡(luò)存儲(chǔ)系統(tǒng)采用集中的存儲(chǔ)服務(wù)器存放所有數(shù)據(jù),存儲(chǔ)服務(wù)器成為系統(tǒng)性能的瓶頸,也是可靠性和安全性的焦點(diǎn),不能滿足大規(guī)模存儲(chǔ)應(yīng)用的需要。分布式網(wǎng)絡(luò)存儲(chǔ)系統(tǒng)采用可擴(kuò)展的系統(tǒng)結(jié)構(gòu),利用多臺(tái)存儲(chǔ)服務(wù)器分擔(dān)存儲(chǔ)負(fù)荷,利用位置服務(wù)器定位存儲(chǔ)信息,它不但提高了系統(tǒng)的可靠性、可用性和存取效率,還易于擴(kuò)展。分布式存儲(chǔ)系統(tǒng)需要使用多臺(tái)服務(wù)器共同存儲(chǔ)數(shù)據(jù),而隨著服務(wù)器數(shù)量的增加,服務(wù)器出現(xiàn)故障的概率也在不斷增加。為了保證在有服務(wù)器出現(xiàn)故障的情況下系統(tǒng)仍然可用。一般做法是把一個(gè)數(shù)據(jù)分成多份存儲(chǔ)在不同的服務(wù)器中。但是由于故障和并行存儲(chǔ)等情況的存在,同...
分布式存儲(chǔ)的重要性:云存儲(chǔ)和大數(shù)據(jù)是構(gòu)建在分布式存儲(chǔ)之上的應(yīng)用。移動(dòng)終端的計(jì)算能力和存儲(chǔ)空間有限,而且有在多個(gè)設(shè)備之間共享資源的強(qiáng)烈的需求,這就使得網(wǎng)盤、相冊(cè)等云存儲(chǔ)應(yīng)用很快流行起來。然而,萬變不離其宗,云存儲(chǔ)的核xin還是后端的大規(guī)模分布式存儲(chǔ)系統(tǒng)。大數(shù)據(jù)則更近一步,不僅需要存儲(chǔ)海量數(shù)據(jù),還需要通過合適的計(jì)算框架或者工具對(duì)這些數(shù)據(jù)進(jìn)行分析,抽取其中有價(jià)值的部分。如果沒有分布式存儲(chǔ),便談不上對(duì)大數(shù)據(jù)進(jìn)行分析。仔細(xì)分析還會(huì)發(fā)現(xiàn),分布式存儲(chǔ)技術(shù)是互聯(lián)網(wǎng)后端架構(gòu)的神器,掌握了這項(xiàng)技能,以后理解其他技術(shù)的本質(zhì)會(huì)變得非常容易。 分布式存儲(chǔ)系統(tǒng),分布式存儲(chǔ)架構(gòu)及原理。徐州數(shù)據(jù)分布式存儲(chǔ)原理 隨著企業(yè)...
什么是分布式存儲(chǔ)呢?如果一個(gè)存儲(chǔ)系統(tǒng),不管是對(duì)象、塊、文件、kv、log、olap、oltp,只要對(duì)所管理的數(shù)據(jù)做了Partitioning&Replication,不管姿勢對(duì)不對(duì),其實(shí)都可以歸納于分布式存儲(chǔ)。分布式存儲(chǔ)就是:Partitioning以多機(jī)scale,Replication以災(zāi)備容錯(cuò)。復(fù)制是解決可用性,可擴(kuò)展性和高性能的關(guān)鍵。為了災(zāi)備,數(shù)據(jù)需要冗余存儲(chǔ);為了高可用,服務(wù)需要hotstandby。缺乏災(zāi)備的系統(tǒng)難以在生產(chǎn)環(huán)境使用。元數(shù)據(jù)和數(shù)據(jù)的維護(hù)均離不開復(fù)制,復(fù)制可轉(zhuǎn)移而不可消除。復(fù)制引出了多副本一致性問題,而一致性保證需要考慮各種軟件和硬件故障,以及誤操作。 分布式存儲(chǔ)在...
得益于合理的分布式架構(gòu),分布式存儲(chǔ)可預(yù)估并且彈性擴(kuò)展計(jì)算、存儲(chǔ)容量和性能。分布式存儲(chǔ)的水平擴(kuò)展有以下幾個(gè)特性:1)節(jié)點(diǎn)擴(kuò)展后,舊數(shù)據(jù)會(huì)自動(dòng)遷移到新節(jié)點(diǎn),實(shí)現(xiàn)負(fù)載均衡,避點(diǎn)過熱的情況出現(xiàn);2)水平擴(kuò)展只需要將新節(jié)點(diǎn)和原有集群連接到同一網(wǎng)絡(luò),整個(gè)過程不會(huì)對(duì)業(yè)務(wù)造成影響;3)當(dāng)節(jié)點(diǎn)被添加到集群,集群系統(tǒng)的整體容量和性能也隨之線性擴(kuò)展,此后新節(jié)點(diǎn)的資源就會(huì)被管理平臺(tái)接管,被用于分配或者回收。隨著分布式存儲(chǔ)的發(fā)展,存儲(chǔ)行業(yè)的標(biāo)準(zhǔn)化進(jìn)程也不斷推進(jìn),分布式存儲(chǔ)優(yōu)先采用行業(yè)標(biāo)準(zhǔn)接口進(jìn)行存儲(chǔ)接入。在平臺(tái)層面,通過將異構(gòu)存儲(chǔ)資源進(jìn)行抽象化,將傳統(tǒng)的存儲(chǔ)設(shè)備級(jí)的操作封裝成面向存儲(chǔ)資源的操作,從而簡化異構(gòu)...
得益于合理的分布式架構(gòu),分布式存儲(chǔ)可預(yù)估并且彈性擴(kuò)展計(jì)算、存儲(chǔ)容量和性能。分布式存儲(chǔ)的水平擴(kuò)展有以下幾個(gè)特性:1)節(jié)點(diǎn)擴(kuò)展后,舊數(shù)據(jù)會(huì)自動(dòng)遷移到新節(jié)點(diǎn),實(shí)現(xiàn)負(fù)載均衡,避點(diǎn)過熱的情況出現(xiàn);2)水平擴(kuò)展只需要將新節(jié)點(diǎn)和原有集群連接到同一網(wǎng)絡(luò),整個(gè)過程不會(huì)對(duì)業(yè)務(wù)造成影響;3)當(dāng)節(jié)點(diǎn)被添加到集群,集群系統(tǒng)的整體容量和性能也隨之線性擴(kuò)展,此后新節(jié)點(diǎn)的資源就會(huì)被管理平臺(tái)接管,被用于分配或者回收。隨著分布式存儲(chǔ)的發(fā)展,存儲(chǔ)行業(yè)的標(biāo)準(zhǔn)化進(jìn)程也不斷推進(jìn),分布式存儲(chǔ)優(yōu)先采用行業(yè)標(biāo)準(zhǔn)接口進(jìn)行存儲(chǔ)接入。在平臺(tái)層面,通過將異構(gòu)存儲(chǔ)資源進(jìn)行抽象化,將傳統(tǒng)的存儲(chǔ)設(shè)備級(jí)的操作封裝成面向存儲(chǔ)資源的操作,從而簡化異構(gòu)...
說到分布式存儲(chǔ),我們可能都會(huì)聯(lián)想到軟件定義存儲(chǔ)(SoftwareDefinedStorage,即SDS)。代biao全球存儲(chǔ)廠商的權(quán)wei協(xié)會(huì)SNIA(全球網(wǎng)絡(luò)存儲(chǔ)工業(yè)協(xié)會(huì))對(duì)SDS定義:軟件定義存儲(chǔ)包括管理面的標(biāo)準(zhǔn)接口和自動(dòng)化,以及數(shù)據(jù)面Scale-out的塊、文件和對(duì)象存儲(chǔ)服務(wù)。或許我們需要把鏡頭投向21世紀(jì)初期,Google提出分布式存儲(chǔ)架構(gòu)的概念并予以實(shí)踐,在其強(qiáng)大的技術(shù)和維護(hù)團(tuán)隊(duì)支撐下,實(shí)現(xiàn)了基于在標(biāo)準(zhǔn)服務(wù)器上部署自研分布式存儲(chǔ)軟件,構(gòu)建成大規(guī)模存儲(chǔ)集群,以應(yīng)對(duì)其互聯(lián)網(wǎng)搜索業(yè)務(wù)帶來的海量數(shù)據(jù)流。 分布式存儲(chǔ)是未來數(shù)字產(chǎn)業(yè)生態(tài)系統(tǒng)構(gòu)建與新基建的重要引擎。安徽魏晉元興分布式存儲(chǔ) 與...
一般分布式存儲(chǔ)的MDC采用的是數(shù)據(jù)庫或內(nèi)存儲(chǔ)數(shù)據(jù)庫來記錄數(shù)據(jù)塊和物理位置關(guān)系。客戶端向MDC發(fā)出詢問位置的請(qǐng)求,MDC查詢數(shù)據(jù)庫后返回請(qǐng)求數(shù)據(jù)的存儲(chǔ)位置。這種方法存儲(chǔ)訪問的速度較慢,而且MDC作為交通的“樞紐”,是整個(gè)存儲(chǔ)的核xin,當(dāng)MDC發(fā)生故障,會(huì)導(dǎo)致整個(gè)存儲(chǔ)都不能使用。但是采取這個(gè)方式,也有好處,比如可以根據(jù)不同需求設(shè)置不同的副本策略等。對(duì)象存儲(chǔ)對(duì)象存儲(chǔ)是在同樣容量下提供的存儲(chǔ)性能比文件存儲(chǔ)更好,又能像文件存儲(chǔ)一樣有很好的共享性。實(shí)際使用中,性能不是對(duì)象存儲(chǔ)關(guān)注的問題,需要高性能可以用塊存儲(chǔ),容量才是對(duì)象存儲(chǔ)關(guān)注的問題。所以對(duì)象存儲(chǔ)的持久化層的硬盤數(shù)量更多,單盤的容量也更大...
很多人可能對(duì)分布式存儲(chǔ)耳熟能詳,但是,大多數(shù)人對(duì)其概念或者知識(shí)點(diǎn)卻了解得都過于分散,看了很多卻“只見樹木,不見森林”,學(xué)了很多往往只能“知其然,卻不能知其所以然”。因此,有必要對(duì)分布式存儲(chǔ)的概念、問題和矛盾進(jìn)行一下分析和解讀。實(shí)際上,如果可能,應(yīng)該是盡量不使用分布式的,因?yàn)檫@會(huì)增加系統(tǒng)的復(fù)雜度和管理難度,然而,雖然是這樣,但這些終歸是可以通過其他技術(shù)來解決,而如果不使用分布式,系統(tǒng)的可用性、穩(wěn)定性都無法保證,更談不上系統(tǒng)的高性能了。因此,說分布式是被迫使用的,一點(diǎn)也不夸張。 如何保證分布式存儲(chǔ)系統(tǒng)的高性能與高可用性呢?宿遷魏晉元興分布式存儲(chǔ)企業(yè) 分布式存儲(chǔ)系統(tǒng)具有如下特性:數(shù)據(jù)分...
隨著企業(yè)數(shù)字化轉(zhuǎn)型的深入,分布式存儲(chǔ)由初的開發(fā)測試、桌面云等非關(guān)鍵應(yīng)用,逐步走向生產(chǎn)應(yīng)用。生產(chǎn)應(yīng)用除了上述可靠性SLA要求之外,對(duì)分布式存儲(chǔ)的性能,尤其是數(shù)據(jù)訪問的穩(wěn)定低時(shí)延提出了更嚴(yán)苛的要求。軟硬件解耦的分布式存儲(chǔ)在性能設(shè)計(jì)上存在兩大天然缺陷:標(biāo)準(zhǔn)服務(wù)器不具備機(jī)房突然斷電時(shí)保護(hù)內(nèi)存數(shù)據(jù)的電池(BBU),所以只能用SSD卡/盤來做數(shù)據(jù)緩存。SSD的時(shí)延遠(yuǎn)高于內(nèi)存,導(dǎo)致業(yè)界絕大多數(shù)的軟硬解耦的分布式存儲(chǔ)時(shí)延無法和生產(chǎn)存儲(chǔ)媲美。單獨(dú)采購的分布式存儲(chǔ)軟件無法和第三方服務(wù)器的SSD盤緊密配合,從而無法像業(yè)界先進(jìn)的全閃存存儲(chǔ)一樣實(shí)現(xiàn)全局垃圾回收,控制數(shù)量眾多的SSD盤各自的垃圾回收導(dǎo)致的生產(chǎn)應(yīng)用時(shí)延...
一般分布式存儲(chǔ)的MDC采用的是數(shù)據(jù)庫或內(nèi)存儲(chǔ)數(shù)據(jù)庫來記錄數(shù)據(jù)塊和物理位置關(guān)系。客戶端向MDC發(fā)出詢問位置的請(qǐng)求,MDC查詢數(shù)據(jù)庫后返回請(qǐng)求數(shù)據(jù)的存儲(chǔ)位置。這種方法存儲(chǔ)訪問的速度較慢,而且MDC作為交通的“樞紐”,是整個(gè)存儲(chǔ)的核xin,當(dāng)MDC發(fā)生故障,會(huì)導(dǎo)致整個(gè)存儲(chǔ)都不能使用。但是采取這個(gè)方式,也有好處,比如可以根據(jù)不同需求設(shè)置不同的副本策略等。對(duì)象存儲(chǔ)對(duì)象存儲(chǔ)是在同樣容量下提供的存儲(chǔ)性能比文件存儲(chǔ)更好,又能像文件存儲(chǔ)一樣有很好的共享性。實(shí)際使用中,性能不是對(duì)象存儲(chǔ)關(guān)注的問題,需要高性能可以用塊存儲(chǔ),容量才是對(duì)象存儲(chǔ)關(guān)注的問題。所以對(duì)象存儲(chǔ)的持久化層的硬盤數(shù)量更多,單盤的容量也更大...
很多人可能對(duì)分布式存儲(chǔ)耳熟能詳,但是,大多數(shù)人對(duì)其概念或者知識(shí)點(diǎn)卻了解得都過于分散,看了很多卻“只見樹木,不見森林”,學(xué)了很多往往只能“知其然,卻不能知其所以然”。因此,有必要對(duì)分布式存儲(chǔ)的概念、問題和矛盾進(jìn)行一下分析和解讀。實(shí)際上,如果可能,應(yīng)該是盡量不使用分布式的,因?yàn)檫@會(huì)增加系統(tǒng)的復(fù)雜度和管理難度,然而,雖然是這樣,但這些終歸是可以通過其他技術(shù)來解決,而如果不使用分布式,系統(tǒng)的可用性、穩(wěn)定性都無法保證,更談不上系統(tǒng)的高性能了。因此,說分布式是被迫使用的,一點(diǎn)也不夸張。 分布式存儲(chǔ)在數(shù)據(jù)治理過程中的優(yōu)勢。舟山數(shù)據(jù)分布式存儲(chǔ)的一般架構(gòu) 分布式存儲(chǔ)分為文件存儲(chǔ)、對(duì)象存儲(chǔ)和塊存儲(chǔ),但它們?nèi)?..
那么現(xiàn)在問題來了,如果我們要選擇分布式存儲(chǔ),選擇哪種好呢?其實(shí)它們各有各的優(yōu)勢和使用場景,具體要看需求。(1)HDFS:主要用于大數(shù)據(jù)的存儲(chǔ)場景,是Hadoop大數(shù)據(jù)架構(gòu)中的存儲(chǔ)組件。HDFS在開始設(shè)計(jì)的時(shí)候,就已經(jīng)明確的它的應(yīng)用場景,就是大數(shù)據(jù)服務(wù)。(2)Ceph:目前應(yīng)用廣的開源分布式存儲(chǔ)系統(tǒng),已得到眾多廠商的支持,許多超融合系統(tǒng)的分布式存儲(chǔ)都是基于Ceph深度定制。而且Ceph已經(jīng)成為LINUX系統(tǒng)和OpenStack的“標(biāo)配”,用于支持各自的存儲(chǔ)系統(tǒng)。Ceph可以提供對(duì)象存儲(chǔ)、塊設(shè)備存儲(chǔ)和文件系統(tǒng)存儲(chǔ)服務(wù)。同時(shí)支持三種不同類型的存儲(chǔ)服務(wù)的特性,在分布式存儲(chǔ)系統(tǒng)中,是很少見的...
無論如何波折,分布式存儲(chǔ)未來可期:正所謂不管白貓、黑貓,抓到老鼠的就是好貓。我們相信在較長一段時(shí)間內(nèi),分布式存儲(chǔ)軟硬件一體和軟硬件解耦會(huì)長期共存。總體而言,筆者認(rèn)為隨著數(shù)據(jù)價(jià)值的增高,場景對(duì)數(shù)據(jù)可靠性的要求隨之會(huì)越來越嚴(yán)苛,市場的天平就會(huì)更多偏向軟硬件一體;與此相反,場景對(duì)數(shù)據(jù)可靠性的敏感度越低、短期成本敏感度越高,市場的天平就會(huì)更多的偏向軟硬件解耦。分布式存儲(chǔ)的發(fā)展歷程無論如何波折,我們更愿意相信它終會(huì)是部正劇,在整個(gè)存儲(chǔ)市場中占據(jù)海量數(shù)據(jù)承載的主力軍位置,鏗鏘而立,并給人以無窮回味!分布式存儲(chǔ)“避坑”指南。南通大數(shù)據(jù)分布式存儲(chǔ)設(shè)備 很多人可能從來沒有考慮過這個(gè)問題,為什么需要分布式存儲(chǔ)?...
分布式存儲(chǔ)的重要性:云存儲(chǔ)和大數(shù)據(jù)是構(gòu)建在分布式存儲(chǔ)之上的應(yīng)用。移動(dòng)終端的計(jì)算能力和存儲(chǔ)空間有限,而且有在多個(gè)設(shè)備之間共享資源的強(qiáng)烈的需求,這就使得網(wǎng)盤、相冊(cè)等云存儲(chǔ)應(yīng)用很快流行起來。然而,萬變不離其宗,云存儲(chǔ)的核xin還是后端的大規(guī)模分布式存儲(chǔ)系統(tǒng)。大數(shù)據(jù)則更近一步,不僅需要存儲(chǔ)海量數(shù)據(jù),還需要通過合適的計(jì)算框架或者工具對(duì)這些數(shù)據(jù)進(jìn)行分析,抽取其中有價(jià)值的部分。如果沒有分布式存儲(chǔ),便談不上對(duì)大數(shù)據(jù)進(jìn)行分析。仔細(xì)分析還會(huì)發(fā)現(xiàn),分布式存儲(chǔ)技術(shù)是互聯(lián)網(wǎng)后端架構(gòu)的神器,掌握了這項(xiàng)技能,以后理解其他技術(shù)的本質(zhì)會(huì)變得非常容易。 分布式存儲(chǔ)的小知識(shí),你值得擁有!溫州大規(guī)模分布式存儲(chǔ)原理 分布...
很多人可能從來沒有考慮過這個(gè)問題,為什么需要分布式存儲(chǔ)?實(shí)際上,使用分布式存儲(chǔ)是“被迫”的,因?yàn)殡S著互聯(lián)網(wǎng)的飛速發(fā)展、應(yīng)用越來越豐富、用戶數(shù)量越來越多、數(shù)據(jù)也成幾何級(jí)增長,海量數(shù)據(jù)的存儲(chǔ)給本地存儲(chǔ)帶了巨大壓力,存儲(chǔ)系統(tǒng)已經(jīng)不堪重負(fù),處于崩潰的邊緣,因此,必須通過其他手段分散存儲(chǔ)系統(tǒng)壓力,分布式存儲(chǔ)和分布式文件系統(tǒng)應(yīng)運(yùn)而生。實(shí)際上,如果可能,應(yīng)該是盡量不使用分布式的,因?yàn)檫@會(huì)增加系統(tǒng)的復(fù)雜度和管理難度,然而,雖然是這樣,但這些終歸是可以通過其他技術(shù)來解決,而如果不使用分布式,系統(tǒng)的可用性、穩(wěn)定性都無法保證,更談不上系統(tǒng)的高性能了。因此,說分布式是被迫使用的,一點(diǎn)也不夸張。 分布式存儲(chǔ)能夠?qū)崿F(xiàn)...
軟硬件解耦的分布式存儲(chǔ)在性能設(shè)計(jì)上存在兩大天然缺陷:標(biāo)準(zhǔn)服務(wù)器不具備機(jī)房突然斷電時(shí)保護(hù)內(nèi)存數(shù)據(jù)的電池(BBU),所以只能用SSD卡/盤來做數(shù)據(jù)緩存。SSD的時(shí)延遠(yuǎn)高于內(nèi)存,導(dǎo)致業(yè)界絕大多數(shù)的軟硬解耦的分布式存儲(chǔ)時(shí)延無法和生產(chǎn)存儲(chǔ)媲美。單獨(dú)采購的分布式存儲(chǔ)軟件無法和第三方服務(wù)器的SSD盤緊密配合,從而無法像業(yè)界先進(jìn)的全閃存存儲(chǔ)一樣實(shí)現(xiàn)全局垃圾回收,控制數(shù)量眾多的SSD盤各自的垃圾回收導(dǎo)致的生產(chǎn)應(yīng)用時(shí)延波動(dòng)。軟硬件一體的分布式存儲(chǔ)有機(jī)會(huì)克服如上兩大缺陷。我們看到業(yè)界先進(jìn)的分布式存儲(chǔ)產(chǎn)品,采用了類似于全閃存存儲(chǔ)的電池保護(hù)(BBU)、系統(tǒng)級(jí)全局垃圾回收,達(dá)到了媲美傳統(tǒng)生產(chǎn)存儲(chǔ)的高并發(fā)壓力下...
分布式存儲(chǔ)包含的種類繁多,除了傳統(tǒng)意義上的分布式文件系統(tǒng)、分布式塊存儲(chǔ)和分布式對(duì)象存儲(chǔ)外,還包括分布式數(shù)據(jù)庫和分布式緩存等,但其中架構(gòu)無外乎于三種;以Ceph為代biao的架構(gòu)是其典型的代biao。在該架構(gòu)中與HDFS不同的地方在于該架構(gòu)中沒有中心節(jié)點(diǎn)。客戶端是通過一個(gè)設(shè)備映射關(guān)系計(jì)算出來其寫入數(shù)據(jù)的位置,這樣客戶端可以直接與存儲(chǔ)節(jié)點(diǎn)通信,從而避免中心節(jié)點(diǎn)的性能瓶頸。以Ceph為代biao的架構(gòu)是其典型的代biao。在該架構(gòu)中與HDFS不同的地方在于該架構(gòu)中沒有中心節(jié)點(diǎn)。客戶端是通過一個(gè)設(shè)備映射關(guān)系計(jì)算出來其寫入數(shù)據(jù)的位置,這樣客戶端可以直接與存儲(chǔ)節(jié)點(diǎn)通信,從而避免中心節(jié)點(diǎn)的性能瓶頸。 對(duì)...
分布式存儲(chǔ)系統(tǒng)具有如下特性:數(shù)據(jù)分為多個(gè)分片存儲(chǔ)在多臺(tái)服務(wù)節(jié)點(diǎn)上。每個(gè)分片有多個(gè)副本,存儲(chǔ)在不同的服務(wù)節(jié)點(diǎn)上。許多客戶端并發(fā)訪問系統(tǒng),執(zhí)行讀寫操作,每個(gè)讀寫操作在系統(tǒng)中需要花費(fèi)不等的時(shí)間。除非下文中特別注明和討論,讀寫操作是原子的。與數(shù)據(jù)庫事務(wù)一致性的區(qū)別:數(shù)據(jù)庫事務(wù)的ACID的中也有一個(gè)一致性(consistency),但彼一致性非此一致性。ACID中的一致性是指,數(shù)據(jù)庫的事務(wù)的執(zhí)行,或者說事務(wù)觀察到的數(shù)據(jù),總是要滿足某些全局的一致性約束條件,如性約束,外鍵約束等。這個(gè)概念和數(shù)據(jù)庫的數(shù)據(jù)是否多副本沒關(guān)系。而本文的一致性在多副本的語境下才有意義。所以,數(shù)據(jù)庫事務(wù)的一致性,是指數(shù)據(jù)項(xiàng)...
在整個(gè)結(jié)構(gòu)中,機(jī)頭中是整個(gè)分布式存儲(chǔ)系統(tǒng)的核xin部件,整個(gè)存儲(chǔ)系統(tǒng)的高級(jí)功能都在其中實(shí)現(xiàn)。控制器中的軟件實(shí)現(xiàn)對(duì)磁盤的管理,將磁盤抽象化為存儲(chǔ)資源池,然后劃分為LUN提供給服務(wù)器使用。這里的LUN其實(shí)就是在服務(wù)器上看到的磁盤。當(dāng)然,一些集中式存儲(chǔ)本身也是文件服務(wù)器,可以提供共享文件服務(wù)。無論如何,從上面我們可以看出集中式存儲(chǔ)比較大的特點(diǎn)是有一個(gè)統(tǒng)一的入口,所有數(shù)據(jù)都要經(jīng)過這個(gè)入口,這個(gè)入口就是存儲(chǔ)系統(tǒng)的機(jī)頭。這也就是集中式存儲(chǔ)區(qū)別于分布式存儲(chǔ)明顯的特點(diǎn)。 分布式存儲(chǔ)系統(tǒng),是將數(shù)據(jù)分散存儲(chǔ)在多臺(tái)單獨(dú)的設(shè)備上。溫州聯(lián)想分布式存儲(chǔ)原理 分布式存儲(chǔ)傳統(tǒng)數(shù)據(jù)存儲(chǔ)模型需要支持盡可能多的應(yīng)用,因此需要...