當前位置：才華齋>計算機>操作系統>

淺析海綿數據推出大數據操作系統Sponge

操作系統閲讀(2.41W)

海綿數據近日宣佈推出其第二代大數據操作系統產品Sponge。Sponge是一個簡單多層，兼容完全POSIX兼容的分佈式NFS、Hadoop，支持對象存儲、雲存儲、SDS（軟件定義存儲）、容器機制，集成Spark為計算引擎，基於內存計算技術的分佈式系統，將大數據的存儲、管理和計算有機融合，具有實時一致性，易於兼容現有系統，相比10年前誕生的第一代產品Hadoop更加簡單易用，易於擴展。僅僅有作為計算平台的Spark不足以應對大數據的挑戰，整合後的Sponge技術框架，能夠同時支持大數據、雲存儲、結構化、半結構化和非結構化數據的處理，代表了大數據的發展方向。

簡單高效可靠經濟

今天已經沒有人再懷疑大數據的價值，雲計算、移動互聯、物聯網、機器學習、無人機等前沿技術的普及與大數據的發展相得益彰，不論在美國還是中國，大數據已經在很多的IT企業和傳統企業開始落地，譬如互聯網金融公司的反欺詐流程，電信運營商的客户服務分析，都貫穿着大數據和機器學習技術的應用，這也刺激着初創企業在這個領域尋找新的商業機會。

目前普遍被採用來應對大數據的是開源軟件與廉價的x86服務器的組合，這些開源產品包括Hadoop、Spark、Storm、NoSQL等。傳統存儲和數據庫當然也針對大數據的需求升級，用來存儲價值密度低的大量非結構化數據卻不現實。這些原本被Google、Facebook、Yahoo等大公司驗證在某些場景很成功的開源項目，也存在問題：不同功能模塊對應多個相互獨立的開源項目，為不同的目的而設計，其關係很複雜，缺乏通用性，系統部署和使用複雜而低效，二次開發困難，並且難以統一管理和監控，維護成本高，所以，需要有一個統一的`平台。

簡單、高效、可靠、經濟，這四個詞，是海綿數據對第二代大數據操作系統的價值的追求，以及Sponge產品設計的理念。

滿足大量文件數據讀寫IO的高需求

不同於以往以磁盤計算技術為核心的文件系統，SpongeFS將集羣內存管理提升成為文件系統的重要組成部分，以滿足大量文件數據讀寫IO的高需求。SpongeFS基於分佈式設計，上文説的Masterless結構，以及模塊化架構，正是由SpongeFS來操盤的。

SpongeFS主要由集羣管理層、文件管理層和存儲層構成。當數據進入SpongeFS，就被分成一個個數據塊，每個數據塊通過文件管理層先存入緩存層，被加入集羣間複製隊列，一擊加入到持久隊列等待存入持久層，CDR則把持久層數據塊複製到目標集羣（目標羣數據塊也優先存到緩存層）。文件管理層的基本管理單位是Volume，每個Volume可以有不同的管理設置，如容錯性、安全性、物理資源的使用等。

標籤：淺析 Sponge 操作系統

圖文推薦