您好,歡迎來到易龍商務網!
發布時間:2021-10-27 06:20  
【廣告】








時序數據庫發展簡史
代時序數據存儲系統
雖然通用關系數據庫可以存儲時序數據,但是由于缺乏針對時間的特殊優化,比如按時間間隔存儲和檢索數據等等,因此在處理這些數據時效率相對不高。
代時序數據典型來源于監控領域,直接基于平板文件的簡單存儲工具成為這類數據的首先存儲方式。
以RRDTool,Wishper為代表,通常這類系統處理的數據模型比較單一,單機容量受限,并且內嵌于監控告案。
BlueSky高性能時序數據庫的數字模型
上面介紹了時序數據的基本概念,也說明了分析時序數據的意義。那么時序數據該怎樣存儲呢?數據的存儲要考慮其數學模型和特點,時序數據當然也不例外。所以這里先介紹時序數據的數學模型和特點。
下圖為一段時序數據,記錄了一段時間內的某個集群里各機器上各端口的出入流量,每半小時記錄一個觀測值。這里以圖中的數據為例,介紹下時序數據的數學模型(不同的時序數據庫中,基本概念的稱謂有可能不同,這里以騰訊CTSDB為準):
measurement: 度量的數據集,類似于關系型數據庫中的 table;point: 一個數據點,類似于關系型數據庫中的 row;timestamp: 時間戳,表征采集到數據的時間點;tag: 維度列,代表數據的歸屬、屬性,表明是哪個設備/模塊產生的,一般不隨著時間變化,供查詢使用;field: 指標列,代表數據的測量值,隨時間平滑波動,不需要查詢。
BlueSky時序數據庫怎么分
關系型數據庫本身比較容易成為系統瓶頸,單機存儲容量、連接數、處理能力都有限。當單表的數據量達到1000W或100G以后,由于查詢維度較多,即使添加從庫、優化索引,做很多操作時性能仍下降嚴重。此時就要考慮對其進行切分了,切分的目的就在于減少數據庫的負擔,縮短查詢時間。
數據庫分布式內容無非就是數據切分(Sharding),以及切分后對數據的定位、整合。數據切分就是將數據分散存儲到多個數據庫中,使得單一數據庫中的數據量變小,通過擴充主機的數量緩解單一數據庫的性能問題,從而達到提升數據庫操作性能的目的。
數據切分根據其切分類型,可以分為兩種方式:垂直(縱向)切分和水平(橫向)切分