Azure SQL 數(shù)據(jù)庫倉庫Data Warehouse入門,azure sql數(shù)據(jù)倉庫Azure SQL 數(shù)據(jù)庫倉庫Data Warehouse入門1.什么是SQL數(shù)據(jù)庫倉庫(SQL DW)SQL DW是云端的企業(yè)級數(shù)據(jù)倉庫,用來處理TB,甚至PB級別的關系型數(shù)據(jù)庫的OLAP(聯(lián)機分析處理)場景,主要用來做數(shù)據(jù)分析......
1.什么是SQL數(shù)據(jù)庫倉庫(SQL DW)
SQL DW是云端的企業(yè)級數(shù)據(jù)倉庫,用來處理TB,甚至PB級別的關系型數(shù)據(jù)庫的OLAP(聯(lián)機分析處理)場景,主要用來做數(shù)據(jù)分析和查詢。
2.什么是OLAP
OLAP(Online Analysis Processing)聯(lián)機分析處理。表示從多維數(shù)據(jù)集的多維結(jié)構(gòu)來對數(shù)據(jù)進行聚合處理
3.OLAP和OLTP的區(qū)別
OLTP(Online Transaction Processing),聯(lián)機事務處理。表示事務性非常高的系統(tǒng),高頻度的插入、讀取、刪除操作
OLAP和OLTP的使用場景不一樣
4.SQL Data Warehouse不適合的場景
SQL DW不適合OLTP的場景,不適合數(shù)據(jù)庫的高頻Insert/update/delete
(1)OLTP工作負載
(2)大量的小讀寫
(3)多租戶數(shù)據(jù)庫
(4)經(jīng)常更改架構(gòu)
(5)逐行處理
(6)JSON,XML數(shù)據(jù)和Spatial,Struct,Array和Map數(shù)據(jù)類型
(7)Power BI直接查詢需要儀表板性能
(8)查詢的高并發(fā)性(例如,數(shù)十萬個并發(fā)查詢)
(9)小數(shù)據(jù)集(小于250GB)
(10)通過嚴格的RPO和RTO進行災難恢復
5.SQL DW適合的場景
SQL適合OLAP(聯(lián)機分析處理)的場景,比如報告,統(tǒng)計,分析等場景
6.SQL DW的設計模式
(1)批量導入數(shù)據(jù)
(2)將Table數(shù)據(jù)拆分為事實表和維度表
(3)涉及多張表鏈接的復雜查詢
(4)針對某些維度的聚合查詢
7.什么叫做事實表和維度表
(1)事實表,就是用來存儲真實數(shù)據(jù)的表,包含數(shù)字信息。比如訂單數(shù)據(jù)表,銷售數(shù)據(jù)表等。事實表中的數(shù)據(jù)量一般很大
(2)維度表,就是用來描述用戶分析數(shù)據(jù)的角度。一般是事實表的外鍵表,比如年月日,大洲國家省份。
一般來說,事實表就是要關注的內(nèi)容,維度表就是進行統(tǒng)計的角度。
8.SQL DW的使用場景
(1)在過去1個月內(nèi),有多少客戶訂購了該產(chǎn)品,統(tǒng)計庫存水平是否足夠
(2)一周內(nèi),哪一天客戶從ATM取款最多
(3)統(tǒng)計過去30天內(nèi),每天的銷售額有多少
9.Azure SQL DW采用了大規(guī)模并行處理(MPP)架構(gòu)。
作為微軟云Azure的一種服務,Azure SQL DW由微軟維護底層的硬件和軟件,以保證SQL DW始終運行在Azure最新的硬件和軟件上
客戶可以輕松的把數(shù)據(jù)加載到SQL DW并進行查詢,在業(yè)務高峰時,可以橫向擴展計算節(jié)點
10.什么是大規(guī)模并行處理MPP架構(gòu)
MPP架構(gòu)的角色分為頭節(jié)點(Head Node)和工作節(jié)點(Work Node)。
Head Node保存了數(shù)據(jù)表的源數(shù)據(jù)(Meta data),也就是說Head Node知道數(shù)據(jù)庫的哪些數(shù)據(jù),保存在哪些Work Node里
用戶的數(shù)據(jù)表分布在不同的Work Node里。
當用戶對SQL DW進行查詢的時候,Head Node會把查詢語句分解為很多子查詢,根據(jù)需要進行數(shù)據(jù)移動,并且把這些子查詢發(fā)快遞給Work Node以進行并行執(zhí)行
舉個例子,假設1個班級有60個學生,當老師需要批改作業(yè)的時候,有兩種方法:
(1)老師一個人批改所有60個學生的試卷,速度會很慢
(2)老師把學生分為6組,每組10個人。然后把全班的試卷平均的分配給這6組。由每個組各自批改試卷。這樣批改作業(yè)就平行了
顯而易見,第二種方法的效率最高
MPP架構(gòu),除了微軟的SQL DW以外,還有Hadoop(Hive和Spark),Teradata,Amazon Redshift,Vertica等產(chǎn)品
11.SMP架構(gòu)
與MPP相反架構(gòu),是SMP(Symmetric Multiprocessing),這就類似于傳統(tǒng)的單一數(shù)據(jù)庫。所有的業(yè)務邏輯都有1臺服務器在處理
比如傳統(tǒng)的SQL Server,MySQL等,都屬于SMP架構(gòu)
12.MPP架構(gòu)和SMP架構(gòu),如何支撐更多的業(yè)務需求
(1)在MPP架構(gòu)里,計算節(jié)點是橫向擴展的。比如從6個節(jié)點并行處理,橫向擴展為20個節(jié)點并行處理。這種方式又被稱為ScaleOut
(2)在SMP架構(gòu)里,計算節(jié)點和向上向下擴展的。比如從1臺8Core/16GB的服務器,向上擴展為1臺32Core/512GB的服務器。這種方式又被稱為ScaleUp
特別聲明:以上文章內(nèi)容僅代表作者本人觀點,不代表ESG跨境電商觀點或立場。如有關于作品內(nèi)容、版權(quán)或其它問題請于作品發(fā)表后的30日內(nèi)與ESG跨境電商聯(lián)系。
二維碼加載中...
使用微信掃一掃登錄
使用賬號密碼登錄
平臺顧問
微信掃一掃
馬上聯(lián)系在線顧問
小程序
ESG跨境小程序
手機入駐更便捷
返回頂部