自助資料集
7 自助資料集
自助資料集是一類基於個性化需求的資料集,它面向各階層使用者提供資料查詢和抽取服務。
1、支援資料表拖拉,系統自動或手動創建資料表關係實現表關聯查詢。
2、支援增加篩選器,過濾資料結果。
3、零技術語言,使用者可以很輕鬆地通過拖拉欄位的方式創建具有複雜計算邏輯的業務計算欄位。
4、系統支援將有日期資訊或地理資訊的欄位通過命令功能表創建成時間維度或者地理維度,便於對資料在時間或地理上的不同維度進行分析。
5、系統支援使用者可以隨時調整、修改表或欄位的分組、別名,設定表或欄位的可見性等欄位規範化操作。
6、通過資料行權限控制,保證所有使用者抽取到其權限內的資料。
特色
自助資料集總的來說有如下三大特色:
1、支援資料行權限控制
所謂的資料行權限,是指使用者本身所屬的機構、部門、區域等屬性對其獲取資料的一種權限限制,例如:某使用者作為北區的一名銷售主管,那麼我們應該允許他通過自助資料集查詢和抽取到的資料只能是北區的銷售部門的資料,而不能跨權限查詢到其它區域或者其它部門的資料。
2、支援跨庫查詢
自助資料集支援跨庫查詢,當使用者查詢資料的範圍比較廣並不限於一個資料庫時,可以跨多個資料庫進行查詢。
3、支援維度階層定義
自助資料集支援對日期欄位的時間維度階層定義和對區域欄位的地理維度階層定義,維度階層實現了在自助儀表板中的特殊應用:若應用到清單表或交叉表上,支援維度成員的自動展開/收縮功能;若應用到圖形上,支援自動下鑽功能。
7.1 自助資料集-介面介紹
“自助資料集”的編輯介面如下圖所示:

該介面主要分為如下幾個區:
區域
說明
參考章節
功能表列
預設顯示當前資源的更多操作功能表和最大化按鈕。
存儲工具列
用於將當前自助資料集進行儲存或另存操作。
快取策略
自助資料集支援三種快取策略:
自動快取:當前自助資料集在第一次打開並刷新資料後,從資料庫中讀取資料並存儲在快取中,在未清空快取的前提下,以後每次打開報表刷新資料時會從快取中讀取資料,從而提高查詢速度。
禁止快取:每次刷新資料都需重新到資料庫中讀取。此選項一般適用於資料需要即時刷新的報表。
系統組態:表示讀取系統選項>查詢設定>自動快取中的設定。

資料抽取工具列
用於將當前自助資料集的原始資料抽取到系統內置的快取記憶體庫中。
資料抽取
資料選擇區
顯示可供選擇的自助資料集的資料來源,包含:資料連接和資料集。
自助資料集-資料來源
表選擇區
顯示所選資料來源下可供選擇的表。
資料表集合區
通過拖拉的方式集合資料集所需的表,支援自動或手動創建資料表關係;支援增加篩選器實現資料結果過濾。
自助資料集-篩選器
資料表屬性區
顯示“資料表集合區中”所選表的屬性清單,將資料表欄位按照“維度”和“量值”劃分,允許對表和欄位進行規範化設計。
規範欄位
表資料區
用於顯示“資料表集合區”中所有欄位的資料結果,支援欄位別名、隱藏欄位的顯示設定及資料記錄行數設定。
7.2 自助資料集-定義流程
自助資料集是一類基於個性化需求的資料集,它面向各階層使用者提供資料查詢和抽取服務。
使用者可以根據業務要求,通過視覺化的方式,使用跨資料庫、多表關聯、資料轉換、複雜邏輯關係計算、資料抽取ETL等功能,將資料提取到自助資料集,這些自助資料集允許被自助儀表板、樞紐分析和試算表進行資料分析應用。
自助資料集的定義流程如下:

新建自助資料集
在平台管理介面選擇快顯功能表自助資料集(入口1),或在“資原始目錄區”的“平台資源”節點或其子目錄節點的右鍵功能表中選擇新建查詢>自助資料集(入口2)。

選擇資料來源
自助資料集的資料來源可以來自資料來源,也可以是資料集。

詳情請參考自助資料集-資料來源
定義表集合
定義表集合包含兩部分內容:
從資料來源中拖拉表或者拖拉資料集到“資料表集合區”。
在“資料表集合區”定義資料表關係,系統會根據表間相同別名的欄位創建資料表關係,若無法自動創建需要使用者手動創建資料表關係。
“資料表集合區”中的資料表從“資料區”中拖拉而來:

“資料表集合區”中手動創建資料表關係的方法:
1、按一下表間連接點,如下圖所示:

2、彈出“設定表連接”視窗,如下圖所示:

選擇連接方式:內連接、左連接、右連接、全連接。
確定表間連接欄位。
同步:原表或原資料集欄位增加或刪除時,自助資料集利用同步功能更新。
資料來源
操作
關係資料來源/快取記憶體庫
自助資料集引用的資料表欄位增加、刪除時,實現同步更新,需要進行如下兩個步驟:
1、資料庫某資料表欄位增加、刪除時,在資料來源節點下,選中該表,右鍵>同步資料表,如圖:

2、在自助資料集選中該表,右鍵>同步,如圖:

資料集
選中有欄位變更的資料集,右鍵>同步,如圖:

注1:目前暫不支援欄位類型更改的同步。注2:使用“同步”功能需儲存,再次打開自助資料集才生效。
篩選器:當資料集資料量比較大時,可增加篩選器,對資料集的資料進行篩選過濾,以便得到使用者真正所需的資料。
詳情請參考自助資料集-篩選器
規範欄位
自助資料集的“資料表屬性區”對應有維度和量值,系統支援對表和欄位進行重新組織、分類、設計等規範化設定操作,詳細說明如下:
功能
說明
範例效果
修改別名
修改資料表或欄位別名。
手動輸入別名,修改“customers”的別名為“顧客”,如圖:

修改資料類型
修改欄位的資料類型。
選擇欄位的資料類型,如圖:

設定可見性
設定表或欄位為“可見”或“不可見”。
為了快速查閱資料表或欄位,可將自助資料集在特定場景中不需要用到的表或欄位設定為“不可見”。
將表設定為“不可見”時,表的所有欄位都為“不可見”。
點擊可見性的圖示切換為“可見”或“不可見”:

拖拉表和欄位
拖拉表或欄位移動其位置。
拖拉欄位改變欄位所屬的表,將“產品目錄表”的“產品目錄名稱”拖拉到“產品表”,如圖:

新建目錄
用於在“維度”或“量值”中新建目錄。
任意區域右鍵功能表選擇“新建目錄”,新建一個“產品”目錄,如圖:

新建階層
用於新建階層目錄,儲存階層欄位,這些階層欄位主要實現自動下鑽應用,例如:功能範例-時間階層維下鑽、功能範例-地理階層維下鑽、功能範例-自訂階層維下鑽、交叉表的展開/收縮等。
任意區域右鍵功能表選擇“新建階層”,新建“地區”階層,按階層順序將欄位拖拉到“地區”下。如圖:

新建計算欄位
新建一個計算欄位。
計算欄位的資料類型決定了新建的計算欄位位於維度或量值。
維度:字串、日期資料、以ID結尾的欄位。
量值:數值型資料。
應用詳情請參考自助資料集-計算欄位
任意區域或欄位右鍵功能表選擇“新建計算欄位”,新建“銷售額”計算欄位,如圖:

創建時間維度
用於以維度階層的形式標識日期資訊欄位。
入口:日期資訊欄位的右鍵功能表選擇創建時間維度度。
創建時間維度度後會自動生成一個“時間維度度”的階層目錄。
應用情請參考功能範例-時間階層維下鑽

標記地理維度
用於以維度階層的形式標識地理資訊欄位。
入口:地理資訊欄位的右鍵功能表選擇標記地理維度度。
已標記地理維度度的欄位必須存儲在階層目錄下,才能保證地理維度階層欄位的下鑽效果實現。
應用詳情請參考功能範例-地理階層維下鑽

刪除
用於刪除表。
儲存自助資料集
儲存當前自助資料集到指定目錄。
資料抽取
將當前自助資料集的資料從原始資料庫中抽取到快取記憶體庫。詳情請參見資料抽取章節。
7.2.1 自助資料集-資料來源
系統支援自助資料集的資料來源有兩個:
1.支援基於關係資料來源和快取記憶體庫創建

注:
1)上圖的“資料連接”區中,灰色狀態的資料來源,表示該資料來源不支援應用於自助資料集。
2)上圖的“資料連接”區中,彩色長條上的小圓表示:該資料來源支援跨資料來源定義自助資料集。
3)自助資料集支援的資料來源有:Synapse JDBC for Excel、Gbase、GBase 8t、SynapseMpp、星環、Vertica、CH、Greenplum、Infobright、Oracle、DB2 V9、MySQL、MS SQL Server、Spark SQL、Teradata_v12、 Informix、IMPALA、PostgreSQL。
2.支援引用其它資料集
系統支援引用的其他資料集有:視覺化查詢、SQL查詢、原生SQL查詢、預存程序查詢、JAVA查詢、匯總分析和樞紐分析。

7.2.2 自助資料集-篩選器
篩選器作用等同於過濾或者參數,用於查詢出符合條件的資料結果。
自助資料集的篩選器用於:當資料集資料量比較大時,可增加篩選器,對資料集的資料進行篩選過濾,以便使用者能夠快速獲取其所需的資料。
自助資料集中通過篩選器設定的多個條件運算式之間只能是“and”關係。
操作步驟
1.新建一個自助資料集,在右上方有篩選器入口。

2.點擊"+"後會彈出編輯介面。

編輯介面設定項說明如下:
選項
描述
可選列
顯示當前資料集中包含的所有欄位。
條件
顯示邏輯運算子,比如“=、>、<、<>、LIKE、NOT LIKE、IN、NOT IN”等。
類型
包含兩種類型:值和備選值。
值
當“類型”選擇“值”時,此項為文字輸入框形式,手動輸入所需匹配的內容。 注:當條件為“IN/NOT IN”時,可輸入多個值,值與值之間用“英文逗號”隔開。
當“類型”選擇“備選值”時,此項為下拉面板選擇形式,點擊選擇所需對應的內容。
篩選條件範例:“產品目錄名稱”等於“特製品”並且“產品名稱”等於“豬肉乾”,設定如下:

3.點擊確定儲存後刷新資料即可查看效果。

7.2.3 自助資料集-計算欄位
計算欄位是指使用已經存在的欄位,通過四則運算、函數等撰寫運算式形成的新欄位。
使用者在創建報表時,有時通過現有資料欄位不能完全滿足資料分析的要求,因此就需要通過計算欄位的方式來解決。
操作步驟
1.創建一個資料集,在“資料表屬性區”的任意位置或欄位的右鍵功能表中選擇新建計算欄位。

2.在彈出的介面中進行設定。

介面說明如下:
設定項及分區
說明
名稱
計算欄位的名稱。
資料類型
計算欄位的資料類型。
可選欄位
可選擇的資料欄位資源樹,欄位通過拖拉到“運算式區域”。
運算式區域
用於編輯計算欄位運算式。
常用函數
計算欄位可選的常用函數:分為“字串”和“數值”兩類。
字串函數:lower、max、min、upper。
數值函數:abs、acos、asin、atan、cos、count、exp、floor、max、min、round、sin、sum、tan。
以“銷售額”為例,新建“銷售額”計算欄位,“銷售額”的運算式為:銷售額=單價*數量*(1-折扣),資料類型為“DOUBLE"。
編輯運算式時,按兩下欄位或將欄位直接拖入運算式區域即可,點擊確定儲存當前計算欄位,如下圖:

3.在“資料表屬性區”可以看到生成的計算欄位“銷售額”。

右鍵點擊“銷售額”,可以對計算欄位進行編輯。

4.新建自助儀表板時,在左側量值區中就可以看到以上創建的計算欄位“銷售額”。

Last updated
Was this helpful?