本文章有助於大家了解BI工具-PowerBi的使用。通過本文章,零基礎也可以輕松搭建自己的可視化看板!後續也會發布壹些其他主流的BI工具,但是BI工具總體邏輯上和使用上大同小異。
壹、表的概念
在正式介紹powerbi之前,對‘表’這個概念的深入理解是十分有必要的。
1、表的類別:維度表及事實表
(1)事實表:它的主要特點是往往每壹行數據代表壹個事件、事實或記錄,能夠提取出度量值信息,數據量較大,也被稱為數據表(例如:銷售數據表、訂單數據表、用戶行為數據表等)。
(2)維度表:它的主要特點是包含類別屬性信息,數據量較小,包括例如日期、門店名稱、產品ID、顧客ID這些不重復的唯壹字段。它也被稱為Lookup表,是因為在Excel中我們經常把它們當作Vlookup函數中的目標查詢表來使用(例:日歷表、門店信息表、產品表、顧客信息表等)。
2、維度表和事實表舉例
舉個例子,更便於大家理解:
該表為事實表,可以看到每條都是記錄壹個事實:
相對於上面這個事實表,下表為維度表:
二、PowerBi基礎
1、PowerBi簡介:PowerBi是軟件服務、應用和連接器的結合,它們協同工作以將相關數據來源轉換為連貫的視覺逼真的交互見解。
2、數據可視化的定義:通過數據與圖像的結合,更直觀的獲取信息。
3、Power Bi主要由三部分組成:Power Query(Data Analysis Expression)、數據建模以及可視化看板。
(1)Power query:編輯查詢器幫助我們完成數據源整理工作,在妳關閉並應用操作後,結果就被存儲在可編輯查詢中。
(2)數據建模:將維度表與事實表通過某字段建立對應關系(1對1或1對多),將數據連通。也可稱為關系視圖。
(3)可視化看板:通過各類可視化組件、切片器等完成可視化看板的搭建。
4、度量值與DAX
(1)度量值:用於展示關鍵指標。度量值大家可以理解為它是以壹個公式的形式存在於Power Bi中,它不會使得妳的數據表中產生新列或者新的行。因此和EXCEL中直接插入列導致產生大量新數據相比,度量值幾乎不會占用內存。構建度量值的語言稱為DAX(Data Analysis Expression)。
(2)DAX:與EXCEL中的公式很相似,只不過EXCEL中的公式引用的是單元格(如‘A1’,‘B3’)。而DAX引用的是某張表中的某列的名稱。
例如:[銷售量]=sum('銷售數據'[數量])
註:在DAX中,單引號''中的為表名。方括號[]中的為列名。
想要搭建壹個可視化看板,大致的流程可以分為:數據獲取→數據清洗→數據建模→可視化看板搭建。下面會逐個步驟詳細介紹。
三、數據獲取
PowerBi支持多種數據源,像各種本地文件:Excel、CSV、文件夾等。支持各類數據庫:Oracel、Mysql等。支持由表格構成前端的Web等。
以Excel為例,由於壹個Excel文件可能包括很多個sheet,因此可以在左側進行勾選,之後點擊加載。其中“轉換數據”指在將數據加載至PowerBi之前可以先對數據進行預處理,當然加載之後也可進行處理。但是如果數據量過大,或數據源中有很多列或者行是無用的,那麽建議在加載數據前先將數據進行預處理(預處理和數據清洗方法壹樣,會在數據清洗章節詳細說明)。
四、數據清洗
什麽是數據清洗,壹句話概括就是:將數據變成妳想要且可用的。
(1)數據清洗的方式和方法
其中方式指實現清洗的工具或途徑,例如可以在Powerbi中通過Power Query清洗,也可以在加載至Powerbi之前,通過SQL程序實現數據清洗。
其中方法為將去除空值,去除重復值,合並列,拆分列,修改數據類型,數據逆透視等等。
(2)以Power Query為例,我們可以在Power Query的工具欄中通過各種方法實現數據清洗:
在Power Query界面,通過在Powerbi中點擊“轉換數據”即可進入,圖中1部分展示了妳可以進行的數據清洗方式,圖中2展示了已經加載到Powerbi中的數據,圖中3記錄了妳每次進行操作的記錄(例如妳刪除壹列,則在右側就會記錄下妳刪除壹列的操作)。
清洗完成後,點擊左上角的關閉並應用,所有的後臺數據都會被保存並跳轉回畫布界面。
五、數據可視化
獲取並清洗了數據後,就可以用清洗後的數據搭建看板。
1、畫布功能界面介紹
部分是功能區,常用的包括:獲取數據,轉換數據,刷新等等。
部分從上到下依次為:畫布展示,數據總覽,數據建模。其中數據建模指將不同數據源的數據鏈接起來。
部分為可以使用的可視化組件(點擊後即可拖拽),可視化組件下方為該可視化組件都展示了哪些字段(可以簡單理解為橫縱坐標都展示哪些數據)。
部分展示了數據的各個表的信息,各個表的每個列信息以及插入的度量值信息。
2、可視化組件介紹
(1)以柱狀圖折線圖為例:
首先點擊進入到畫布界面,選中可視化組件類型,之後將數據中的字段拖拽到X軸或Y軸,即可實現簡單的可視化圖表的創建。
(2)圖表的格式編輯
上圖中紅圈內部為圖標格式編輯,例如圖標顏色,標題,數據標簽等等,如果在“視覺對象”選項中找不到要更改的屬性,則可以在“常規”選項中進行編輯。