位置: 首頁 >> 資訊 > > 正文

環(huán)球滾動:大數(shù)據(jù)分析工具Power BI(三):導入數(shù)據(jù)操作介紹

2023-03-18 19:03:09 來源:騰訊云

導入數(shù)據(jù)操作介紹

進入PowBI,彈出的如下頁面也可以直接關(guān)閉,在Power BI中想要導入數(shù)據(jù)需要通過Power Query 編輯器,Power Query 主要用來清洗和整理數(shù)據(jù)。


(相關(guān)資料圖)

文件資料下載:https://download.csdn.net/download/xiaoweite1/87587711

一、導入Excel數(shù)據(jù)

我們可以在Power BI中導入Excel數(shù)據(jù)進行分析展示,操作步驟如下:

1、點擊"轉(zhuǎn)換數(shù)據(jù)",打開Power Query編輯器

2、選擇"新建源"->"Excel工作簿",導入對應的 excel 數(shù)據(jù)

二、導入csv或文本數(shù)據(jù)

導入csv或文本格式數(shù)據(jù)與導入Excel格式數(shù)據(jù)操作類似,點擊"轉(zhuǎn)換數(shù)據(jù)":

三、導入文件夾數(shù)據(jù)

現(xiàn)在有2021-2022年銷售信息表和第一季度銷售表,需要將兩年數(shù)據(jù)導入到Power BI 一個數(shù)據(jù)文件中,對于這種導入文件夾中的數(shù)據(jù)有兩種方式,分別為合并并轉(zhuǎn)換數(shù)據(jù)導入文件夾數(shù)據(jù)和通過M函數(shù)導入文件夾數(shù)據(jù)方式。

1、合并轉(zhuǎn)換數(shù)據(jù)導入

注意,以上文件夾"2021年銷售信息表"中的每個xlsx文件中Sheet名稱必須一致,否則導入錯誤,如下:

目前為止只是導入了"2021年銷售信息表",也可以將"2022年銷售信息表"復制粘貼到"2021年銷售信息表"文件夾內(nèi):

然后在Power Query 頁面點擊"刷新預覽"即可將相應的"2022年銷售信息表"全部excel數(shù)據(jù)合并在一起。

這種導入文件夾數(shù)據(jù)方式操作簡單,但是對于文件夾中的數(shù)據(jù)文件有如下要求:

所有Excel表格標題行要一致每個Sheet表的名稱要一致

那么對于文件夾中數(shù)據(jù)文件Sheet表標題不一致或者Sheet表名稱不一樣的批量導入就需要使用到M函數(shù)方式導入。

2、M函數(shù)導入

在"資料"中有"第一季度銷售信息.zip"數(shù)據(jù),將數(shù)據(jù)解壓后可以看到有2021年第一季度銷售信息和2022年第一季度銷售信息,打開2021年第一季度銷售信息文件夾,可以看到有該年前3個月的銷售信息,三張表中第一個Sheet表名稱不同并且標題行不一致,如下:

以上文件中每個Excel文件中Sheet表名不同并且最后一個表多了一列是銷售額,這個時候如果按照之前方式導入文件夾數(shù)據(jù),會在"合并文件"這一步出現(xiàn)問題,只能針對第一個文件中的列進行數(shù)據(jù)導入。

這時我們?nèi)绾蜗胍獙⑦@種數(shù)據(jù)批量導入到Power BI中就需要用到M函數(shù),M函數(shù)是微軟為MicroSoft Power Query 設計的公式語言,對于一個文件夾中Sheet名稱不同并且標題列數(shù)不同的數(shù)據(jù)我們可以通過M函數(shù)將這些excel數(shù)據(jù)批量導入,具體操作如下:

在打開的頁面中過濾掉"~"開頭的數(shù)據(jù)臨時數(shù)據(jù)文件:

數(shù)據(jù)文件過濾后效果如下:

后續(xù)不需要其他的列,可以刪除其他列,然后添加新的列,自動以導入哪些數(shù)據(jù)列:

注意:Excel.Workbook(二進制數(shù)據(jù),是否使用標題):對Excel文件夾合并導入數(shù)據(jù)的函數(shù)。

二進制數(shù)據(jù)默認就是對應的Content列的內(nèi)容。是否使用標題:true表示使用第一行作為標題,不填或null或false都表示不使用。

以上刪除null的數(shù)據(jù)當所有列的值都為null時這樣的數(shù)據(jù)才會被刪除。通過觀察導入的數(shù)據(jù),看到最后一列為null,這是因為3個excel表中對應的列不匹配導致,"2021年3月銷售表.xlsx"文件多了"銷售額"這列,所以導致批量導入文件夾數(shù)據(jù)后看到了一列null值。我們可以刪除這一列再創(chuàng)建新的一列統(tǒng)計"銷售額"的值,操作步驟如下:

在操作過程中頁面右側(cè)的"查詢設置"中的"應用步驟"會記錄每一步的操作,如果一些步驟操作錯誤可以在該部分點擊"x"恢復操作之前的數(shù)據(jù)。

如果還有其他文件夾的數(shù)據(jù),只要包含以上excel中的這些列,都可以直接放入到表格讀取的文件夾中后,點擊"刷新預覽"就會將數(shù)據(jù)批量導入進來。將"2022年第一季度銷售信息"文件夾放入到"2021年第一季度銷售信息"文件夾中,點擊Power Query中的"刷新預覽":

到此為止,通過M函數(shù)導入數(shù)據(jù)完成。

以上M函數(shù)導入文件夾數(shù)據(jù)使用更加靈活,數(shù)據(jù)處理更快捷,可以合并不同名稱的sheet表包容性更強,但是M函數(shù)會將所有數(shù)據(jù)更改成文本數(shù)據(jù)格式。

四、數(shù)據(jù)簡單可視化

以上數(shù)據(jù)導入后,可以使用Power BI進行可視化展示,這里針對最后導入文件夾的合并數(shù)據(jù)進行可視化展示:使用柱狀圖展示2021年和2022年每個銷售人員的中銷售額情況。

標簽:

上一篇:
下一篇: