微軟 Power BI這套產品(服務)要發揮完全的能力,肯定要結合微軟的 Power BI雲端才行,但是我們也可以在本機發揮它的功能,協助自己做到一些資料分析,例如這是我將 Power BI用作分析虛擬主機流量的工具。
過去曾介紹過一套軟體 http logs viewer ,免費版本已經可以協助列出我們在 Apache/IIS/nginx的伺服器連線記錄,但是要有分析圖表和更多的篩選功能,則需要付費版才可以。而現在你可以透過 Power BI做到 http logs viewer所提供的功能,而且順便練習 Power BI的用法。
以下的範例使用的是 Apache伺服器的 Access Log,並且是用 cPanel平台匯出的。大多數的虛擬主機廠商都會提供 cPanel的後台,且提供的 Access Log檔案格式都很制式,你可以透過以下的方法來取得這個檔案。
一、取得 RAW Access Log
1. 首先,登入你的虛擬主機廠商所提供的 cPanel後台,並找到 Raw Access 選項。如果你的畫面長得不一樣,請直接搜尋 Raw Access
2.接著選擇你要下載的網域,在此頁面下方你也可以看到以月份儲存的存檔,依照想要觀看的紀錄檔下載即可。
3.下載的檔案通常會以此方式命名 網域-ssl_log-Jul-2023.gz,再把此檔案解壓縮後會得到一個沒有附檔名的檔案。
二、使用 Power BI範本
如果你還沒有安裝 Power BI,可以參考這一篇文章:Power BI微軟的數據分析與視覺化工具:下載、安裝&初探
1. 下載我做好的 Power BI範本 AccessLog,開啟後會顯示提示訊息,這裡要將我們剛才解壓縮的檔案位置填入;檔案沒有副檔名就無須填入。例如:C:\Users\Sid\Desktop\access_log,接著按下載入。
2.如果路徑輸入正確,將會載入相關資料後,顯示如下的畫面:
3. 上半部可以看到目前已經拉出來的瀏覽基本資料,而下半部則是目前已經設定好的基本篩選項目。透過點擊下方的篩選就可以調整我們想要了解的伺服器流量情況。
4. 在這裡,也可以依照你的需求設定新的篩選方式。只要在 Power BI中輕鬆的拖曳即可。
三、平台判斷功能
在原本的 Raw Access Log中並沒有平台或瀏覽器類型的判斷,因此透過條件判斷方式,粗略的透過 User Agent這個欄位寫了判斷方式,如果你需要更多判斷,可以進入 Power Query編輯資料找到修改的地方。
四、Power BI 參數應用
在 Power BI的 Power Query編輯器中,我設定了一個參數叫做「檔案位置」,你也可以在這裡隨時修改檔案位置來讀取各個檔案,而無須從選單中點選。
以上就是透過 Power BI來簡易做出更便利瀏覽 Apache Access Log的圖表方法;更多的應用是可以將這些資料在繪製成圖表,幾乎就可以完成和 http logs viewer的功能了。而以我自己使用此份圖表來看,通常會檢視是否有大量奇怪的爬蟲來消耗伺服器資源,因此 User Agent的欄位會是我特別想要觀察的地方,也提供你做參考。