現今企業面臨著來自多方渠道的巨量數據,有效運用這些數據成為眾多企業的挑戰。Google Cloud 最熱門的服務之一 BigQuery,提供資料倉儲、數據分析和AI工具優化功能。本文將介紹 BigQuery 優勢、與傳統資料倉儲差異、彈性計價方式以及如何與 Google Analytics 4 進行串接。透過本文,您將了解 BigQuery 如何助力企業有效洞察和應用數據的能力。
BigQuery 是什麼?
BigQuery 是 Google Cloud 提供的無伺服器數據倉儲和分析工具,具有強大的擴展性和高速分析能力,能夠處理 PB 級別的資料。借助 Google 搜尋引擎的成熟技術基礎,BigQuery 提供企業和開發者一個整合多方資料來源、存儲、查詢和分析大規模數據集的解決方案。同時,大家熟知的 Google Ads 也廣泛運用 BigQuery 作為核心的資料分析技術。BigQuery 也內建智能分析服務以及機器學習模型訓練,幫助用戶從數據中獲得深入的洞察和價值。
BigQuery 的 3 大優勢
-
- 高效能:使用 BigQuery 查詢或分析 PB 等級的資料,最快可在數秒內完成,也能夠透過 Google Cloud ETL 工具,例如 Pub/Sub, Dataflow 等,即時查詢資料以及做進一步的分析。
-
- 價格親民:除了可以減免維運的成本,無需預先購買或管理硬體設備。此外,BigQuery 提供彈性且合理的價格模型,是根據使用量計費,使用多少支付多少,也會提供免費的儲存量和查詢額度。
-
- 高度擴展性:BigQuery 能夠串接第三方工具,也支援各種 BI (Business Intelligence) 工具,包含 Looker、Google Looker Studio、 Tableau 和 Power BI。BigQuery 內建機器學習系統 (BigQuery ML),可以直接使用簡單的 SQL 建立模型和使用模型做預測。
BigQuery 資料倉儲與傳統倉儲的差異
BigQuery 資料倉儲 | 傳統資料倉儲 | |
---|---|---|
軟硬體設備及擴展性 | 1. 無需伺服器、維運成本 2. 擴展性高 |
1. 需建制內部機房,購買軟硬體設備進行安裝 2. 擴展性低 |
成本效益 | 使用者付費:以資料查詢或分析量計算 | 資源不夠或是過多資源導致閒置浪費, 增加隱藏成本 |
彈性和靈活性 | 1. 可以使用內部機器學習以及 AI 工具,延伸數據應用,包含:建制推薦系統、預測顧客流程 2. 本身工具就包含數據分析及運算功能 |
1. 若有機器學習、AI 應用需求,需要額外自行建置模型 2. 需額外花費採購軟硬體設備加強分析功能 |
BigQuery On Demand 計費方式
BigQuery On Demand 的定價主要分為四個流程:資料擷取、儲存、分析、資料提取,也考慮到 BigQuery 的無服務器功能、查詢性能和功能改進,從 2023 年 7 月 5 日開始,將在所有地區將按需分析模型的價格提高 25%,從原先的 $5.75 per TB(asia-east1, Taiwan)提升至 $7.19 per TB,每個月有 1TB 的免費服務。
BigQuery 計價方式主要分為兩大方式:
BigQuery 儲存定價 (Storage pricing)
儲存定價為收取已載入 BigQuery 的資料的儲存費用,分為動態儲存跟長期儲存,兩種方式在效能、耐用性或可用性皆沒有任何差異,也都提供每個月前 10 GB 儲存空間免費額度。
-
- 動態儲存 (Active storage):$0.020 per GB
-
- 為包含過去 90 天內修改過的任何資料表或資料表分區。
-
- 動態儲存 (Active storage):$0.020 per GB
-
- 長期儲存 (Long-term storage):$0.010 per GB
-
- 為包含任何連續 90 天未經修改的資料表或資料表分區。這類資料表的儲存費用會自動調降約 50%。
-
- 長期儲存 (Long-term storage):$0.010 per GB
如果資料表經過編輯後,就會恢復為動態儲存價格,先前累計的 90 天閒置期也會歸零並重新開始計算,任何修改資料表的動作都會讓計時歸零。
但是以下幾項作業是不會讓計時歸零的:
-
- 查詢資料表
-
- 建立可查詢資料表的檢視表
-
- 從資料表匯出資料
-
- 將資料表複製到另一個目的地資料表
-
- 修補或更新資料表資源
BigQuery 分析定價 (Compute (analysis) pricing)
分析定價為處理資料查詢(query)費用,有以量計價的方案。
-
- 以量計價 (On-demand pricing): $7.19 per TB (asia-east1, Taiwan)
-
- 依照用量計費,用多少算多少,系統會根據查詢處理作業的位元組數來收費,每個月前 1 TB 的查詢為免費。
-
- 以量計價 (On-demand pricing): $7.19 per TB (asia-east1, Taiwan)
另外,因為 BigQuery 存在配額限制,如果有針對資料量龐大需要使用串流(Streaming) 或是串接 API 方式匯入或匯出資料,BigQuery 也有提供相對應的資料擷取及資料提取定價方案,官方也有提供價格計算器 (Pricing Calculator),幫助使用者估算費用。
而近期 BigQuery 也推出一個全新的計價方案 – BigQuery Edition,可以閱讀 BigQuery Edition 正式推出!帶你了解 BigQuery 最新計價方式 了解詳細計價方式。
BigQuery 如何與 GA4 串接?
Google Analytics 4 於今年 7 月 1 日正式上線,於 GA4 的資料只能最多存放 14 個月,但是透過與 BigQuery 串接,能夠讓資料完整儲存於 BigQuery 中,並直接進行數據查詢及分析,我們提供這個步驟教學,帶你了解如何進行 GA4 與 BigQuery 的無縫串接!
-
- 進入 Google Analytics 4 後台,點選「管理」,開啟設定介面
2. 到「資源」欄位,下拉到「產品連結」區塊,選擇「BigQuery 連結」
3. 進入設定頁面連結後,點選「選擇 BigQuery 專案」
需留意:執行此設定時,您的權限需為 GCP Project 擁有者 (Owner) & GA 編輯者 (Editor)
4. 設定數據匯出頻率:
-
- Daily 大約會是在下午匯出昨日資料(依GA時區)
-
- Steaming(串流)無每日事件量上限
5. 設定後資料就串接完成,匯入的資料會存放於 BigQuery 後台的 analytics_xxxx 資料集(dataset),不同日期會存在不同的資料表(table),命名格式為 events_yyyymmdd
BigQuery 總結
BigQuery 不論在數據倉儲、數據分析跟第三方工具串流功能都非常完善,在大數據時代有非常強大的地位。cacaFly 雲端智能中心提供雲端數據智慧解決方案,協助企業透過 Google Cloud 工具達到數據變現成效,歡迎聯繫我們的雲端數據顧問諮詢更詳細方案!