部落格

cacaFly 雲端智能中心攜手企業客戶踏上數位轉型旅程
加速企業在大數據時代邁向成功

BigQuery 是什麼?如何與 GA4 串接?3 大優勢介紹

BigQuery googlecloud 數據倉儲 數據分析 雲端數據
  • 分享

現今企業面臨著來自多方渠道的巨量數據,有效運用這些數據成為眾多企業的挑戰。Google Cloud 最熱門的服務之一 BigQuery,提供資料倉儲、數據分析和AI工具優化功能。本文將介紹 BigQuery 優勢、與傳統資料倉儲差異、彈性計價方式以及如何與 Google Analytics 4 進行串接。透過本文,您將了解 BigQuery 如何助力企業有效洞察和應用數據的能力。

BigQuery 是什麼?

BigQuery 是 Google Cloud 提供的無伺服器數據倉儲和分析工具,具有強大的擴展性和高速分析能力,能夠處理 PB 級別的資料。借助 Google 搜尋引擎的成熟技術基礎,BigQuery 提供企業和開發者一個整合多方資料來源、存儲、查詢和分析大規模數據集的解決方案。同時,大家熟知的 Google Ads 也廣泛運用 BigQuery 作為核心的資料分析技術。BigQuery 也內建智能分析服務以及機器學習模型訓練,幫助用戶從數據中獲得深入的洞察和價值。

BigQuery 的 3 大優勢

      1. 高效能:使用 BigQuery 查詢或分析 PB 等級的資料,最快可在數秒內完成,也能夠透過 Google Cloud ETL 工具,例如 Pub/Sub, Dataflow 等,即時查詢資料以及做進一步的分析。

      1. 價格親民:除了可以減免維運的成本,無需預先購買或管理硬體設備。此外,BigQuery 提供彈性且合理的價格模型,是根據使用量計費,使用多少支付多少,也會提供免費的儲存量和查詢額度。

      1. 高度擴展性:BigQuery 能夠串接第三方工具,也支援各種 BI (Business Intelligence) 工具,包含 Looker、Google Looker Studio、 Tableau 和 Power BI。BigQuery 內建機器學習系統 (BigQuery ML),可以直接使用簡單的 SQL 建立模型和使用模型做預測。

    BigQuery 資料倉儲與傳統倉儲的差異

      BigQuery 資料倉儲 傳統資料倉儲
    軟硬體設備及擴展性 1. 無需伺服器、維運成本
    2. 擴展性高
    1. 需建制內部機房,購買軟硬體設備進行安裝
    2. 擴展性低
    成本效益 使用者付費:以資料查詢或分析量計算 資源不夠或是過多資源導致閒置浪費,
    增加隱藏成本
    彈性和靈活性 1. 可以使用內部機器學習以及 AI 工具,延伸數據應用,包含:建制推薦系統、預測顧客流程
    2. 本身工具就包含數據分析及運算功能
    1. 若有機器學習、AI 應用需求,需要額外自行建置模型
    2. 需額外花費採購軟硬體設備加強分析功能
    BigQuery vs. 傳統資料倉儲比較表

    BigQuery On Demand 計費方式

    BigQuery On Demand 的定價主要分為四個流程:資料擷取、儲存、分析、資料提取,也考慮到 BigQuery 的無服務器功能、查詢性能和功能改進,從 2023 年 7 月 5 日開始,將在所有地區將按需分析模型的價格提高 25%,從原先的 $5.75 per TB(asia-east1, Taiwan)提升至 $7.19 per TB,每個月有 1TB 的免費服務。

    BigQuery 計價方式主要分為兩大方式:

    BigQuery 儲存定價 (Storage pricing)

    儲存定價為收取已載入 BigQuery 的資料的儲存費用,分為動態儲存跟長期儲存,兩種方式在效能、耐用性或可用性皆沒有任何差異,也都提供每個月前 10 GB 儲存空間免費額度。

        • 動態儲存 (Active storage):$0.020 per GB
              • 為包含過去 90 天內修改過的任何資料表或資料表分區。

          • 長期儲存 (Long-term storage):$0.010 per GB
                • 為包含任何連續 90 天未經修改的資料表或資料表分區。這類資料表的儲存費用會自動調降約 50%。

          如果資料表經過編輯後,就會恢復為動態儲存價格,先前累計的 90 天閒置期也會歸零並重新開始計算,任何修改資料表的動作都會讓計時歸零。

          但是以下幾項作業是不會讓計時歸零的:

              • 查詢資料表

              • 建立可查詢資料表的檢視表

              • 從資料表匯出資料

              • 將資料表複製到另一個目的地資料表

              • 修補或更新資料表資源

            BigQuery 分析定價 (Compute (analysis) pricing)

            分析定價為處理資料查詢(query)費用,有以量計價的方案。

                • 以量計價 (On-demand pricing): $7.19 per TB (asia-east1, Taiwan)
                      • 依照用量計費,用多少算多少,系統會根據查詢處理作業的位元組數來收費,每個月前 1 TB 的查詢為免費。

                另外,因為 BigQuery 存在配額限制,如果有針對資料量龐大需要使用串流(Streaming) 或是串接 API 方式匯入或匯出資料,BigQuery 也有提供相對應的資料擷取及資料提取定價方案,官方也有提供價格計算器 (Pricing Calculator),幫助使用者估算費用。
                而近期 BigQuery 也推出一個全新的計價方案 – BigQuery Edition,可以閱讀 BigQuery Edition 正式推出!帶你了解 BigQuery 最新計價方式 了解詳細計價方式。

                BigQuery 如何與 GA4 串接?

                Google Analytics 4 於今年 7 月 1 日正式上線,於 GA4 的資料只能最多存放 14 個月,但是透過與 BigQuery 串接,能夠讓資料完整儲存於 BigQuery 中,並直接進行數據查詢及分析,我們提供這個步驟教學,帶你了解如何進行 GA4 與 BigQuery 的無縫串接!

                    1. 進入 Google Analytics 4 後台,點選「管理」,開啟設定介面

                  2. 到「資源」欄位,下拉到「產品連結」區塊,選擇「BigQuery 連結」

                  3. 進入設定頁面連結後,點選「選擇 BigQuery 專案」

                  需留意:執行此設定時,您的權限需為 GCP Project 擁有者 (Owner) & GA 編輯者 (Editor)

                  4. 設定數據匯出頻率:

                      • Daily 大約會是在下午匯出昨日資料(依GA時區)

                      • Steaming(串流)無每日事件量上限

                    5. 設定後資料就串接完成,匯入的資料會存放於 BigQuery 後台的 analytics_xxxx 資料集(dataset),不同日期會存在不同的資料表(table),命名格式為 events_yyyymmdd

                    BigQuery 總結

                    BigQuery 不論在數據倉儲、數據分析跟第三方工具串流功能都非常完善,在大數據時代有非常強大的地位。cacaFly 雲端智能中心提供雲端數據智慧解決方案,協助企業透過 Google Cloud 工具達到數據變現成效,歡迎聯繫我們的雲端數據顧問諮詢更詳細方案!

                    更多推薦文章

                    訂閱電子報

                    訂閱後您將獲得:

                    ✔ Google Cloud 課程資訊

                    ✔ cacaFly Cloud 提供的雲端趨勢文章

                    ✔ 雲端最新消息