MENU

Google Cloud Storageとは|単一APIで階層を選べる統合型ストレージ

Google Cloud Storage アイキャッチ
Google Cloud Storage

Google Cloud Storage(GCS)は、Googleが2010年5月にGoogle I/Oで発表し、同年に一般提供を開始した、Google Cloud Platformの主力オブジェクトストレージサービスです。Standard、Nearline、Coldline、Archiveの4つのストレージクラスを単一のAPIで扱える点が大きな特徴で、ストレージクラスを切り替えてもURLは変わらず、アプリケーションコードを変更せずにコスト最適化できます。BigQuery、Vertex AI、Dataproc、Cloud Functionsといったマネージドサービスのデータ置き場として広く使われ、Google検索やYouTubeの基盤と同系統のインフラを利用できる点が魅力です。

目次

この記事の目次

  1. GCSの歴史的背景
  2. 4つのストレージクラス
  3. AI・分析基盤としての強み
  4. 運用・セキュリティのポイント
  5. まとめ

GCSの歴史的背景

GCSの歴史的背景

Googleは2008年にApp Engineを発表してクラウドサービスへの参入を本格化し、2010年5月のGoogle I/Oでオブジェクトストレージサービス「Google Storage for Developers」を発表しました。現在のGoogle Cloud Storageの前身です。発表当初からCAP定理を踏まえつつ、強い一貫性を提供する設計が特徴で、書き込み直後の読み出しでも最新データを取得できる点をAWSに対する差別化として打ち出していました。GCSは2020年に「strong global consistency」を全面採用し、世界中のリージョンで読み書きの一貫性を保証するようになっています。

Googleはもともと検索インデックスとYouTube映像のために巨大な分散ファイルシステム(GFS、後継のColossus)を社内運用してきました。GCSはこのColossusインフラの上に構築されており、Googleの社内ワークロードと同じグレードのストレージ基盤を外部に提供している点が強みです。Spanner、BigQuery、Vertex AIなど、Googleが研究開発を進めてきたフルマネージド分析・AIサービスとの統合が深く、データ駆動型ビジネスに強いクラウドという立ち位置を確立しています。

4つのストレージクラス

4つのストレージクラス

GCSのストレージクラスは、Standard、Nearline、Coldline、Archiveの4つです。Standardは頻繁にアクセスされるデータ向けで、東京リージョンで1GBあたり月0.023ドル前後、Nearlineは月1回程度のアクセス想定で月0.013ドル前後、Coldlineは四半期に1度のアクセスで月0.006ドル前後、Archiveは年に1度程度の取り出しを想定し月0.0025ドル前後です。他社と比べてArchiveが「ミリ秒応答」である点が独特で、Glacier Flexible Retrievalのような取り出し待ちが発生しません。

全クラス同じAPIで利用でき、ライフサイクルポリシーで自動的に階層を遷移させられます。最低保管期間はNearlineが30日、Coldlineが90日、Archiveが365日で、それ以内の削除は残期間分の料金が請求されます。リージョン構成も柔軟で、単一リージョン、デュアルリージョン、マルチリージョンを選べ、特にマルチリージョンはアメリカ、欧州、アジアの3エリア単位で大陸を跨ぐ可用性を提供できる点が特徴的です。

AI・分析基盤としての強み

AI・分析基盤としての強み

GCSの真価が発揮されるのはAI/MLと分析の領域です。BigQueryはGCS上のParquetやCSV、Avroファイルを外部テーブルとして直接クエリでき、Hiveパーティション形式の自動認識やIcebergテーブルのサポートも整っています。Vertex AIはGCSに置かれたデータセットをそのままトレーニングジョブに渡せるため、AI開発のパイプライン全体がGCSを中心に構築されることが多いです。

Dataproc(マネージドHadoop/Spark)、Dataflow(マネージドApache Beam)、Pub/Sub、Cloud Composer(Airflow)などGCPのデータ処理基盤はすべてGCSと密結合しています。また、Anthos、GKE、Cloud Run、Cloud Functionsといったコンピュート層からGCSへのアクセスはVPC内通信に近いレイテンシで行えるため、「GCSをデータの正本にして、サービスごとに必要なフォーマットで読み出す」というデータレイク中心のアーキテクチャがGCPで主流の設計パターンとなっています。

運用・セキュリティのポイント

運用・セキュリティのポイント

セキュリティ面では、保管時暗号化(CMEK/CSEK対応)、IAMによるバケット・オブジェクト単位のアクセス制御、VPC Service Controlsによる境界制御、Bucket Lockによる改ざん防止、Object Versioningなどが揃っています。Uniform Bucket-Level Access(UBLA)を有効化することでバケット単位で一貫したIAM管理ができ、レガシーなACL運用を排除して監査性を高められます。Cloud Audit Logsで全アクセスログを記録し、Cloud Loggingで分析できる点も企業利用で重宝されます。

コスト最適化では、Storage Insightsで定期的にバケット内のオブジェクト分布を把握し、ライフサイクル管理で適切に階層を下げるのが基本です。東京リージョンと大阪リージョンを組み合わせたデュアルリージョン構成は、災害対策とパフォーマンスの両立に有効で、金融機関や官公庁案件で採用されることが増えています。Storage Transfer Serviceを使えばS3やAzure Blobからのデータ移行をマネージドで実行でき、TBクラスのマルチクラウド移行も自動化できます。

まとめ

Google Cloud Storageは、Googleが社内で磨いてきたColossusインフラを外部公開した、強整合性と高い分析親和性を持つオブジェクトストレージです。BigQueryやVertex AIと組み合わせたデータレイク・AI基盤としての完成度は高く、「データを中心にクラウドを設計する」という現代的なアーキテクチャを実践する企業にとって、有力な選択肢として存在感を増し続けています.

※本記事はIT用語辞典の手書きドラフトです。公開前に最新情報・出典を確認のうえ加筆修正してください。

よかったらシェアしてね!
  • URLをコピーしました!
  • URLをコピーしました!

この記事を書いた人

コメント

コメントする

目次