
Amazon S3(Simple Storage Service)は2006年3月14日に米国で一般公開されたAWS最初の商用サービスで、容量無制限・耐久性99.999999999%(イレブンナイン)という触れ込みは当時の常識を覆した。プロトコルはHTTPベースのREST、URLでオブジェクトを取得できる単純さが普及を後押しし、現在のオブジェクトストレージ事実上の標準となっている。本稿ではS3のデータモデルから、歴史、活用事例、競合との違いまでを順を追って整理する。
この記事の目次
- バケットとオブジェクトの構造
- 2006年3月、クラウドの第一声
- S3が選ばれる5つの場面
- GCSやAzure Blobとの違い
- まとめ
バケットとオブジェクトの構造

S3のデータモデルは極めて単純で、まず「バケット」という名前空間を作り、その中に「オブジェクト」を保存する。オブジェクトはキー(パスのように見える文字列)と本体、ユーザー定義メタデータ、システムメタデータの組合せで構成される。フォルダのように見える階層は実は単なるプレフィックスで、本来はフラットなキー空間。だからこそ任意の長さのキーでも一定時間で書き込み・読み出しができる。
1オブジェクトの最大サイズは5TBで、5MB以上はマルチパートアップロードに対応する。ストレージクラスはStandard、Intelligent-Tiering、Standard-IA、One Zone-IA、Glacier Instant Retrieval、Glacier Flexible Retrieval、Glacier Deep Archiveなど多段階に分かれ、アクセス頻度に応じてコストを下げられる。さらに2018年に追加されたS3 Selectでは、CSVやJSON、ParquetをSQLライクに部分抽出でき、データレイク用途の幅を広げた。
2006年3月、クラウドの第一声

AWSが最初に世に出したサービスはEC2ではなくS3で、2006年3月14日に米国でリリースされた。価格は最初1GBあたり月15セント、データ転送1GBあたり20セントというシンプルなもので、当時のホスティング業者の常識を破壊した。Smugmugなど写真共有サービスや初期のDropboxが基盤として採用し、口コミで広がった経緯がある。
技術的なマイルストーンとしては、2011年のLifecycleポリシーでアーカイブ自動移行を実現、2014年のEvent通知でLambda連携を可能にし、2020年12月には全リージョンでStrong Read-After-Write Consistencyを実現した。これによりJoseph M. Hellersteinらが論じた「最終的一貫性ゆえの設計上の制約」が大きく外れ、S3をデータベースの前段として使うアーキテクチャがさらに増えた。Mark Lebermanら創設期のチームが定めた「壊れない倉庫」という設計思想が現在も貫かれている。
S3が選ばれる5つの場面

静的サイトホスティングは今も人気の用途で、HTML/CSS/JSをバケットに置きCloudFrontを前段に挿すだけでグローバル配信が完成する。Jekyll、Hugo、Astroで生成した静的サイトは99%以上のSLAで動き、数百万PVでも月額数ドル単位に収まる。データレイクの基盤としてもデファクトで、Apache Parquet形式で蓄積しAthenaやRedshift Spectrumから直接SQLで問い合わせるパターンが主流である。
ログ集約も常套で、ALB/CloudFront/CloudTrailなどAWSの主要ログは標準でS3を書き込み先とする。Glacier Deep Archiveに移せばGBあたり月0.00099USDという圧倒的に安価な単価になり、規制要件の7年保管にも耐える。ゲーム業界では数十GBのアセット配信元として、メディア業界では4K動画の素材庫として利用が広がる。耐久性のため、誤削除対策にはバージョニングとMFA Deleteを必ず併用すべきだ。
GCSやAzure Blobとの違い

Google Cloud Storage(GCS)はマルチリージョンバケットを早期から提供し、世界中で書き込んでも単一URLで一貫したアクセスを実現する。Azure Blob StorageはHot/Cool/Archiveの三層構成でシンプル、Microsoft 365との接続でも使われやすい。両者ともS3互換APIを部分的に提供しており、s3fsやboto3を使ったコードを多少の差し替えで動かせる。
S3が依然優位なのは生態系の規模で、TerraformやCloudFormationのモジュール、Iceberg・Hudi・Delta Lakeなどのテーブルフォーマット、Snowflakeの外部テーブルなど、S3を一級市民として扱う製品が圧倒的に多い。一方でGCSはBigQueryとの密結合、AzureはADLS Gen2のHDFS互換が強みであり、企業のデータ戦略全体から選定するのが王道となる。
まとめ
S3はクラウド時代の倉庫として20年近く現役を続け、データレイクやサーバレスの基盤として進化を止めない。バケットを単なる置き場所と見なすか、データ戦略の中核と捉えるかで設計の深さは大きく変わる。ストレージクラス、ライフサイクル、セキュリティ設定を継続的に最適化することが運用成熟の指標と言える。
※本記事はIT用語辞典の手書きドラフトです。公開前に最新情報・出典を確認のうえ加筆修正してください。

コメント