AWS認定ソリューションアーキテクト(SAA)試験対策 - S3/Glacier/Glacier Deep Archiveまとめ

2020年2月11日AWS認定試験

試験によく出るポイントを中心に一通りの機能について解説していきます。

用語の説明程度としている機能は試験には経験上あまり出題されていません。

※構成図はAWS Blackbeltの資料を利用させていただきました。

ストレージクラス

S3関連の問題でよく出題されるのが、要件に一致するストレージクラスを選択する問題です。

以下の利用用途を理解しておくことが最大の対策です。

STANDARD

耐久性99.999999999%(イレブンナイン)
可用性99.99%
利用用途・データを即時に取り出す必要がある
更新頻度が高い
・重要なデータ

STANDARD-IA

耐久性99.999999999%(イレブンナイン)
可用性99.9%
利用用途・データを即時に取り出す必要がある
更新頻度が低い(更新時に課金されるため)
・重要なデータ

One Zone-IA

耐久性99.999999999%(イレブンナイン)
可用性99.5%
利用用途・データを即時に取り出す必要がある
・更新頻度が低い(更新時に課金されるため)
重要ではないデータ

Glacier(迅速)

耐久性99.999999999%(イレブンナイン)
可用性99.9%
利用用途・データと即時に取り出す必要がない(1~5 分以内
・重要なデータ

Glacier(標準)

耐久性99.999999999%(イレブンナイン)
可用性99.9%
利用用途・データと即時に取り出す必要がない(3~5 時間以内
・重要なデータ

Glacier(一括)

耐久性99.999999999%(イレブンナイン)
可用性99.9%
利用用途・データと即時に取り出す必要がない(5~12時間
・重要なデータ

Glacier Deep Archive(標準)

耐久性99.999999999%(イレブンナイン)
可用性99.9%
利用用途・データと即時に取り出す必要がない(12時間以内
・重要なデータ

Glacier Deep Archive(一括)

耐久性99.999999999%(イレブンナイン)
可用性99.9%
利用用途・データと即時に取り出す必要がない(48時間以内
・重要なデータ

結果整合性モデル

結果整合性モデルとは「結果的に一貫性が保たれればよいという考え方」です。

つまり、取得するタイミングによっては最新の情報でない可能性があるということです。

考えるべきタイミングは以下の2パターンです。

新規登録時

新しいキー(ファイル名)で登録されたデータは即時に反映され、どのタイミングで取得しても最新のデータを得ることができます。

更新時/削除時

同じキー(ファイル名)でS3にアップロードしたり、データを削除した場合にデータ反映に時間がかかる場合があります。

具体的には

・更新前のファイルが取得される
・削除したのファイルが取得できた
 実際に同じキー(ファイル名)で連続して更新したデータを取得すると、稀に古いファイルを取得する場合がありました。

S3やGlacierの利用用途

結果整合性モデルで発生する事象から、トランザクション処理などには向いていません

ですので、利用用途は耐久性の高さからデータの長期保存です。

暗号化方式

S3のデータを暗号化する際に利用できる方式は以下の3パターンです。

暗号化方式特徴
SSE-S3・暗号化キーはAWSで管理される
・暗号化にはAES256が用いられる
・無料

<利用シーン>
鍵の管理や保管を全てAWSに任せられる場合に利用される
SSE-KMS・暗号化キーはユーザがKMSで管理する
・KMSを用いるためCloudTrailにログを残せる
・有料

<利用シーン>
鍵の管理を自社で行う必要があるが、鍵の保管はAWSでもよい場合に利用される
SSE-C・暗号化キーはユーザが全て管理

<利用シーン>
鍵の管理や保管をクラウドでできないという制約がある場合に利用される

イベントを追加できる

S3はデータの登録・更新・削除時などのイベントによる処理が可能なため、Cloud Watch Eventsでイベントをキャッチする必要はありません。試験によく出ます!

クロスリージョンレプリケーション

別リージョンのバケットにレプリケーション設定したい場合に利用します。

また、別アカウントのバケットにも利用できます。

ポイント

バージョニング機能を有効にする必要がある
・レプリケーション元と先で暗号化方式を合わせる必要がある
 例.レプリケーション元がSSE-KMSならレプリケーション先もSSE-KMSにする

バージョニング

オブジェクト(ファイル)を登録・更新・削除のタイミングで履歴で保持することができます。

利用シーン

ユーザが謝って削除したファイルを戻すためにバージョニング設定をしておく

ライフサイクル

一定時間経過したデータに対して、別のストレージクラスに移動させたり削除したりできる。

オブジェクトの更新日を基準に日次実行されます。

最大1000ルールまで登録できるので、制限値をあまり気にすることはありません。

データ登録後2週間はよくアクセスするためS3の標準ストレージクラスで管理し、2週間経過したデータをGlacierに移動させる

イベントリ

利用状況の確認を可視化して確認するために利用します。

静的Webサイトホスティング

試験によく出るS3の機能です。

静的なWebページであればS3にHTMLファイルなどをアップしておいて、公開することができます。

URLには独自ドメインを利用できますが、標準では以下のURLになります。

http://【バケット名】.s3-website-【リージョン名】.amazonaws.com/

利用シーン

CloudFrontと組み合わせてWebシステムでシステムに異常があった場合に表示するSorryページを配置しておく

Storage Gateway

オンプレミスのファイルサーバを継続して利用したい場合に、S3をバックアップとして利用するサービスです。

S3の利用方法によって4つのタイプのサービスが用意されています

ファイルゲートウェイ(File Gateway)

保管型ボリュームゲートウェイ(Gateway-Stored Volumes)

ポイント

全てのファイルをオンプレ側のボリュームに配置し、障害時のためにS3にバックアップを保管しておく

キャッシュ型ボリュームゲートウェイ(Gateway-Cached Volumes)

ポイント

利用頻度の高いファイルをオンプレ側に保管しておく(オンプレ側に一部をキャッシュするイメージ)で、S3をバックアップに利用する

仮想テープゲートウェイ(Gateway-VTL)

ポイント

テープデバイスの代わりとして安価なGlacierを利用する

S3 Transfer Acceleration

クライアントとS3 バケットの間で、長距離にわたるファイル転送を高速、簡単、安全に実行するサービスです。

Snowball

物理ストレージデバイスを使用し、インターネットを迂回してAWS との大容量データ転送を高速化するサービス

ポイント

PB(ペタバイト)級のデータの場合では用いるが、少々大きなデータ程度であれば、オンプレ側とAWSとDirectConnectで接続する場合が多い。