AWS SAA用語集

AWS SAA用語集

2024-07-27

目次

Amazon VPC

VPCフローログ

VPCのネットワークインターフェイスとの間で行き来するIPトラフィックに関する情報をキャプチャできるようにする機能。フローログデータはAmazon CloudWatch Logs、Amazon S3、Amazon Data Firehoseに発行できる。

公式

セキュリティグループ

セキュリティグループにはIngress(インバウンド)、Egress(アウトバウンド)のルールを設定することができる。

インターフェイスエンドポイント

IPアドレスを持って、vpcのなかにエンドポイントができる

ゲートウェイエンドポイント

S3とDynamoDBが対応していて、ルートテーブルでの設定が必要

RDS

IAM認証調べる(やってみるかも?)

Amazon ElastiCache

データのキャッシュサービス。以下の2種類が存在する。

  • ElastiCache for Memcached
  • ElastiCache for Redis

基本的にRedisの方が多機能であるため、多くの場合はElastiCacheが使われている。

RDSの読み込み速度が遅くなっている時に、頻繁に呼び出されるデータをElastiCacheにキャッシュしておくことで、RDSの負担を軽減できる。

RDSに問い合わせるか、ElastiCacheに問い合わせるかはアプリケーション側で制御する必要がある。またELastiCacheにどのようなデータをキャッシュしておくかもアプリケーション側で制御する。

参考

Amazon Kinesis

Kinesisには2つの種類がある。どちらもログやイベントデータなどの大量のデータを高速に別サービスに転送するためのサービス。

  1. Kinesis Data Streams : 高速, リアルタイム性に優れている
  2. Kinesis Data Firehose: 設定が少ない, RedShiftやS3に流し込むサービスで分析に向いている

上記の他にKinesis Data Analyticsもあり、上記2つから送られてくるデータをSQLを使って処理できるサービス。

参考

AWS Storage Gateway

オンプレとAWSのストレージを繋ぐサービスで、低レイテンシーで繋ぎバックアップデータをAWS上に保管することが可能。

以下の3つのタイプに分かれている。

  • ファイルゲートウェイ
  • ボリュームゲートウェイ
  • テープゲートウェイ

ボリュームゲートウェイ

ボリュームゲートウェイはさらに2つに分かれていて、キャッシュ型と保管型に別れている。

キャッシュ型は以下のような特徴がある

  • プライマリはS3
  • 頻繁にアクセスされるデータをオンプレにキャッシュしておく

保管型はこんな特徴

  • プライマリはオンプレ
  • ローカルに保存しながら、非同期でS3にも保存する

DynamoDB

DynamoDBは要件に応じてキャパシティモードの選択が可能

  1. オンデマンドモード
  • 利用するキャパが予想できない時に使用する
  • リクエスト数に応じて課金される
  • 自動スケーリングされる
  1. プロビジョニングモード
  • 利用キャパが予測できる時に利用する
  • 事前に予測した書き込みキャパシティユニットと読み込みキャパシティユニットを設定し、設定に応じて課金される
  • キャパシティユニットは後から増やすことができる

ストリーム

またDynamoDBにはストリーム機能がある。

ストリーム機能ではDynamoDBの変更を最大24時間保存しておくことができる。またLambdaなどと連携することで、DynamoDBに変更があった場合にLambdaを起動して処理を走らせるというようなことができる。

オートスケーリング

DynamoDBはオートスケーリング機能もあり、負荷に応じて自動でスケーリングできる。

DAX

DynamoDB AcceleratorはDynamoDBのインメモリキャッシュサービス。

読み取り速度が劇的に向上する。

グローバルテーブル

グローバルテーブルを使うことで、指定した複数のAWSリージョンでDynamoDBテーブルがレプリケートされる。

どこかのリージョンのDynamoDBに対して書き込みを行うと、自動で同じデータが他のリージョンにもコピーされる。

公式

ポイントインタイムリカバリ

AWS Shield

DDoS攻撃に対応するサービスで、2つのレベルがある

  • Standard: 無料で利用可能
  • Advanced: 有料

AWS Secrets Manager

データベースなどの認証情報を安全に暗号化してシークレットとして保管・取得することができる。

ライフサイクル機能があるので、シークレットをローテーションすることができる。

AWS S3

オブジェクトロック機能を使うことで、変更や削除が不可能になる。バケット作成時にしか適応できない。

オブジェクトロックには以下2つのモードがある

  • ガバナンスモード: 管理者やルートユーザーなどの特別なユーザー以外は変更や削除をすることができない
  • コンプライアンスモード: ルートユーザー含め全てのユーザーが変更や削除ができない

ストレージクラス

  • One Zone-IA

アクセスが頻繁ではない&重要ではないデータを保存する際に向いていて、安価に利用できる。

データの取得は即時に行えるが、取得時には課金される。

ストレージクラス分析

ストレージクラス分析を使用することで、オブジェクトのアクセスパターンを分析し、結果をCSVファイルとして取得できる。

Amazon S3 分析のストレージクラス分析を使用することにより、ストレージアクセスパターンを分析し、適切なデータをいつ適切なストレージクラスに移行すべきかを判断できます。

公式 参考

リクエスタ支払い機能

バケットに対するリクエストによって発生する料金をリクエストしたユーザーに支払わせることができる設定。

マルチパートアップロード

大容量のデータを分割してアップロードする機能。効果としてスループットの向上が挙げられる。

公式

S3 Select

csvなどの単一のファイルに対してsqlを実行できるような機能。

AWS SQS

可視性タイムアウトを設定することで、一つのコンシューマーがメッセージを処理している間、設定された時間他のコンシューマーはメッセージを見ることができない。

キューに優先度をつけることが可能

デッドレターキュー

エラーによって処理できなかったメッセージを一時的に保存そる特別なメッセージキュー。

公式

メッセージ保存期間

デフォルトで4日間メッセージは保存される。設定の変更は可能で60秒から14日間の間で設定可能。

AWS Direct Connect

AWS Direct Connectでは専用線を使って、インターネットを介さずに直接AWSのネットワーク環境と接続できる。そのためセキュリティが高く、通信料も安く済む。

AWS DLM

DLMを使用することで、EBSスナップショットとEBS-backed AMIの作成、保持、削除を自動化できる。

AWS EBS

EC2インスタンスを修了する際にEBSを存続させるかどうかはEBSのDeleteOnTermination属性に基づいて決まる。 EBSのバックアップであるスナップショットを作成・保存・削除を自動化するスケジュールを設定できる

AWS EBS

EC2インスタンスを修了する際にEBSを存続させるかどうかはEBSのDeleteOnTermination属性に基づいて決まる。

EC2

ユーザーデータ

インスタンス起動時に自動的に実行するスクリプトやコマンドを指定する機能

ヘルスチェック

Auto Scalingのヘルスチェックにはいくつかの種類がある。

  1. EC2ヘルスチェック

EC2が提供するデフォルトのヘルスチェックで、インスタンスがrunnning状態にあるかどうかチェックする。

  1. ELBヘルスチェック

ELBを使用する際に追加されるヘルスチェック。ELBは指定されたポートとパスに定期的にリクエストを送り、応答のステータスコードをチェックする。

Auto Scaling

  • ターゲットスケーリングポリシー
    • CPU使用率やネットワーク入力などの閾値を指定してスケーリングできる

AWS CloudWatch

CloudWatchにはさまざまなサービスがくっついている。

  1. メトリクス

EC2やRDSといったサービスのパフォーマンスを監視できる。

  1. アラーム

メトリクスが設定した閾値を超えたときに通知を行う機能。SNSと連携してメールを送ったりすることができる。

他にもAuto Scalingしたり、EC2の停止や再起動、Lambdaの実行もできる。

  1. ログ

EC2インスタンスのシステムログやLambdaの実行ログを収集することができる。

Amazon CloudWatch Container Insight

EKSやECSといったコンテナ化されたアプリケーションやマイクロサービスのメトリクスやログを収集できる。

AWS CloudTrail

ユーザーがリソースに対して行った設定などをログで管理できる。

AWS Data Pipeline

おそらくストレージ間のデータ移行などをスケジュールかできるようなイメージ。

移行する最中に変換したりすることもできる。

Amazon EMR

ビックデータフレームワークを簡単に実行して、膨大な量のデータを処理および分析できるようにするマネージド型クラスタープラットフォーム

大量のデータを変換して、S3やDynamoDBにデータを出し入れすることもできる。

Apache Spark

リアルタイムに高速にデータを処理するアプリを構築できる。

AWS Identity Center

AWSやSalesforce ,Office365などの外部アプリケーションとSSOを提供するサービス。

Active Directoryなどと統合して、AWSアカウントやアプリケーションへのアクセスを一元管理できる。 IAMポリシーやIAMロールを使って、ユーザーやグループごとにアクセス制御が可能

API Gateway

スロットリングの設定をすることで、APIアクセス数を制限することができる。

またキャッシュを保持することも可能で、同じリクエストに対してはキャッシュからレスポンスを返却するような設定が可能。

ELB

クロスゾーン負荷分散

複数のAZにEC2がまたがって設置されている場合でも、均等に負荷を分散する。

参考1

スティッキーセッション

同じユーザーのリクエストを同じEC2インスタンスに送信する。

Connection Draining

Auto Scalingなどによって、EC2がロードバランサーから削除される際に、現在処理中のリクエストが完了するまで待機する機能。

Route53

ルーティングポリシー

Route53ではいくつかのルーティングポリシーが存在している。

  1. シンプルルーティングポリシー

1つのドメインに対して、1つのIPアドレスが紐づけられている。

  1. フェイルオーバールーティングポリシー

メインに障害が発生した時に、サブにアクセスを振り分ける。

  1. 位置情報ルーティングポリシー

ユーザーの位置情報に基づいてルーティングする。

  1. 地理的接近性ルーティングポリシー

ユーザーとリソースの位置情報に基づいてルーティングするポリシー。

  1. レイテンシールーティングポリシー

レイテンシーが最も高いリージョンにルーティングする。

  1. IPベースのルーティングポリシー

IPアドレスに基づいてルーティングする。

  1. 複数値回答ルーティングポリシー

複数の中からランダムにルーティングする。

  1. 荷重ルーティングポリシー

指定した比率で複数のリソースにルーティングする。

公式 参考

エイリアスレコード

エイリアスレコードはRoute 53の特殊なDNSレコード。AWS内のCloudFront ディストリビューションやELB, S3の静的ホスティングに対してエイリアスを作成するために使う。

Aレコード

ドメインをIPv4アドレスにマッピングする。

AAAAレコード

ドメイン名をIPv6にマッピングする。

CNAMEレコード

ドメインを別のドメインに紐づける。

AWS SAM

サーバーレスに特化したCloudFormation的なやつ。デプロイとかテストを自動化できる。

Amazon Redshift

データウェアハウスサービス

COPYコマンドを実行することでS3からRedshift上にデータをコピーできる。雰囲気としては普通のRDSで、S3上のCSVをRDSのテーブル風味にできる。

Qiita

UNLOADでクエリ結果をS3にエクスポートできる。CSVやJSON形式でのエクスポートが可能。

Qiita

拡張VPCルーティングによって、通信をVPC内で行われるようにすることができる。インターネットを介さないため、セキュリティが向上する。

Amazon Redshift Spectrum

S3のファイルに対してクエリを実行して、構造化・半構造化されたデータを取得できる。

参考

公式

AWS DataSync

オンプレのデータストレージとクラウドストレージ間のデータを効率的に転送するためのサービス。

データ移行や継続的なデータ同期、バックアップの目的で利用される。

AWS CloudFormation

クラウドフォーメーションを使うことで、AWSをコードとして管理できる。

  • テンプレート: JSONやYAML形式で定義るす。どのリソースをどのように作成するか定義する。
  • スタック: テンプレートから作成されたAWSリソースの集合。

Amazon OpenSearch Service

ログ分析、リアルタイムアプリケーションモニタリング、クリックストリーム分析などのユースケース向け

Amazon CloudFront

エッジロケーションでファイルをgzip圧縮することができる

Amazon AppFlow

AppFlowはAWSとSaaS間のデータ転送フローを作成し、自動化するサービス。

Amazon EFS

標準ストレージクラスと低頻度ストレージクラスの2つのストレージクラスが存在している。

Amazon Textract

印刷されたテキスト、手書きの文字、レイアウト要素、データをあらゆるドキュメントから自動的に抽出する。

Amazon Comprehend

テキストからインサイトや関係性を発見するサービス。

AWS Glue

データのETLプロセスを自動化するマネージドサービス。大量のデータを抽出し、変換し、目的のデータストアにロードする作業を効率的に行うためのツール。

AWS Glueには以下の4つの機能がある

  • ETLジョブ
    • データソースからデータを抽出し、RedshiftやAthenaにデータを連携する。サーバーレスエンジンにて、実行することがデッキる。
    • Pythonベースのスクリプトを使って、ETLジョブを作成できる
    • ジョブはスケジュールに従って実行することもできる
  • データカタログ
    • データのメタデータを管理できる
    • データがどこにあり、どのように構造化されているか追跡できる

AWS Global Accelerator

リージョン間でのバランシングが可能となっている。

Amazon Transcrive

音声をテキストに変換するサービス。

PIIを有効にすることで、個人情報をマスキングできる。

Amazon Forcast

時系列予測サービス

AWS LakeFormation

データの権限管理を一元化し、組織全体及び外部との共有を容易にする機能。

S3とGlue Data Catalogの関連メタデータに対するアクセスコントロールを管理できる。