AWS SAA用語集
2024-07-27目次
- Amazon VPC
- RDS
- Amazon ElastiCache
- Amazon Kinesis
- AWS Storage Gateway
- DynamoDB
- AWS Shield
- AWS Secrets Manager
- AWS S3
- AWS SQS
- AWS Direct Connect
- AWS DLM
- AWS EBS
- AWS EBS
- EC2
- AWS CloudWatch
- AWS CloudTrail
- AWS Data Pipeline
- Amazon EMR
- AWS Identity Center
- API Gateway
- ELB
- Route53
- AWS SAM
- Amazon Redshift
- AWS DataSync
- AWS CloudFormation
- Amazon OpenSearch Service
- Amazon CloudFront
- Amazon AppFlow
- Amazon EFS
- Amazon Textract
- Amazon Comprehend
- AWS Glue
- AWS Global Accelerator
- Amazon Transcrive
- Amazon Forcast
- AWS LakeFormation
Amazon VPC
VPCフローログ
VPCのネットワークインターフェイスとの間で行き来するIPトラフィックに関する情報をキャプチャできるようにする機能。フローログデータはAmazon CloudWatch Logs、Amazon S3、Amazon Data Firehoseに発行できる。
セキュリティグループ
セキュリティグループにはIngress(インバウンド)、Egress(アウトバウンド)のルールを設定することができる。
インターフェイスエンドポイント
IPアドレスを持って、vpcのなかにエンドポイントができる
ゲートウェイエンドポイント
S3とDynamoDBが対応していて、ルートテーブルでの設定が必要
RDS
IAM認証調べる(やってみるかも?)
Amazon ElastiCache
データのキャッシュサービス。以下の2種類が存在する。
- ElastiCache for Memcached
- ElastiCache for Redis
基本的にRedisの方が多機能であるため、多くの場合はElastiCacheが使われている。
RDSの読み込み速度が遅くなっている時に、頻繁に呼び出されるデータをElastiCacheにキャッシュしておくことで、RDSの負担を軽減できる。
RDSに問い合わせるか、ElastiCacheに問い合わせるかはアプリケーション側で制御する必要がある。またELastiCacheにどのようなデータをキャッシュしておくかもアプリケーション側で制御する。
参考
Amazon Kinesis
Kinesisには2つの種類がある。どちらもログやイベントデータなどの大量のデータを高速に別サービスに転送するためのサービス。
- Kinesis Data Streams : 高速, リアルタイム性に優れている
- Kinesis Data Firehose: 設定が少ない, RedShiftやS3に流し込むサービスで分析に向いている
上記の他にKinesis Data Analyticsもあり、上記2つから送られてくるデータをSQLを使って処理できるサービス。
参考
AWS Storage Gateway
オンプレとAWSのストレージを繋ぐサービスで、低レイテンシーで繋ぎバックアップデータをAWS上に保管することが可能。
以下の3つのタイプに分かれている。
- ファイルゲートウェイ
- ボリュームゲートウェイ
- テープゲートウェイ
ボリュームゲートウェイ
ボリュームゲートウェイはさらに2つに分かれていて、キャッシュ型と保管型に別れている。
キャッシュ型は以下のような特徴がある
- プライマリはS3
- 頻繁にアクセスされるデータをオンプレにキャッシュしておく
保管型はこんな特徴
- プライマリはオンプレ
- ローカルに保存しながら、非同期でS3にも保存する
DynamoDB
DynamoDBは要件に応じてキャパシティモードの選択が可能
- オンデマンドモード
- 利用するキャパが予想できない時に使用する
- リクエスト数に応じて課金される
- 自動スケーリングされる
- プロビジョニングモード
- 利用キャパが予測できる時に利用する
- 事前に予測した書き込みキャパシティユニットと読み込みキャパシティユニットを設定し、設定に応じて課金される
- キャパシティユニットは後から増やすことができる
ストリーム
またDynamoDBにはストリーム機能がある。
ストリーム機能ではDynamoDBの変更を最大24時間保存しておくことができる。またLambdaなどと連携することで、DynamoDBに変更があった場合にLambdaを起動して処理を走らせるというようなことができる。
オートスケーリング
DynamoDBはオートスケーリング機能もあり、負荷に応じて自動でスケーリングできる。
DAX
DynamoDB AcceleratorはDynamoDBのインメモリキャッシュサービス。
読み取り速度が劇的に向上する。
グローバルテーブル
グローバルテーブルを使うことで、指定した複数のAWSリージョンでDynamoDBテーブルがレプリケートされる。
どこかのリージョンのDynamoDBに対して書き込みを行うと、自動で同じデータが他のリージョンにもコピーされる。
ポイントインタイムリカバリ
AWS Shield
DDoS攻撃に対応するサービスで、2つのレベルがある
- Standard: 無料で利用可能
- Advanced: 有料
AWS Secrets Manager
データベースなどの認証情報を安全に暗号化してシークレットとして保管・取得することができる。
ライフサイクル機能があるので、シークレットをローテーションすることができる。
AWS S3
オブジェクトロック機能を使うことで、変更や削除が不可能になる。バケット作成時にしか適応できない。
オブジェクトロックには以下2つのモードがある
- ガバナンスモード: 管理者やルートユーザーなどの特別なユーザー以外は変更や削除をすることができない
- コンプライアンスモード: ルートユーザー含め全てのユーザーが変更や削除ができない
ストレージクラス
- One Zone-IA
アクセスが頻繁ではない&重要ではないデータを保存する際に向いていて、安価に利用できる。
データの取得は即時に行えるが、取得時には課金される。
ストレージクラス分析
ストレージクラス分析を使用することで、オブジェクトのアクセスパターンを分析し、結果をCSVファイルとして取得できる。
Amazon S3 分析のストレージクラス分析を使用することにより、ストレージアクセスパターンを分析し、適切なデータをいつ適切なストレージクラスに移行すべきかを判断できます。
リクエスタ支払い機能
バケットに対するリクエストによって発生する料金をリクエストしたユーザーに支払わせることができる設定。
マルチパートアップロード
大容量のデータを分割してアップロードする機能。効果としてスループットの向上が挙げられる。
S3 Select
csvなどの単一のファイルに対してsqlを実行できるような機能。
AWS SQS
可視性タイムアウトを設定することで、一つのコンシューマーがメッセージを処理している間、設定された時間他のコンシューマーはメッセージを見ることができない。
キューに優先度をつけることが可能
デッドレターキュー
エラーによって処理できなかったメッセージを一時的に保存そる特別なメッセージキュー。
メッセージ保存期間
デフォルトで4日間メッセージは保存される。設定の変更は可能で60秒から14日間の間で設定可能。
AWS Direct Connect
AWS Direct Connectでは専用線を使って、インターネットを介さずに直接AWSのネットワーク環境と接続できる。そのためセキュリティが高く、通信料も安く済む。
AWS DLM
DLMを使用することで、EBSスナップショットとEBS-backed AMIの作成、保持、削除を自動化できる。
AWS EBS
EC2インスタンスを修了する際にEBSを存続させるかどうかはEBSのDeleteOnTermination属性に基づいて決まる。 EBSのバックアップであるスナップショットを作成・保存・削除を自動化するスケジュールを設定できる
AWS EBS
EC2インスタンスを修了する際にEBSを存続させるかどうかはEBSのDeleteOnTermination属性に基づいて決まる。
EC2
ユーザーデータ
インスタンス起動時に自動的に実行するスクリプトやコマンドを指定する機能
ヘルスチェック
Auto Scalingのヘルスチェックにはいくつかの種類がある。
- EC2ヘルスチェック
EC2が提供するデフォルトのヘルスチェックで、インスタンスがrunnning状態にあるかどうかチェックする。
- ELBヘルスチェック
ELBを使用する際に追加されるヘルスチェック。ELBは指定されたポートとパスに定期的にリクエストを送り、応答のステータスコードをチェックする。
Auto Scaling
- ターゲットスケーリングポリシー
- CPU使用率やネットワーク入力などの閾値を指定してスケーリングできる
AWS CloudWatch
CloudWatchにはさまざまなサービスがくっついている。
- メトリクス
EC2やRDSといったサービスのパフォーマンスを監視できる。
- アラーム
メトリクスが設定した閾値を超えたときに通知を行う機能。SNSと連携してメールを送ったりすることができる。
他にもAuto Scalingしたり、EC2の停止や再起動、Lambdaの実行もできる。
- ログ
EC2インスタンスのシステムログやLambdaの実行ログを収集することができる。
Amazon CloudWatch Container Insight
EKSやECSといったコンテナ化されたアプリケーションやマイクロサービスのメトリクスやログを収集できる。
AWS CloudTrail
ユーザーがリソースに対して行った設定などをログで管理できる。
AWS Data Pipeline
おそらくストレージ間のデータ移行などをスケジュールかできるようなイメージ。
移行する最中に変換したりすることもできる。
Amazon EMR
ビックデータフレームワークを簡単に実行して、膨大な量のデータを処理および分析できるようにするマネージド型クラスタープラットフォーム
大量のデータを変換して、S3やDynamoDBにデータを出し入れすることもできる。
Apache Spark
リアルタイムに高速にデータを処理するアプリを構築できる。
AWS Identity Center
AWSやSalesforce ,Office365などの外部アプリケーションとSSOを提供するサービス。
Active Directoryなどと統合して、AWSアカウントやアプリケーションへのアクセスを一元管理できる。 IAMポリシーやIAMロールを使って、ユーザーやグループごとにアクセス制御が可能
API Gateway
スロットリングの設定をすることで、APIアクセス数を制限することができる。
またキャッシュを保持することも可能で、同じリクエストに対してはキャッシュからレスポンスを返却するような設定が可能。
ELB
クロスゾーン負荷分散
複数のAZにEC2がまたがって設置されている場合でも、均等に負荷を分散する。
スティッキーセッション
同じユーザーのリクエストを同じEC2インスタンスに送信する。
Connection Draining
Auto Scalingなどによって、EC2がロードバランサーから削除される際に、現在処理中のリクエストが完了するまで待機する機能。
Route53
ルーティングポリシー
Route53ではいくつかのルーティングポリシーが存在している。
- シンプルルーティングポリシー
1つのドメインに対して、1つのIPアドレスが紐づけられている。
- フェイルオーバールーティングポリシー
メインに障害が発生した時に、サブにアクセスを振り分ける。
- 位置情報ルーティングポリシー
ユーザーの位置情報に基づいてルーティングする。
- 地理的接近性ルーティングポリシー
ユーザーとリソースの位置情報に基づいてルーティングするポリシー。
- レイテンシールーティングポリシー
レイテンシーが最も高いリージョンにルーティングする。
- IPベースのルーティングポリシー
IPアドレスに基づいてルーティングする。
- 複数値回答ルーティングポリシー
複数の中からランダムにルーティングする。
- 荷重ルーティングポリシー
指定した比率で複数のリソースにルーティングする。
エイリアスレコード
エイリアスレコードはRoute 53の特殊なDNSレコード。AWS内のCloudFront ディストリビューションやELB, S3の静的ホスティングに対してエイリアスを作成するために使う。
Aレコード
ドメインをIPv4アドレスにマッピングする。
AAAAレコード
ドメイン名をIPv6にマッピングする。
CNAMEレコード
ドメインを別のドメインに紐づける。
AWS SAM
サーバーレスに特化したCloudFormation的なやつ。デプロイとかテストを自動化できる。
Amazon Redshift
データウェアハウスサービス
COPYコマンドを実行することでS3からRedshift上にデータをコピーできる。雰囲気としては普通のRDSで、S3上のCSVをRDSのテーブル風味にできる。
UNLOADでクエリ結果をS3にエクスポートできる。CSVやJSON形式でのエクスポートが可能。
拡張VPCルーティングによって、通信をVPC内で行われるようにすることができる。インターネットを介さないため、セキュリティが向上する。
Amazon Redshift Spectrum
S3のファイルに対してクエリを実行して、構造化・半構造化されたデータを取得できる。
参考
AWS DataSync
オンプレのデータストレージとクラウドストレージ間のデータを効率的に転送するためのサービス。
データ移行や継続的なデータ同期、バックアップの目的で利用される。
AWS CloudFormation
クラウドフォーメーションを使うことで、AWSをコードとして管理できる。
- テンプレート: JSONやYAML形式で定義るす。どのリソースをどのように作成するか定義する。
- スタック: テンプレートから作成されたAWSリソースの集合。
Amazon OpenSearch Service
ログ分析、リアルタイムアプリケーションモニタリング、クリックストリーム分析などのユースケース向け
Amazon CloudFront
エッジロケーションでファイルをgzip圧縮することができる
Amazon AppFlow
AppFlowはAWSとSaaS間のデータ転送フローを作成し、自動化するサービス。
Amazon EFS
標準ストレージクラスと低頻度ストレージクラスの2つのストレージクラスが存在している。
Amazon Textract
印刷されたテキスト、手書きの文字、レイアウト要素、データをあらゆるドキュメントから自動的に抽出する。
Amazon Comprehend
テキストからインサイトや関係性を発見するサービス。
AWS Glue
データのETLプロセスを自動化するマネージドサービス。大量のデータを抽出し、変換し、目的のデータストアにロードする作業を効率的に行うためのツール。
AWS Glueには以下の4つの機能がある
- ETLジョブ
- データソースからデータを抽出し、RedshiftやAthenaにデータを連携する。サーバーレスエンジンにて、実行することがデッキる。
- Pythonベースのスクリプトを使って、ETLジョブを作成できる
- ジョブはスケジュールに従って実行することもできる
- データカタログ
- データのメタデータを管理できる
- データがどこにあり、どのように構造化されているか追跡できる
AWS Global Accelerator
リージョン間でのバランシングが可能となっている。
Amazon Transcrive
音声をテキストに変換するサービス。
PIIを有効にすることで、個人情報をマスキングできる。
Amazon Forcast
時系列予測サービス
AWS LakeFormation
データの権限管理を一元化し、組織全体及び外部との共有を容易にする機能。
S3とGlue Data Catalogの関連メタデータに対するアクセスコントロールを管理できる。