데이터 준비

실습 소개

본 실습은 임의의 데이터를 생성하기 위한 환경을 구성합니다.

임의의 데이터를 만들기 위해 EC2 인스턴스를 생성합니다.
EC2 인스턴스를 생성할 때 User Data에 쉘 크립트를 이용해서 관련 라이브러리와 소스코드를 설치합니다.
EC2에서 생성된 데이터는 Python SDK(boto) 를 이용해서 Kinesis로 전송합니다.
EC2에서 Kinesis로 접근하기 위한 권한을 부여하기 위하여 IAM에서 생성한 User의 Credentials 정보를 EC2에 설정합니다.
생성된 데이터는 S3(Data Lake) 로 쌓을 것입니다. 따라서 데이터를 수집하기 위한 S3 버킷을 하나 생성합니다.

아키텍처 소개

실습 아키텍처

실습 순서