EC2에서 데이터를 생성하고, 생성한 데이터가 Firehose에 정상적으로 수집되는지 확인해 봅니다.
앞서 생성한 EC2 인스턴스에 EC2 Connect 기능으로 SSH 접속을 합니다.
정상적으로 접속시 아래와 같은 화면이 나옵니다.
1.2 EC2 생성 및 설정 - 3. 참고 Connect 연결하는 방법
다음의 명령을 통해서 소스코드를 확인합니다.
코드의 내용은 banking_loss.csv 파일을 읽어서 1초 간격으로 Source 이름을 가진 Firehose에 record를 put으로 추가합니다.
cat firehose.py

python firehose.py

Firehose는 default로 prefix/year/month/day/hour/ 경로로 저장합니다. 이때 시간은 UTC를 따릅니다.