Practical Spark – Persistence (6)

Practical 시리즈는 AWS 환경 위에서 데이터 인프라를 구축하는데 참고할만한 내용들을 담고 있습니다. 이 글은 그 중 Practical Spark 의 한 챕터입니다.

이번 챕터에서는 Spark 를 이용해 데이터를 저장하기 위한 방법과 Parquet, Avro 같은 Columnar 및 Serialization 포맷을 다루고, JDBC Driver 를 통해 MySQL 등 RDB 에서 데이터를 읽고 쓸 때의 주의사항에 대해 알아봅니다.