Practical Spark – DataFrame (5)

Practical 시리즈는 AWS 환경 위에서 데이터 인프라를 구축하는데 참고할만한 내용들을 담고 있습니다. 이 글은 그 중 Practical Spark 의 한 챕터입니다.

이번 챕터에서는 DataFrame 을 사용해보며 실제 Case 를 바탕으로 문제를 해결해봅니다. 이 과정에서 Window Function 을 사용해보고, Attribution 과 Session 을 만드는 방법을 배웁니다.

Practical Spark – Architecture (4)

Practical 시리즈는 AWS 환경 위에서 데이터 인프라를 구축하는데 참고할만한 내용들을 담고 있습니다. 이 글은 그 중 Practical Spark 의 한 챕터입니다.

이번 챕터에서는 Spark 내 구성 요소와 Architecture 에 대해 익혀보며 Spark 가 어떻게 동작하는지 알아보겠습니다. 다루는 주제는 Driver, Executor, Cluster Manager 입니다.

Practical Spark – Concept (3)

Practical 시리즈는 AWS 환경 위에서 데이터 인프라를 구축하는데 참고할만한 내용들을 담고 있습니다. 이 글은 그 중 Practical Spark 의 한 챕터입니다.

이번 챕터에서는 Spark 의 컨셉에 대해 알아보며 Spark 내부 동작에 대해 이해해보겠습니다. 다루는 주제는 Transformation, Action, Shuffle 등입니다.