Practical 시리즈는 AWS 환경 위에서 데이터 인프라를 구축하는데 참고할만한 내용들을 담고 있습니다. 이 글은 그 중 Practical Spark 의 한 챕터입니다.
이번 챕터에서는 Spark 내 구성 요소와 Architecture 에 대해 익혀보며 Spark 가 어떻게 동작하는지 알아보겠습니다. 다루는 주제는 Driver, Executor, Cluster Manager 입니다.
Author: 1ambda
Practical Spark – Concept (3)
Practical 시리즈는 AWS 환경 위에서 데이터 인프라를 구축하는데 참고할만한 내용들을 담고 있습니다. 이 글은 그 중 Practical Spark 의 한 챕터입니다.
이번 챕터에서는 Spark 의 컨셉에 대해 알아보며 Spark 내부 동작에 대해 이해해보겠습니다. 다루는 주제는 Transformation, Action, Shuffle 등입니다.
Practical Spark – Tutorial (2)
Practical 시리즈는 AWS 환경 위에서 데이터 인프라를 구축하는데 참고할만한 내용들을 담고 있습니다. 이 글은 그 중 Practical Spark 의 한 부분입니다.
이번 챕터에서는 기본적인 DataFarme 의 사용법을 알아보며 Spark 를 익혀보겠습니다. 다루는 주제는 DataFrame, Dataset 그리고 Spark SQL 입니다.
Practical Spark – Intro (1)
Practical 시리즈는 AWS 환경 위에서 데이터 인프라를 구축하는데 참고할만한 내용들을 담고 있습니다. 이 글은 그 중 Practical Spark 의 한 챕터입니다.
이번 챕터에서는 Spark 가 무엇인지, 어떤 기능들을 제공하는지 살펴보며 Spark 에 익숙해지는 시간을 가져보겠습니다.
Booking.com 에서 온라인 실험을 제공하는 법 (요약)
요약 아시는 분들은 잘 아시겠지만, Booking.com 은 숙박 업계에서는 가장 큰 회사 중 하나입니다. Booking Holdings 계열사로 치면 Agoda, Priceline, Kayak, Retnalcars 등 숙박 뿐만 아니라 액티비티 / 교통 / 다이닝 (레스토랑) 플랫폼도 가지고 있습니다. 전 세계적으로 수 많은 사용자를 가지고 있고 글로벌 서비스를 제공하는 Booking.com 에서 10년 이상동안 온라인 실험을 (A/B 테스팅 등) 진행하면서 … Continue reading Booking.com 에서 온라인 실험을 제공하는 법 (요약)

