Booking.com 에서 온라인 실험을 제공하는 법 (요약)

요약 아시는 분들은 잘 아시겠지만, Booking.com 은 숙박 업계에서는 가장 큰 회사 중 하나입니다. Booking Holdings 계열사로 치면 Agoda, Priceline, Kayak, Retnalcars 등 숙박 뿐만 아니라 액티비티 / 교통 / 다이닝 (레스토랑) 플랫폼도 가지고 있습니다. 전 세계적으로 수 많은 사용자를 가지고 있고 글로벌 서비스를 제공하는 Booking.com 에서 10년 이상동안 온라인 실험을 (A/B 테스팅 등) 진행하면서 … Continue reading Booking.com 에서 온라인 실험을 제공하는 법 (요약)

Machine Learning 10 – Stochastic Gradient, Synthetic Data, Ceiling Analysis

이 글은 Coursera 에서 제공하는 Machine Learning 수업의 10 번째 챕터입니다. 이번 주에는 mini-batch, stochastic graident descent, online learning, map-reduce 등의 개념에 대해 배운다. Learning With Large Datasets (http://blog.csdn.net/linuxcumt) 왜 그렇게 큰 데이터 셋이 필요할까? 좋은 퍼포먼스를 얻기 위한 한 가지 방법이, low bias 알고리즘에 massive data 를 활용해 훈련하는 것이기 때문이다. (http://blog.csdn.net/linuxcumt) 그러나 커다란 … Continue reading Machine Learning 10 – Stochastic Gradient, Synthetic Data, Ceiling Analysis

Machine Learning 9 – Anomaly Detection, Recommender System

이 글은 Coursera 에서 제공하는 Machine Learning 수업의 9 번째 챕터입니다. 이번시간엔 anomaly detection 과 recommender system 을 배운다. Anomaly Dectection (http://blog.csdn.net/linuxcumt1) anomaly 는 정상집단에서 떨어진 데이터라 보면 된다. 공장에서 품질이 떨어지는 제품을 골라낼때 사용할 수 있는데, 위 그림은 비행기 엔진 공장을 예로 들어 설명한다. 데이터로부터 p(x) 를 만들어, 검사할 데이터가 threshold 를 넘는지 안넘는지 … Continue reading Machine Learning 9 – Anomaly Detection, Recommender System

Machine Learning 8 – K-means, PCA Details

이 글은 Coursera 에서 제공하는 Machine Learning 수업의 8 번째 챕터입니다. 이번시간에는 PCA 와 clustering 을 배운다. PCA 가 어떻게 돌아가는지 알기위해 covariance matrix, eigen decomposition, singular value decomposition 등의 배경지식도 익혀보자. ~~K-means 는 거들뿐 Unsupervised Learning Intro clustering 은 다양한 분야에 활용할 수 있다. Market Segmentation Social Network Analysis Organize Computing Clusters Astronomical Data … Continue reading Machine Learning 8 – K-means, PCA Details

Machine Learning 7 – Support Vector Machine (SVM)

이 글은 Coursera 에서 제공하는 Machine Learning 수업의 7 번째 챕터입니다. 이번시간에 Support Vector Machine, SVM 을 배운다. Optimization Objective 먼저 직관을 얻기 위해 logistic regression 의 sigmoid function 을 좀 보자. (http://blog.csdn.net/abcjennifer) y = 1 이면 0^Tx >> 0 이어야 h(x) 가 1 에 가까워 진다. 이제 cost function 에 h(x) 를 넣자. 그리고 … Continue reading Machine Learning 7 – Support Vector Machine (SVM)