Machine Learning 10 – Stochastic Gradient, Synthetic Data, Ceiling Analysis

이 글은 Coursera 에서 제공하는 Machine Learning 수업의 10 번째 챕터입니다. 이번 주에는 mini-batch, stochastic graident descent, online learning, map-reduce 등의 개념에 대해 배운다. Learning With Large Datasets (http://blog.csdn.net/linuxcumt) 왜 그렇게 큰 데이터 셋이 필요할까? 좋은 퍼포먼스를 얻기 위한 한 가지 방법이, low bias 알고리즘에 massive data 를 활용해 훈련하는 것이기 때문이다. (http://blog.csdn.net/linuxcumt) 그러나 커다란 … Continue reading Machine Learning 10 – Stochastic Gradient, Synthetic Data, Ceiling Analysis

Machine Learning 9 – Anomaly Detection, Recommender System

이 글은 Coursera 에서 제공하는 Machine Learning 수업의 9 번째 챕터입니다. 이번시간엔 anomaly detection 과 recommender system 을 배운다. Anomaly Dectection (http://blog.csdn.net/linuxcumt1) anomaly 는 정상집단에서 떨어진 데이터라 보면 된다. 공장에서 품질이 떨어지는 제품을 골라낼때 사용할 수 있는데, 위 그림은 비행기 엔진 공장을 예로 들어 설명한다. 데이터로부터 p(x) 를 만들어, 검사할 데이터가 threshold 를 넘는지 안넘는지 … Continue reading Machine Learning 9 – Anomaly Detection, Recommender System

Machine Learning 8 – K-means, PCA Details

이 글은 Coursera 에서 제공하는 Machine Learning 수업의 8 번째 챕터입니다. 이번시간에는 PCA 와 clustering 을 배운다. PCA 가 어떻게 돌아가는지 알기위해 covariance matrix, eigen decomposition, singular value decomposition 등의 배경지식도 익혀보자. ~~K-means 는 거들뿐 Unsupervised Learning Intro clustering 은 다양한 분야에 활용할 수 있다. Market Segmentation Social Network Analysis Organize Computing Clusters Astronomical Data … Continue reading Machine Learning 8 – K-means, PCA Details

Machine Learning 7 – Support Vector Machine (SVM)

이 글은 Coursera 에서 제공하는 Machine Learning 수업의 7 번째 챕터입니다. 이번시간에 Support Vector Machine, SVM 을 배운다. Optimization Objective 먼저 직관을 얻기 위해 logistic regression 의 sigmoid function 을 좀 보자. (http://blog.csdn.net/abcjennifer) y = 1 이면 0^Tx >> 0 이어야 h(x) 가 1 에 가까워 진다. 이제 cost function 에 h(x) 를 넣자. 그리고 … Continue reading Machine Learning 7 – Support Vector Machine (SVM)

Machine Learning 6 – Practical Advices

이 글은 Coursera 에서 제공하는 Machine Learning 수업의 6 번째 챕터입니다. 지난시간엔 back propagation 구현해 보고 여기에 적용할 수 있는 소소한 것들 random initialization 과 gradient checking 등도 알아 보았다. 머신러닝을 단순히 아는것과, 실전에서 사용할 수 있다는 건 큰 차이가 있다. 이번 시간에는 실전에서 필요한 여러가지 팁들에 대해 설명한다. 후반부에서는 스팸 분류기를 통해 간단한 머신러닝 … Continue reading Machine Learning 6 – Practical Advices