들어가며
머신러닝 입문 위키팀 팀원분들 모두 안녕하세요. 이번 위키팀의 멘토를 맡게 된 입니다. 이번 5주간의 위키팀 활동을 통해 모든 팀원분들이 머신러닝 전반에 대한 이론적인 내용 뿐만 아니라 배운 내용을 코딩을 통해 실현할 수 있는 역량을 기를 수 있으면 좋겠습니다.
위키 팀 미팅 세부 일정
저희 팀 미팅은 매주 금요일 오후 2시-오후 5시에 왕십리 역 근처 스터디카페(구체적인 장소 미정)에서 진행됩니다.
커리큘럼
| 주차 | 학습 내용 개요 | 활용 라이브러리, 모듈, 깃허브 등 | 세부 내용 | 비고 |
|---|---|---|---|---|
| 1주차(1/27-2/3) | 머신러닝 개요 및 트렌드/판다스&넘파이 학습 보스턴 주택가격 예측 (1) | 판다스(Pandas) 넘파이(Numpy) | 데이터, 머신러닝 개요 넘파이, 판다스 학습 제반 툴(Github, Kaggle, AiHub, Colab, Dacon, Jupyter Notebook) 소개 및 사용 시각화, 전처리 기초 보스턴 주택가격 예측 EDA | 파이썬은 수업 전 팀원들 각자 예복습 매 수업의 추가 과제(optional)로는 Kaggle notebooks 중 제공 |
| 2주차(2/3-2/10) | 보스턴 주택가격 예측 (2) 타이타닉 생존자 예측 (1) | 싸이킷런(Scikit-learn) 맷플롯(Matplotlib) 시본(Seaborn) | 회귀분석 이론 설명 및 계수 근사 과정 소개 보스턴 주택 가격 예측 데이터셋 바탕으로 모델 코드 구현 및 설명 타이타닉 생존자 예측 시각화, 전처리 등 EDA | |
| 3주차(2/10-2/17) | 타이타닉 생존자 예측 (2) | 싸이킷런(Scikit-learn) 맷플롯(Matplotlib) 시본(Seaborn) | 여러 분류 모델 소개(KNN, Logistic Regression, GradientBoosting 등) 모델 성능 향상 방법론 소개 및 보스턴 주택가격 예측에 적용(Hyperparameter Tuning, Ensemble ) 타이타닉 생존자 예측 적용 코드 구현 | |
| 4주차(2/17-2/24) | 붓꽃 품종 군집화 | 싸이킷런(Scikit-learn) 맷플롯(Matplotlib) 시본(Seaborn) re | 차원 축소 이론 설명 및 코드 구현(PCA) 군집화 설명 군집화 모델 소개(K-Means, DBSCAN) 붓꽃 품종 군집화 코드 구현 정규식 기초 | 5주차를 위해 공공데이터포털에서 Open API 데이터 활용 신청해 보기 |
| 5주차(2/24-3/1) | 네이버 뉴스 기사를 통해 본 키워드 추출 및 워드클라우드 생성 | BeautifulSoup nltk re json yaml html xml konlpy wordcloud | 반, 비정형 데이터 처리 크롤링, 스크레이핑, Open API 다루기 네이버 뉴스 기사 크롤링 공모전, Kaggle 등 다양한 학습 방법 소개 및 활동 마무리 |
자료(코드, 데이터 등)
https://colab.research.google.com/drive/1pb6iyR1KVMFMElgQpxx5s3-4rri0D5YI?usp=sharing (1주차 과제 답안)
- 2주차
- 3주차
- 4주차
- 5주차
1주차 2주차 3주차 4주차 5주차
마치며
멘토가 열정적이라 매주 과제의 양이 상당히 많을 수 있습니다. 조금 힘드셔도 매주 주어진 과제를 성실히 수행해 주셨으면 좋겠어요. 학습 내용 관련하여 궁금한 것이 생기면 언제든지 질문해 주세요. 열심히 따라가다 보면 배울 수 있는 것이 정말 많을 것입니다.
