[핸즈온 머신러닝] Chapter 1. 한눈에 보는 머신러닝 연습 문제 풀이

1. 머신러닝을 어떻게 정의할 수 있나요?

머신러닝은 데이터로부터 학습하도록 컴퓨터를 프로그래밍하는 과학(또는 예술)이다.

2. 머신러닝이 도움을 줄 수 있는 문제 유형 네 가지를 말해보세요.

- 기존 솔루션으로는 많은 수동 조정과 규칙이 필요한 문제

- 전통적인 방식으로는 전혀 해결 방법이 없는 복잡한 문제

- 유동적인 환경

- 복잡한 문제와 대량의 데이터에서 통찰 얻기

3. 레이블된 훈련 세트란 무엇인가요?

각 샘플에 대해 원하는 정답을 가진 훈련 세트

4. 가장 널리 사용되는 지도 학습 작업 두 가지는 무엇인가요?

분류, 회귀

5. 보편적인 비지도 학습 작업 네 가지는 무엇인가요?

군집, 시각화, 차원 축소, 연관 규칙 학습

6. 사전 정보가 없는 여러 지형에서 로봇을 걸어가게 하려면 어떤 종류의 머신러닝 알고리즘을 사용할 수 있나요?

강화 학습

7. 고객을 여러 그룹으로 분할하려면 어떤 알고리즘을 사용해야 하나요?

그룹을 어떻게 정의할지 모른다면, 군집 알고리즘(비지도 학습)을 사용하고, 어떤 그룹으로 알아야 할지 안다면 분류 알고리즘(지도 학습)을 사용한다.

8. 스팸 감지의 문제는 지도 학습과 비지도 학습 중 어떤 문제로 볼 수 있나요?

지도 학습

9. 온라인 학습 시스템이 무엇인가요?

데이터를 순차적으로 한 개씩 또는 미니배치라 부르는 작은 묶음 단위로 주입하여 훈련시키는 시스템

10. 외부 메모리 학습이 무엇인가요?

컴퓨터 한 대의 메인 메모리에 들어갈 수 없는 아주 큰 데이터셋을 학습하는 시스템

11. 예측을 하기 위해 유사도 측정에 의존하는 학습 알고리즘은 무엇인가요?

인스턴스 기반 학습 시스템은 훈련 데이터를 기억하는 학습니다. 새로운 샘플이 주어지면 유사도 측정을 사용해 학습된 샘플 중에서 가장 비슷한 것을 찾아 예측으로 사용한다.

12. 모델 파라미터와 학습 알고리즘의 하이퍼파라미터 사이에는 어떤 차이가 있나요?

모델은 하나 이상의 파라미터를 사용해 새로운 샘플이 주어지면 무엇을 예측할지 결정한다. 학습 알고리즘은 모델이 새로운 샘플에 잘 일반화되도록 이런 파라미터들의 최적 값을 찾는다. 하이퍼파라미터는 모델이 아니라 이런 학습 알고리즘 자체의 파라미터이다.

13. 모델 기반 알고리즘이 찾는 것은 무엇인가요? 성공을 위해 이 알고리즘이 사용하는 가장 일반적인 전략은 무엇인가요? 예측은 어떻게 만드나요?

모델 파라미터의 최적값을 차는다. 예측을 하려면 학습 알고리즘이 찾은 파라미터를 사용하는 모델의 예측 함수에 새로운 샘플의 특성을 주입한다.

14. 머신러닝의 주요 도전 과제는 무엇인가요?

낮은 데이터 품질, 부족한 데이터, 대표성 없는 데이터, 무의미한 특성, 과대적합, 과소적합

15. 모델이 훈련 데이터에서의 성능은 좋지만 새로운 샘플에서의 일반화 성능이 나쁘다면 어떤 문제가 있는 건가요? 가능한 해결책 세 가지는 무엇인가요?

- 과대적합 문제

- 파라미터 수가 적은 모델을 선택하거나, 훈련 데이터에 있는 특성 수를 줄이거나, 모델에 제약을 가햐여 단순화시킨다.

- 훈련 데이터를 더 많이 모은다.

- 훈련 데이터의 잡음을 줄인다.(ex. 오류 데이터 수정과 이상치 제거)

16. 테스트 세트가 무엇이고 왜 사용해야 하나요?

- 훈련 세트를 사용해 훈련된 모델을 평가하는 세트. 일반화 오차에 대한 추정값을 얻을 수 있으며, 이전에 본 적이 없는 새로운 샘플에 모델이 얼마나 잘 작동할지 알려준다.

17. 검증 세트의 목적은 무엇인가요?

- 모델을 비교하는 데 사용된다. 가장 좋은 모델을 고르고 하이퍼파라미터를 튜닝한다.

18. 테스트 세트를 사용해 하이퍼파라미터를 튜닝하면 어떤 문제가 생기나요?

모델과 하이퍼파라미터가 테스트 세트에 최적화도니 모델이 만들어져, 새로운 데이터에 잘 작동하지 않을 수 있다.

19. 교차 검증이 무엇이고, 왜 하나의 검증 세트보다 선호하나요?

- 후련 세트를 여러 서브셋으로 나누고 각 모델을 이 서브셋의 조합으로 훈련시키고 나머지 부분으로 검증하는 방법이다. 훈련 데이터에서 검증 세트로 너무 많은 양의 데이터를 뺏기지 않기 위해 사용한다.

https://book.naver.com/bookdb/book_detail.nhn?bid=13541863

핸즈온 머신러닝

인공지능 분야에 종사한다면 반드시 읽어야 하는 머신러닝 전문가로 이끄는 최고의 실전 지침서!최근의 눈부신 혁신들로 딥러닝은 머신러닝 분야 전체를 뒤흔들고 있습니다. 이제 이 기술을 거

book.naver.com

저작자표시

'공부기록 > 데이터분석 | 개발 공부' 카테고리의 다른 글

[코틀린] 스파르타코딩클럽 안드로이드 앱개발 기초_1주차 (0)	2021.07.16
[인공지능] 인공지능 혁신학교 AIFFEL 1기 후기 (5)	2021.06.29
[태블로] TWBX 태블로 커뮤니티 후기 (0)	2021.05.27
[태블로] TWBX 1기 Tableau 라이브 강의 (2) 지역별 연간 인구수 변화 (0)	2021.05.14
[태블로] TWBX 1기 Tableau 라이브 강의 (1) 나이키 연간 수익률 (0)	2021.05.14