일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
- 클러스터형인덱스
- 혼공S
- 책리뷰
- 보조인덱스
- 유럽여행
- Jupyter notebook
- digital marketing
- Github
- 제주2주살이
- 스토어드 프로시저
- GenAI
- 오블완
- 독후감
- 영국여행
- 디지털마케팅
- SQL
- 런던
- 제주도
- 스플라인
- R
- Linux
- PRML
- 혼자공부하는SQL
- 에이바우트
- 티스토리챌린지
- RStudio
- 김호연작가
- 제주도여행
- 맛집
- PRIMARY KEY
- Today
- Total
Soy Library
[PRML] Ch1-(0). 소개 본문
기본 용어
패턴인식(pattern recognition)은 컴퓨터 알고리즘을 활용하여 데이터의 규칙성을 자동적으로 찾아내고, 이 규칙성을 이용하여 데이터를 각각의 카테고리로 분류하는 등의 일을 하는 분야이다. 손글씨로 쓰인 숫자를 각각 해당되는 숫자로 분류하는 것과 같은 것이 하나의 예시가 될 수 있겠다.
머신러닝은 이러한 분석에 좀 더 효과적인 결과를 가져다준다. 머신러닝에서 우리는 훈련집합(training set)을 이용하여 변경 가능한 모델의 매개변수들을 조절하는 등의 훈련단계(학습단계)를 거쳐 적절한 모델을 선택하게 된다. 그 후에 시험집합(testing set)에 그 모델을 적용시켜 보아 모델의 성능을 파악한다. 이때 훈련단계에서 사용되지 않았던 새로운 예시들을 올바르게 분류하는 능력을 일반화(generalization) 성능이라고 한다.
모델을 적합시키기 위해서는 원래의 입력 변수들을 전처리(preprocessed)하여 새로운 변수 공간으로 전환시켜야 한다. 이는 패턴 인식 알고리즘이 각각의 클래스를 구별해 내기가 더 쉬워지도록 하고 또한 계산 과정을 빠르게 하기 위해서다. 이는 특징추출(feature extraction)이라고 불리기도 한다. 입력 변수들의 차원이 크다면 최소한의 필요한 정보만을 남기고 나머지는 버리게 된다. 이를 차원감소(dimensionality reduction)라고 한다.
주어진 훈련 데이터가 입력 벡터와 그에 해당하는 표적 벡터로 이루어지는 문제들을 지도학습(supervised learning)이라고 한다. 이때 입력 벡터를 분리된 카테고리 중 하나에 할당시키는 지도학습은 분류(classification)이다. 그리고 기대되는 출력값이 하나 또는 그 이상의 연속된 값일 경우에는 회귀(regression)라고 한다.
위와는 달리 표적 벡터가 없는 경우는 비지도학습(unsupervised learning)이라고 한다. 여기에는 비슷한 예시들의 집단을 찾는 집단화(clustering)문제, 입력 공간에서 데이터의 분포를 찾는 밀도 추정(density estimation) 문제, 높은 차원의 데이터를 이차원 또는 삼차원에 투영하여 이해하기 쉽게 만들어 보여주는 시각화(visualization)등이 있다.
머신러닝, 딥러니을 배운 후에는 강화학습(reinforcement)를 배울 수도 있다. 이는 주어진 상황에서 보상을 최대화하기 위한 행동을 찾는 문제를 푸는 방법이다. 여기에는 입력값과 최적의 출력값을 예시로 주지 않는다. 강화학습 과정에서 시행착오를 통해 직접 찾아내게 된다. 일반적으로 강화학습에는 탐사(exploratoin)와 이용(exploitation) 간에 trade-off가 있다. 이 둘 중 어느 하나에만 집중하는 알고리즘은 좋은 결과를 내지 못할 것이다.
Reference
Pattern Recognition and Machine Learning, Christopher M.Bishop
패턴인식과 머신러닝, 크리스토퍼 비숍, 김형진 옮김.
'Study > PRLM' 카테고리의 다른 글
[PRML] Ch1-(1). 예시:다항식 곡선 피팅 (0) | 2020.09.13 |
---|