본문 바로가기

23년 2학기 학교공부/기계학습

[ML] 기계학습이란?

목차

    728x90
    반응형
    SMALL

    📁 기계학습(Machine Learning)

     

    Mitchell에 따르면, 기계학습이란 tasks(작업) T에 대한 performance(성능) P가 experience(경험) E를 통해 성장하는 컴퓨터 프로그램을 말한다.

     

    예를 들어 단순 계산과 같은 task는 수많은 experience, 즉 수많은 계산을 수행하더라도 성능이 향상되지 않으므로 기계학습이 아니다.

     

     

    분류 task를 살펴보자.

     

    위 그림처럼 프로그래머가 if문으로 분기나 조건을 모두 설정한 프로그램은 수많은 experience을 겪더라도, 즉 수많은 데이터를 분류하더라도 설정된 조건에 맞추어 분류하는 것 뿐 프로그램 자체의 성능이 향상되지 않으므로 기계학습이 아니다.

     

     

     

    하지만 위 그림에서는 trained model이 수많은 숫자를 분류함으로써 사람이 말로 표현할 수 없는 Relation을 직접 학습하며, 해당 모델에 training data가 많으면 많을수록 더 정확한 relation을 알 수 있다. 이러한 프로그램은 experience를 통해 performance를 향상시킬 수 있으므로 기계학습이다.

     

     

    즉, 전통적인 프로그래밍은 Program과 Data를 가지고 Output을 도출하는 것과 달리, 기계학습은 Data와 미리 구한 Output 사이의 관계를 학습하여 Program을 도출한다는 차이점이 있다.

     

     

     

     

    📁 Task, T

     

    Task란 사람이 작성한 고정된 프로그램으로 해결하기에는 어려운 작업을 말한다.

     

    기계학습 시스템이 하나의 example을 처리하는 방식.

     

     

    이때 example이란 정량적으로 설명되는 feature들의 모음을 말한다.

     

     

     

     

    🌱 Machine Learning Tasks 종류

     

    기계학습 task는 Supervised Learning, Unsupervised Learning, Reinforcement Learning의 세 종류로 구분할 수 있다.

     

     

    1. Supervised Learning(지도 학습)

    지도학습이란 data와 desired output이 주어지며, 둘 사이의 관계를 학습하는 것을 말한다.

     

    이때 desired output이 이산적인지, 연속적인지에 따라 Classification, Regression으로 분류될 수 있다.

     

     

    📝 Classification

    지도 학습 중에서 output이 이산적인 경우에 해당한다.

     

    output이 꼭 binary하게 0과 1로만 나눠지는 것이 아니라, 0부터 9까지의 손글씨를 구분하는 예시처럼 결과가 이산적이기만 하다면 classification이라고 말할 수 있다.

     

    • binary class : (input) 0 / 1 ➡ (output) 0 / 1 중 하나
    • multi-class : (input) 0 ~ 9 ➡ (output) 0 ~ 9 중 하나
    • multi-label : (input) 0 ~ 9 ➡ (output) 0, 3, 4 / 1, 4, 6 등 0 ~ 9 중 여러개

     

    예를 들면, 위 그림에서 desired output 및 output은 +1 혹은 -1으로 이산적이다.

     

     

    classfication 알고리즘에는 Bayesian classifier, Neural networks, Support vector machine, Decision tree, k-nearest neighbors 등이 있다.

     

     

     

    📝 Regression

    지도 학습 중에서 output이 연속적인 경우에 해당한다.

     

     

    예를 들면, 위 그림에서 data를 살펴보면 y = 3x+1라는 선형함수로 표현될 수 있는 연속적인 output을 갖고있다.

     

    Regression 알고리즘에는 Linear regression, Multivariate linear regression, Lasso and Ridge linear regression, Neural network regression, Support vector regression, Decision tree regression 등이 있다.

     

     

     

     

    2. Unsupervised Learning(비지도학습)

     

    비지도학습이란 desired output 없이 data만 가지고 data들 사이의 관계나 규칙을 학습하는 것을 말한다.

     

    대표적으로 Clustering이 있다.

     

     

    📝 Clustering

    Clustering이란. .

     

     

     

    3. Reinforcement Learning(강화학습)

     

    강화학습이란 

     

    강화학습의 순서는 다음과 같다.

     

    1) Agent

     

     

     

     

    📁 Performance, P

     

     

     

     

    728x90
    반응형
    LIST