티스토리 뷰

@markdown

#머신러닝 용어 정리

*지도학습, 강화학습, 전이학습,   딥러닝


## 지도학습

 * 말 그대로 컴퓨터에게 엄청나게 많은 데이터를 줘서 패턴을 (합리적인 수학적 방법으로) 찾는 방법이에요. 예를들어 (1,2),(2,4),(3,6),...(20000,40000)의 데이터를 준 다음, 컴퓨터한테 나름의 합리적인 추론을 하게 해서 모르는 문제에 대해 답을 얻는 것입니다. 1~20000까지 학습을 했으니까 (20000,Y)에서 Y=?을 자기가 학습한 데이터를 바탕으로 추론할 수 있게 되는거죠. 이런 방법을 지도학습이라고 해요.


 


## 강화학습

 * 강화학습은 위의 지도학습처람 이건 맞아, 이건 틀려! 같은 명확한 정해가 존재하지 않고, 얻을 수 있는 보상의 양만 알 수 있을 때 사용하는 방법이에요. 즉, 얻을 수 있는 보상을 최대로 하는 방향으로 피드백이라던가 여러 방법의 학습을 하는거에요.


* 예를 들자면, 애니메이션 취향을 결정하는 강화학습이라고 합시다. 맨 처음 볼 수 있는 애니메이션이 우마무스메 아니면 짱구밖에 없다고 해봅시다. 우마무스메는 경마 후 아이돌을 하는 정신 나감, 하지만 뭔지모르게 샘솟는 모에 요소 즉 10의 보상을 얻을 수 있고 짱구는 어린 시절의 순수함과 가족애, 친구들과의 순수한 우정에 대해 배울 수 있습니다. 그럼 이건 6의 보상을 얻는 거라고 하죠.


* 그러니까 인생에 있어서 이 첫 번째 선택은 아주 중요해요 맨 처음 보는 애니가 인생의 방향을 결정하게 되는 거죠 쉽덕이냐 일반인이냐, 둘 다 괜찮은 삶이지만 우마무스메를 보는게 인생에 좀 더 도움이 되는거에요.


* 강화학습이라고 해서 이득이 최대한 커지는 방향으로 선택을 해서, 그 이득 전부 그대로 더하는게 아니라, 고르는 단계에 따라 “선택의 중요도”를 추가로 고려해줘요. 처음의 선택이 중요할 수도 있고, 나중의 선택이 중요할 수도 있고, 모든 선택이 다 중요할 수도 있어요. 즉, 단계별로 얻을 수 있는 이익과 단계별 중요도(0~1사이의 값)를 곱한 값의, 합이 최대가 되는 방향으로 계속해서 “선택을 하는 방법이나 방향을 학습시키는 것”을 강화학습이라고 합니다.


## 전이학습

* 전이학습은 한 분야에서 학습한 결과를, 학습한 적 없는 분야에 적용해서 학습하는 방법이에요. 예를 들면, X라는 데이터를 학습해서 이제 X인지 X가 아닌지를 구별할 수 있게 되었다고 해봅시다. 그니까 이제 수많은 방도리 패턴을 치면서 이게 똥채보인지 갓채보인지 구별할 수 있게 된거에요. 근데 어느 날, 우마무스메 리겜이 출시되었다고 해봅시다. 우마무스메도 채보가 많이 있지만, 형은 방도리만 플레이해서 우마무스메겜 채보를 하나도 모른다고 해봅시다. 여기서 우마무스메 곡들의 채보가 갓채보인지 똥채보인지 구분하는 방법은 두 가지가 있죠.


* 1.우마무스메 채보를 정말 많이 여러번 플레이 해보고 똥채보 갓채보인지 판단한다.

* 2.방도리에서 했던 경험을 살려서 한 두 번 플레이해보고 똥채보인지 갓채보인지 판단한다.


* 2번 방법이 전이학습입니다. 형이 사과 깎을 줄 알면 배나 키위 깎는데 응용할 수 있는거랑 마찬가지에요.

* 상대적으로 빈곤이 많은 아프리카에서 빈곤 정도를 측정할 수 있는 모델을 만들었다고 해봅시다. 하지만, 상대적으로 빈곤함이 집중되어있는 아프리카와는 달리, 전 세계(아시아, 아메리카 등)의 빈곤을 측정하려면 어떻게 해야할까요? 직접 아프리카의 빈곤을 측정했던 것처럼 전 세계의 데이터를 다시 측정할 수도 있지만, 아프리카에서 측정했던 방법(야간 조명이나 도로, 농가 등)을 사용하면 많은 데이터의 추가적인 수집 없이도 전 세계의 빈곤을 합리적인 방법으로 측정할 수 있죠


## 딥러닝 

* 보통 머신러닝이라고 하면 사람들이 정해준 기준에 따라 컴퓨터가 가중치를 둬서 학습을 하게 하는 것이라고 하죠. 근데 딥러닝은 사람이 기준을 지정해 주는 행위를 하지 않고 학습시키는걸 딥러닝이라고 해요. 

* 예를 들자면 사과랑 바나나 사진을 각각 20만장정도 학습을 시킬 때, 길이나 색깔같이 기준을 정해주면 머신러닝. 기준을 정해주지 않고 그냥 너 알아서 해 라고 하면 딥러닝이에요. 그냥 니 알아서 해와 그것도 못해? 이런 느낌?


 


 

# 각각 방식의 활용/적용 분야?


 


##지도학습

지도 학습은 맞다/아니다가 명확히 구분되는 문제의 해결 방법으로 많이 쓰여요. 예를 들어, 제가 항상 예로 드는 사과랑 배 구별하는 방법이죠. 주로 이와 같은 Classifier을만드는 데 쓰여요. 둥근 것~긴 것, 빨간 색~노란 색이 기준이 되겠죠?


 


##강화학습

강화 학습은 이득이 최대로 되는 방향으로 “선택”을 하게끔 학습하는 겁니다. 예를 들어 스타크래프트라던가 전략게임에서 처음에 어떤 행위(선택)를 해야 나중에 승리할 확률(이득)이 높아지는가? 라던가, 주로 전략 수립이나 게임이론 등등 엄청 많이 쓰여요 예시 찾아보시면 졸라많이 나올듯


 


##전이학습

위에 쓴 가난 이야기나 배 깎는 이야기처럼 새로 판단해야하는 분야의 데이터가 적고, 유사한 분야의 데이터가 많으면 그거 가져다 써서 판단할 수 있다는 얘깁니다. 예시는 위에 쓴거 참고하셔도 될 듯.


 


##딥 러 닝 

이건 뭐 정말 정해져있지 않아요. 모든 분야에 두루 많이 쓸 수 있죠? 사람이 기준을 정해줄 필요도 없고 컴퓨터야 니 알아서 구분해봐 하는거니까. 알파고도 사람이 바둑에서 이득이 되는 기준을 정해준 것도 아니고 바둑 기보 많이 던져주고 니가 알아서 배워봐ww 해놓고 바둑하게 하는거니까. 방도리 같은것도 학습시킬 수 있고.. “사람이 생각해서 해결할 수 있는 모든 분야”에 쓰일 수 있습니다.

댓글
공지사항
최근에 올라온 글
최근에 달린 댓글
Total
Today
Yesterday
링크
TAG
more
«   2024/05   »
1 2 3 4
5 6 7 8 9 10 11
12 13 14 15 16 17 18
19 20 21 22 23 24 25
26 27 28 29 30 31
글 보관함