Machine learning 1

지도학습 Supervised Learning

 

 

 

지도학습 Supervised Learning

지도 학습은 ‘역사’와 비슷합니다.

역사에는 과거에 있었던 사건이 원인과 결과로 기록되어 있습니다.
역사를 알면 어떤 사건이 일어났을 때,
그것의 결과로 어떤 일이 일어날지를 예측할 수 있게 됩니다.




마찬가지로, 지도학습은 과거의 데이터로부터 학습해서
결과를 예측하는 데에 주로 사용됩니다.

‘레모네이드 카페’ 예제를 다시 소환해봅시다.
표를 봐주세요.

일기예보를 보니 1월 8일에 온도가 25도라고 합니다.
우리가 궁금한 것은 1월 8일에는
레모네이드 몇 잔이 판매될지를 예측하는 것입니다.
그래야 레몬이 몇 개가 필요한지 알 수 있을 테니까요.

즉, 과거에 대한 학습을 통해서
미지의 데이터를 추측하고 싶은 것이죠.
이때 머신러닝의 지도학습이 이용될 수 있습니다.

머신러닝의 지도학습을 이용하기 위해서는
우선 충분히 많은 데이터를 수집해야 합니다.
데이터는 독립변수와 종속변수로 이루어져 있어야 합니다.

이것을 지도학습으로 훈련시키면 컴퓨터는 모델을 만듭니다.
아마도 모델은 이렇게 생겼겠죠?

온도 X 2 = 판매량

일단 모델이 만들어지면, 모델을 사용하면 됩니다.
이 모델에 온도를 입력하면 판매량을 예측 할 수 있습니다.

만약 내일의 온도가 25도라면 몇 잔이 판매될까요?

25도 X 2 = 50개
50잔입니다.

즉, 머신러닝의 지도학습을 이용하면
온도X2라는 모델을 컴퓨터가 알아서 만들어주는 것입니다.

지도학습의 위력이 아직 실감이 안나죠?
지도학습은 이것보다 훨씬 복잡한 상황에서
진가를 발휘합니다.

상상력을 극단적으로 증폭해봅시다.
공학은 극단적인 상황을 위해서 존재한다는 것을 잊지 마세요.



이제 우리는 레모네이드 카페의 사장이 아닙니다.
2000만 명이 사용하는 온라인 쇼핑몰의 대표이사입니다.

심지어 우리 쇼핑몰은 유통기한이
짧은 농산물에 대한 새벽 배송도 하고 있습니다.

이런 상황에서 수요를 예측하는 것이 얼마나 중요하고,
어려운 일일까요?

이것을 사람이 계산으로
예측한다는 것은 불가능한 일입니다.

바로 이런 문제를 머신러닝의 지도학습이
해결해줄 수 있습니다.

머신러닝이 없었다면 새벽 배송은 불가능했을지도 모릅니다.
지도학습의 위력이 실로 대단하지 않나요?
 

지도학습을 하기 위해서는
우선 과거의 데이터가 있어야 합니다.
그리고 그 데이터를 독립변수(원인)와 종속변수(결과)로
분리해야 합니다.

독립변수와 종속변수의 관계를 컴퓨터에게 학습시키면
컴퓨터는 그 관계를 설명할 수 있는 공식을 만들어냅니다.

이 공식을 머신러닝에서는 ‘모델’이라고 합니다.
좋은 모델이 되려면 데이터가 많을수록, 정확할수록 좋습니다.

일단 모델을 만들면 아직 결과를 모르는 원인을
모델에 입력했을 때 결과를 순식간에 계산해서 알려줍니다.

과거에는 이런 공식을 만들려면
고도의 실험과 높은 수준의 수학이 필요했습니다.



그래서 공식이란 소수의 엘리트들만의 전유물이었습니다.
대중들은 엘리트들이 만든 공식의 소비자로
만족해야 했습니다.


하지만, 머신러닝이 등장하면서
과거와는 비교도 할 수 없을 정도로
적은 지식과 노력으로 나의 공식을 만들어서
사용할 수 있게 되었습니다.


머신러닝을 감히 이렇게 정의하고 싶습니다.

이런 놀라운 시대에 공부하지 않는다는 것이
얼마나 손해인가요?

기분 좋죠?

그런데 이왕 여기까지 왔는데
여기서 멈추는 것은 조금 아깝습니다.

조금만 더 멀리 가봅시다.

조금만 더 가면 전문가와도 대화할 수 있는 수준에
도달할 수 있거든요.

댓글

댓글 본문
  1. choicode2020
    완료
    역시 배우고 활용해야 하네요
  2. 완료
  3. eu1357
    지도학습 분류 회귀 완료
  4. Tae Hwan Yoon
    완료 ✅
  5. 문곰
    공식의 대중화...누군가에게는 독이 누군가에게는 힘이 되겠네요
  6. 오리궁디
    완료!
    지도 학습 => 원인과 결과를 통한 모델 도출 => 머신러닝을 통한 공식의 대중화
    나같은 평범한 사람도 약간의 지식으로 이용할수 있게 됨!
  7. 조원배
    완료
  8. Koo Goo
    완료
  9. 웨지
    완료
  10. woobin1107
    완료
  11. Dennis
    지도학습, 모델 완료
  12. 해인코딩
    완료
  13. 이인규
    완료 08/28 23:35
  14. Helena
    학습완료
  15. Eunjoo Cha
    항상 좋은 강의 감사합니다 :)
    이번 강의를 듣다 궁금한 점이 생겨서, 댓글을 적어요!

    "지도학습을 하기 위해서는 과거의 데이터가 있어야 하고, 이를 독립변수(원인)과 종속변수(결과)로 분리해야 한다"고 알려주셨는데, 변수들 간의 유의미한 상관관계를 찾는 것은 반드시 사람만 할 수 있는 일인가요? 아니면 관계성을 찾아주는 다른 기술도 있을까요~?

    저는 연구생으로 SPSS, R로 통계를 돌려서 데이터 간 관계성을 증명하는 방법에 대해서는 배웠는데, 혹시나 다른 방법이 있나 해서 질문을 남겨요~
  16. Chococream
    강의 참 재미있어요!
  17. 지식탐구자
    완료
  18. kinigre
    완료
  19. 완료
  20. 은하파파
    완료 2020-08-27
  21. 강기봉
    완료.
  22. Jung Lee
    완료
  23. 아혜
    완료
  24. yahyah
    완료
  25. Claire
    갑시다!
  26. 이상혁
    완료
  27. 저기요
    완료
  28. 차민기
    완료
  29. 완료
  30. 람지비전
    완료
  31. byoonn
    공식의 대중화
  32. 완료
  33. 아나나
    완료
  34. 람지비전
    완료
  35. 완료
  36. 안산인
    4일차 완료(2/3)
  37. dklklw;
    완료
  38. 완료
  39. 화니
    완료!
  40. 포도당첨
    정말요?
  41. 완료
  42. 진영순
    완료
  43. 정종혁
    보고갑니다.
  44. 장정민
    2020.8.23 4:00

    머신러닝을 지도학습 시키기 위해서는 많은 데이터가 필요하다.
    그 데이터들을 독립변수와 종속변수로 나뉘어서 학습시키고 머신러닝을 그것을 통해 독립변수와 종속변수에 관한 식인 '모델'을 만들어낸다.
    지도학습은 데이터의 양이 많을수록 진가를 발휘한다.
  45. doryeng
    완료!
  46. luis12
    완료
  47. 신희영
    완료
  48. mision82
    공식의 대중화!
    완료~
  49. 완료
  50. 맥러브
    완료
버전 관리
egoing
현재 버전
선택 버전
graphittie 자세히 보기