#1. AI, ML, Deep Learning, Data mining, Kaggle 용어정리
Machine learning이라는 재밌는 분야에 대해 시작하기에
앞서친구들과 그리고 사람들과 대화를 하다보면
머신러닝, 딥러닝, 강화학습, Kaggle, 데이터 마이닝과 같은 단어들을 들어보기는 했지만
그것들이 무엇을 의미하는지 설명해주기는 쉽지 않았다.
따라서 이번 포스티에서는 관련 단어들에 대해서 설명해줄 수 있게끔
정리를 한번 하고 넘어가겠다
인공지능(AI)
말그대로 인간의 지능을 기계로 구현하는것,
일반 AI(General) 은 인간처럼 생각하는 인공지능
좁은 AI(Narrow AI) 은 이미지 분류서비스나 얼굴 인식 기능 등
특정 작업을 인간 이상의 능력으로 해낼수 있는 것
현재의 기술로는 좁은 AI이다.
머신러닝(ML)
인공지능을 구현하는 접근 방식
알고리즘을 이용해 데이터(훈련 데이터(Training Data))를 분석(데이터 마이닝)하고, 분석을 통해 자동으로 학습하며 학습한 내용을 기반으로 판단,예측함
의사결정의 기준을 코딩으로 넣는게 아닌 대량의 데이터와 알고리즘을 통해 학습시켜 작업을 수행하는 방법
알고리즘 방식에 의사결정트리학습,귀납논리,클러스터링,강화학습,베이지안 네트워크 등이 있다.
지도학습(Supervised learning)
입력된 데이터와 원하는 출력값을 제공
입력된 이미지 데이터가 많을수록 정확도는 높아진다. 많은 학습데이터가 필요하고
사람이 예측이 옳았는지 확인해주어야하므로 노동집약적,시간이 많이걸리며
훈련되지 않은 분야로의 확산 가능성이 없다.
비지도학습(Unsupervised learning)
데이터에 표식이 붙어 있지 않은 경우, 데이터 속에 숨은 의미를 모르는 경우 사용
초기 오류가 많을수 있지만 학습하는 과정에서 생각지도 못한 패턴이나 특징을 발견할수 있다.
강화학습(Reinforcement learning)
경험과 시행착오를 통해 얻어진 data를 기반으로 모델을 개선하는 방식
어떤 상황에 대해 성과의 크기에 따라 점수를 부여하고 입력값에 대해 시스템의 반응을
모델에 반영해 줘야한다.
강화학습의 장점은 과거의 효과있던 방법과 새로운 방법을 섞어서 시도해볼수 있다는 것
이전의 데이터에 대해 징검다리 삼아 다음 단계로 넘어가는데
이 방법은 적용하기 힘들고 개발자의 전문성이 높아야만 가능하다.
구글의 딥마인드가 (AlphaGo Zero)를 강화학습으로 훈련 시켰다.
딥러닝(deep learning)
딥러닝은 머신러닝 집합안에 포함된 개념이다
초기 머신러닝의 알고리즘인 Artificial Neural Network은 레이어 연결 및 데이터 전파 방향이 일정하다.(이후 최적화이론(Optimization)과 커널함수(Kernel function)을 활용해 모델식의 정확성을 높였다)
딥러닝은 인공신경망(ANN)에서 발전된 형태로 뇌의 뉴런과 유사한 정보 입출력 계층을 활용해 데이터를 학습, 인공신경망에 Big data를 결합한 것
(즉 분류가 되지 않은 사진에 대해 방대하게 보여주고 자동으로 군집화 하고 분류하는 것)
(인공 신경망(ANN)은 미리 알려줘야함)
하지만 엄청난 양의 연산을 필요로 하는 탓에 난관에 부딪혔지만
GPU의 등장으로 병렬화로 인해 연산속도의 획기적 가속이 이루어졌고
이는 딥러닝 기반 인공지능의 등장을 이끌었다.
단 딥러닝은 발생하지 않았거나 빈도가 작은 data까지 판단하는데는 한계가 아직 있다.
데이터 마이닝(data mining)
보유한 데이터를 다양한 관점에서 분석, 그 결과를 유용한 정보로 조합하는 일을 가리킨다.
패턴, 상관성 등을 통계적 수법들로 식별해 가치를 부여하는데 숫자가 아닌 동작,역할 등을 처리하는데 통계처리와 구분된다.
연관(Association) 분석 : data set에서 자주 발생하는 속성 값을 연결해주는 연관 규칙
회귀(Regression) 분석 : 독립 변수 분석을 통해 종속변수가 무엇인지 밝여내는 일에 사용
분류(Classification) : 개체들의 등급을 나누는 모델, 의사결정 트리, 수학공식 or if-then규칙 사용
데이터 마이닝은 입력된 데이터의 품질에 따른다
이전에 발생했던 데이터의 추세에 의존한다는 점에서
미래의 사건을 진단하기에는 역부족
Kaggle
캐글이란 데이터 과학 및 머신러닝을 학습하는 플랫폼, 온라인 경연대회를 운영하는곳
댓글 없음:
댓글 쓰기