Data Analysis/Machine Learning(5)
-
의사결정나무(Decision Tree)
안녕하세요. 데이터 분석하는 랩장 대학원생, 석사 3학기 고니입니다. 이번 시간에는 의사결정나무에 대해 이야기를 나누어보려고 합니다. 본격적으로 머신러닝 모형에 대해 다루는 첫 번째 포스팅이 되겠습니다! 지난 포스팅에서는 클래스 불균형 자료와 샘플링 기법에 대해 이야기를 나누었는데 기억나시나요? 클래스 불균형과 샘플링이라는 두 개념 모두 범주형 변수를 타겟변수로 가지는 분류모형을 대상으로 하는 것들이었습니다. 혹시 기억이 잘 나지 않으신다면 지난 포스팅을 참고해주세요! 의사결정나무는 가장 대표적인 분류모형 중 하나입니다. 물론 연속형 타겟변수를 가지는 예측 문제에 대해서도 사용할 수는 있으나 일반적으로는 분류 문제에 주로 사용하곤 합니다. 정말 단순한 알고리즘을 가지고 있으면서도 높은 성능과 결과 해석의..
2022.02.24 -
Over-Sampling & Under-Sampling & SMOTE
안녕하세요. 데이터 분석하는 랩장 대학원생, 석사 3학기 고니입니다. 이번 시간에는 클래스 불균형 자료와 다양한 샘플링 기법에 대해 이야기를 나누어보려고 합니다. 지난 포스팅에서 분류와 예측에 대해 이야기를 나누었던거 기억나시나요? 분류는 범주형 타겟변수를 대상으로 하는 것이었고, 예측은 연속형 타겟변수를 대상으로 하는 것이었습니다. 이번 시간에 다룰 내용은 바로 분류와 관련된 내용입니다. 클래스 불균형 자료란 무엇이며, 샘플링 기법은 또 무엇인지 하나씩 살펴보겠습니다! # 클래스 불균형 자료(Imbalanced Data) 클래스 불균형 자료는 타겟변수의 클래스가 불균형한 자료를 의미합니다. 타겟변수의 클래스가 불균형하다는게 무슨 말인지 잘 이해가 되지 않으신다고요? 언제나 그랬듯이 이번에도 간단한 예시..
2022.02.09 -
분류 vs 예측
안녕하세요. 데이터 분석하는 랩장 대학원생, 석사 3학기 고니입니다. 이번 시간에는 분류와 예측에 대해 이야기를 나누어보려고 합니다. 지난 포스팅에서 머신러닝은 타겟변수 즉, 정답이 존재하는지 여부에 따라서 크게 지도학습, 비지도학습으로 나눌 수 있다고 말씀드렸던거 기억나시나요? 분류와 예측은 바로 지도학습과 관련된 개념입니다. 지도학습을 타겟변수의 속성에 따라 두 가지로 나누면 분류와 예측으로 나눌 수 있습니다. 머신러닝 모델마다 어떤 것은 분류에 적합하고, 어떤 것은 예측에 적합하기 때문에 우리는 타겟변수의 속성을 고려하여 어떠한 모델을 사용할지를 선정해야 합니다. 그렇다면 타겟변수의 속성이 무엇을 의미하는지부터 살펴봅시다. 분류와 예측을 구분하기 위해서는 범주형 변수와 연속형 변수라는 개념을 알아야..
2022.02.09 -
지도학습 vs 비지도학습
안녕하세요. 데이터 분석하는 랩장 대학원생, 석사 3학기 고니입니다. 이번 시간에는 지도학습과 비지도학습에 대해 이야기를 나누어보려고 합니다. 머신러닝은 크게 지도학습, 비지도학습으로 나눌 수 있습니다. 무엇을 지도하고 무엇을 지도하지 않길래 지도학습과 비지도학습이라는 이름이 붙여졌을까요? 지도학습과 비지도학습의 차이점은 인공지능에게 정답을 지도 즉, 정답을 학습시켜주었느냐입니다. 정답을 지도하면 지도학습, 지도하지 않으면 비지도학습이겠죠? # 지도학습(Supervised Learning) 정답을 학습시킨다. 정답을 학습시킨다. 이게 도대체 무슨 말인지 잘 이해가 되지 않으신다고요? 간단한 예시를 통해 살펴보겠습니다. 아마 예시를 함께 살펴보시고나면 한 번에 이해가 되실겁니다. 아래 그림과 같이 두 집단..
2022.02.08 -
인공지능 vs 머신러닝 vs 딥러닝
안녕하세요. 데이터 분석하는 랩장 대학원생, 석사 3학기 고니입니다. 드디어 머신러닝 카테고리에도 첫 글을 작성하게 되었습니다. 블로그를 시작한지 거의 1년이 다 되어 가는데 이제서야 머신러닝 글을 처음으로 작성한다니 정말 반성해야겠습니다. 작년에 뭐가 그리 바빴는지...😂 다 핑계일 뿐이고 결국은 제가 게을렀던 탓입니다! 올해는 머신러닝 글도 열심히 작성하고 딥러닝 글도 이어서 쭉 작성해보려고 합니다. 그리고 작년부터 쭉 진행하고 있는 연구가 있는데 연구에 대해서도 글을 좀 작성해보려고 합니다. 이번 시간은 머신러닝에 대해 처음으로 다루는 시간인만큼 도대체 머신러닝이 무엇인지에 대해서부터 이야기를 나누어보려고 합니다. 머신러닝이라는 단어는 비전공자분들께서도 다들 한 번씩은 들어보셨을 것이라고 생각합니다..
2022.02.07