본문 바로가기

Python/Machine Learning

(2)
<파이썬 머신러닝> 로지스틱 회귀(Logistic regression) 로지스틱 회귀란 무엇인가? 아래 이런 데이터가 있다고 가정해보면, 파란 동그라미로 표시된 데이터와 빨간 동그라미로 표시된 데이터를 분류하고 싶을 때, 아래와 같이 이를 분류할 수 있는 이상적이니 그래프를 찾는 것이다. 로지스틱 회귀는 이름은 회귀이지만 분류 모델이다. 이 알고리즘은 선형 회귀와 동일하게 선형 방정식을 학습한다. 그러나 이 최종 값은 0과 1사이의 확률로 변경되어야 하는데, 이를 해결하는 방법이 로지스틱 함수이다. 시그모이드 함수 시그모이드 함수라고도 불리는데, 그래프의 모양은 다음과 같다. 이 값은 선형 방정식을 통해 값이 양의 무한대에 가까워지면 1에 가깝고 음의 무한대로 가까워지면 0에 가깝게 된다. 로지스틱 회귀를 이용한 2진 분류 물고기 데이터를 불러왔다. Weight, lengt..
<파이썬 머신러닝> 선형 회귀(Linear Regression) 선형 회귀란 무엇인가? 선형 회귀는 간단히 말해서, 한 가지 변수가 다른 변수에 어떤 영향을 주는지 알아보는 방법이다. 예를 들어, 카드 한도를 정하는 기준을 만들기 위해서는, 소득 수준이 어떤 영향을 미치는지 알아볼 수 있다. 아래 그래프는 카드사용량과 소득 수준 간의 상관관계를 보여주는 산점도이다. 고객 B와 고객A의 소득 수준에 따른 카드 사용량 아래 그림을 보면 대부분의 고객들이 소득 수준에 따라 소득이 높을 수록 카드 사용량이 많아지고, 소득 수준이 낮을 수록 카드 사용량이 적어지는 선형적인 모습을 보인다. 고객 B와 고객 A의 소득 수준과 카드 사용량에 따른 카드 한도 소득 수준과 카드 사용량은 종속 변수와 독립 변수로 사용될 수 있다. 이러한 변수들을 활용해 선형 회귀 기법을 사용하여 카드 ..