카테고리 없음

11장

lee___ys 2023. 4. 11. 23:27

11.1.1 나이브 베이즈 

나이브 베이즈 분류는 각 클래스(카테고리 또는 레이블)에 대한 사전 확률과 특성(Feature)이 주어졌을 때, 조건부 확률을 계산하여 입력 데이터를 가장 확률이 높은 클래스로 분류하는 방식입니다.

 

홀드아웃방식으로 데이터를 2개로 나눌껀데 

70%, 30%, 각각의 비율로 나눈다. 

훈련에 사용할 데이터는 70%로 사용을 하고 

명령은 매우 간단하다. 

훈련과 테스트 데이터 모두에 대해 예측을 생성할수 있고 아래에 보면 1개 빼고 일치하였다. 

 

 

정확도도 다음과 같다. 

f1 score도 계산할수있고 

 

 

히트맵으로 시각화 하면 다음과 같은데 왼쪽 대각선이 일치하는것이다. 

그림을 살펴보면 suburb_mix에서 오차가 조금 있는걸 확인할수있다. 

 

 

일반적으로 알고있는 혼동행렬에서 사용되는 precision이나 recall 의 공식이다 

 

모델이해도를 높이기 위해 시각화를 할수있습니다. 

 

 

 

11.2 랜덤 포레스트 

트리모델을 학습하여 한것이다.