728x90
중심 경향성
- 데이터의 중심이 어디인지 나타내는 지표이다.
- 평균, 중앙값, 최빈값 등이 있다
- 평균 mean
- 전체 데이터를 더하고 데이터의 개수로 나눈 값
- 중앙값 median
- 전체 데이처의 정중앙에 있는 값
- 최빈값 mode
- 전체 데이터에서 가장 많이 나온 값
def mean(x):
return sum(x)/len(x)
def median(x):
sorted_x = sorted(x)
mid_point = len(sorted_x)//2
if len(sorted_x)%2 == 0:
return sorted_x[mid_point-1:mid_point]
else:
return sorted_x[mid_point+1]
from collections import Counter
def mode(xs):
counts = Counter(xs)
max_count = max(counts.values())
return [[x_i, count] for x_i, count in counts.items()
if count == max_count]
import numpy as np
import random
x = np.random.randint(1,100, size = 50)
print('x ', x)
print('mean ',mean(x))
print('median ', median(x))
print('mode', mode(x))
728x90
'Machine Learning > 이론' 카테고리의 다른 글
[ML] Overfitting, Underfitting (0) | 2022.08.17 |
---|---|
Hypothesis and Inference, p-value (0) | 2022.08.11 |
[통계] 베이지안 이론 Bayesian theory (0) | 2022.08.10 |
[ML] 경사 하강법 (0) | 2021.04.01 |
[ML] 선형 회귀 (0) | 2021.03.30 |