Regression Tree Tree 조건에 따라 x가 가질 수 있는 영역을 block으로 나누는 개념 \(c_{m}\) z축의 값 높이 $$ \hat{p}_{mk} = \sum_{m=1}^Mc_{m}I(x \epsilon R_{m}) $$ \( R_{m} \) 을 정하는 법 임의의 영역을 나눔 하나의 실수값을 왼쪽 오른쪽으로 쪼개고 무수히 많은 s를 넣는 것 \( R_{1}(j,s) = {X|X_{j} s} \) 각 영역들에 대해, measure를 가장 좋은 값으로 만드는 변수와 기준을 선택함 왼쪽 오른쪽 값에 대한 y와 c(평균값)의 차이의 합을 구할 수 있음 \( min_{j,s}[min_{c1} \sum_{x_{i} \epsilon R_{1}(j,s)} (y_{i}-c_{1})^{2} +min_{..
의사결정나무 Decision Tree https://pasongsong.tistory.com/136?category=1026284 [자료구조] 트리 Tree 트리 Node와 Branch를 이용해서, 사이클을 이루지 않도록 구성한 데이터 구조 이진트리 (Binary Tree 형태, 가장 많이 쓰임)로, 탐색(검색) 알고리즘 구현을 위해 많이 사용됨 용어 Node : 트리에서 데이 pasongsong.tistory.com 의미 변수들로 기준을 만들고 이것을 통하여 샘플을 분류하고 분류된 집단의 성질을 이용하여 추정하는 모형 장점 위의 표를 보면 샘플의 play tennis의 결과에 영향을 미치는 요인들을 Tree 구조를 통해 직관적으로 볼 수 있음 해석력이 높음 직관적이고 범용적임(독립변수, 종속변수가 범용..
트리 Node와 Branch를 이용해서, 사이클을 이루지 않도록 구성한 데이터 구조 이진트리 (Binary Tree 형태, 가장 많이 쓰임)로, 탐색(검색) 알고리즘 구현을 위해 많이 사용됨 용어 Node : 트리에서 데이터를 저장하는 기본 요소 (Branch 정보 포함) Root Node : 트래 맨 위에 있는 노드 Level : 최상위 노드를 Level 0으로 하여, 하위 Branch로 연결된 노드의 깊이 Parent Node : 어떤 노드의 다음 레벨에 연결된 노드 Child Node : 어떤 노드의 상위 레벨에 연결된 노트 Leaf Node (Terminal Node) : Child Node가 하나도 없는 노드 Sibling (Brother Node) : 동일안 Parant Node를 가진 노드 ..