[ML] Decision Trees
Tree-based Learning Tree-based 학습은 다음과 같은 특징을 가짐: predictor space를 단순한 영역들로 분할(segmenting) 함 그 분할 규칙들을 트리 형태로 요약할 수 있음 regression과 classification 모두에 적용 가능함 장점: 단순하고 해석하기 좋음 (interp...
Tree-based Learning Tree-based 학습은 다음과 같은 특징을 가짐: predictor space를 단순한 영역들로 분할(segmenting) 함 그 분할 규칙들을 트리 형태로 요약할 수 있음 regression과 classification 모두에 적용 가능함 장점: 단순하고 해석하기 좋음 (interp...
Model Selection & Cross-validation 모델을 학습시킬 때 데이터를 세 partition으로 나눠서 사용함. Training set (70%): 모델의 파라미터를 학습하는 데 사용 Validation set (20%): 하이퍼파라미터 선택 (model selection)에 사용 Eval set (10%):...
요약 Bayes Classifier $\mathbf{x}$를 관측했을 때 label $\mathbf{y}$가 뭘지에 대한 불확실성이 있음 → 이게 posterior $p(\mathbf{y}|\mathbf{x})$ 어떤 예측값 $\hat{\mathbf{y}}$을 내놓으면 그에 따른 loss가 결정됨 → $\mathcal{L}(\mathbf{y...
Classification Classification은 정성적(qualitative) 변수, 즉 순서가 없는 집합 $C$에서 값을 가지는 변수를 다루는 문제. e.g.) $\text{eye color} \in {\text{brown, blue, green}}$ $\text{email} \in {\text{spam, ham}}$ Fea...
요약 어떤 목적함수가 있어 (e.g. 머신러닝 모델의 loss function). 그런데 이 목적함수가 블랙박스이거나 실행하는 데 코스트가 너무 높아. 그래서 목적함수를 모방하는 surrogate model을 하나 둬 = GP Gaussian Process 함수 공간 위의 분포...
Autoencoder (AE) — 차원 압축의 신경망 Autoencoder는 입력을 다시 자기 자신으로 복원하도록 학습되는 신경망. 중간에 일부러 좁은 병목(bottleneck, latent space) 을 둬서 데이터의 본질적인 정보만 압축하도록 강제함. [x \;\xrightarrow{\text{Encoder } f_\phi}\; z \;\xr...
선형 회귀(Linear Regression) 입력 변수(X)와 예측하고자 하는 출력 변수(Y) 사이에 선형적으로 비례하는 관계(기울기가 일정함)가 있다고 가정하는 가장 간단한 형태의 지도학습 모델 단순 선형 회귀: 입력 변수가 하나일 때, 모델은 $y = \beta_0 + \beta_1 x + \epsilon$ 형태의 1...
출처 : https://kubernetes.io/docs/concepts/architecture/ 쿠버네티스 클러스터(인스턴스 단위) 안에는 control plane과 worker nodes가 존재 Control Plane Cloud Controller Manager : 쿠버네티스 클러스터를 클라우드 제공업체의 API에 연결하여 클라우드별...
Summary Balsa is the first learned query optimizer that can match or exceed expert optimizer performance without learning from existing expert optimizers or demonstrations. Key Problems with Exis...
Summary Bao (Bandit optimizer) is a novel learned query optimization system that addresses the practical limitations of previous machine learning approaches to database query optimization. Key Pr...