[ML] Bayes Classifier
Classification Problem Feature vector $\mathbf{x}$와 qualitative response $\mathbf{y}$가 주어졌을 때, $\mathbf{y}$의 값을 예측하는 함수 $f(\mathbf{x}) \in C$를 만드는 것이 목표. 보통은 어떤 확률 분포 $p(\mathbf{x}, \mathbf{y...
Classification Problem Feature vector $\mathbf{x}$와 qualitative response $\mathbf{y}$가 주어졌을 때, $\mathbf{y}$의 값을 예측하는 함수 $f(\mathbf{x}) \in C$를 만드는 것이 목표. 보통은 어떤 확률 분포 $p(\mathbf{x}, \mathbf{y...
Classification Classification은 정성적(qualitative) 변수, 즉 순서가 없는 집합 $C$에서 값을 가지는 변수를 다루는 문제. e.g.) $\text{eye color} \in {\text{brown, blue, green}}$ $\text{email} \in {\text{spam, ham}}$ Fea...
요약 어떤 목적함수가 있어 (e.g. 머신러닝 모델의 loss function). 그런데 이 목적함수가 블랙박스이거나 실행하는 데 코스트가 너무 높아. 그래서 목적함수를 모방하는 surrogate model을 하나 둬 = GP Gaussian Process 함수 공간 위의 분포...
Autoencoder (AE) — 차원 압축의 신경망 Autoencoder는 입력을 다시 자기 자신으로 복원하도록 학습되는 신경망. 중간에 일부러 좁은 병목(bottleneck, latent space) 을 둬서 데이터의 본질적인 정보만 압축하도록 강제함. [x \;\xrightarrow{\text{Encoder } f_\phi}\; z \;\xr...
선형 회귀(Linear Regression) 입력 변수(X)와 예측하고자 하는 출력 변수(Y) 사이에 선형적으로 비례하는 관계(기울기가 일정함)가 있다고 가정하는 가장 간단한 형태의 지도학습 모델 단순 선형 회귀: 입력 변수가 하나일 때, 모델은 $y = \beta_0 + \beta_1 x + \epsilon$ 형태의 1...
출처 : https://kubernetes.io/docs/concepts/architecture/ 쿠버네티스 클러스터(인스턴스 단위) 안에는 control plane과 worker nodes가 존재 Control Plane Cloud Controller Manager : 쿠버네티스 클러스터를 클라우드 제공업체의 API에 연결하여 클라우드별...
Summary Balsa is the first learned query optimizer that can match or exceed expert optimizer performance without learning from existing expert optimizers or demonstrations. Key Problems with Exis...
Summary Bao (Bandit optimizer) is a novel learned query optimization system that addresses the practical limitations of previous machine learning approaches to database query optimization. Key Pr...
SQL 수행 도중 가공된 데이터 집합이 필요할 때, PGA와 temp tablespace를 사용함. 소트와 그룹핑 할 때도 동일. 소트는 PGA에 할당한 Sort Area에서 이루어지고, 공간이 부족하면 디스크 temp table을 사용. in-memory sort (internal sort) : 전체 정렬 작업을 메모리 내에서 완료 ...
Nested Loops join 2020년 1월 1일 이후에 입사한 사원이 관리하는 고객 데이터를 추출하고 싶을 때 select e.사원명, c.고객명, c.전화번호 from 사원 e, 고객 c where e.입사일자 >= '20200101' and c.관리사원번호 = e.사원번호 와 같은 쿼리 사용 가능. 논리적으로 생각했을 때 ...