[DB] 소트 튜닝
SQL 수행 도중 가공된 데이터 집합이 필요할 때, PGA와 temp tablespace를 사용함. 소트와 그룹핑 할 때도 동일. 소트는 PGA에 할당한 Sort Area에서 이루어지고, 공간이 부족하면 디스크 temp table을 사용. in-memory sort (internal sort) : 전체 정렬 작업을 메모리 내에서 완료 ...
SQL 수행 도중 가공된 데이터 집합이 필요할 때, PGA와 temp tablespace를 사용함. 소트와 그룹핑 할 때도 동일. 소트는 PGA에 할당한 Sort Area에서 이루어지고, 공간이 부족하면 디스크 temp table을 사용. in-memory sort (internal sort) : 전체 정렬 작업을 메모리 내에서 완료 ...
Nested Loops join 2020년 1월 1일 이후에 입사한 사원이 관리하는 고객 데이터를 추출하고 싶을 때 select e.사원명, c.고객명, c.전화번호 from 사원 e, 고객 c where e.입사일자 >= '20200101' and c.관리사원번호 = e.사원번호 와 같은 쿼리 사용 가능. 논리적으로 생각했을 때 ...
인덱스 탐색 수직적 탐색을 할 때, 찾고자 하는 시작점보다 값이 같거나 큰 키를 만나면, 해당 키 바로 이전 키를 타고 내려가야 하는 이유 (B, 3)를 찾고 싶으면 루트/브랜치 블록에서 (B, 3)이전 키인 (A, 3)부터 탐색을 시작해서 (B, 3)의 시작점을 찾을 수 있음 WHERE C1 = 'B' AND C2 BETWEEN...
table random access index ROWID 찾고자 하는 칼럼이 모두 인덱스를 구성하고 있는 게 아니라면, 인덱스에서 ROWID를 찾아서 원본 테이블을 엑세스 해야 함. ROWID는 데이터 파일 번호, 블록 번호, 로우 번호로 이루어져 있어 물리적 주소로 보일 수도 있지만, 논리적 주소. 물리적으로 직접 연결되지 않고, 테이블 레코드...
인덱스 구조 및 탐색 이름 키 시력 김철수 175cm 1.2 이영희 165cm 0.4 … … 박민준 ...
GPT-3는 다음에 올 토큰을 예측하는 모델이다. GPT-3는 어떻게 ChatGPT가 되었는가? supervised fine-tuning (SFT) 목적 : supervised fine-tuning을 통해 LLM을 사용자의 지시 사항에 맞춰 응답하도록 학습시키고 싶음 학습 데이터셋 : instruction dataset (지시사항과 그에 ...
기존 RNN 구조 By fdeloche - 자작, CC BY-SA 4.0, https://commons.wikimedia.org/w/index.php?curid=60109157 RNN (Recurrent Neural Network)는 순차적. 병렬 처리 불가능 $ h_t = f(h_{t-1}, x_t) $ 이전 단계에...
앞에서도 살펴봤지만, 가우시안 분포(정규 분포)는 연속 변수를 모델하는 분포로 자주 사용된다. 식 2.42는 단일 변수에 대한 가우시안 분포의 형태이다. [N(x \mu, \sigma^2) = \dfrac{1}{(2\pi\sigma^2)^{1/2}}\exp\left{-\frac{1}{2\sigma^2}(x-\m...
K차원 벡터 (one hot encoding) 이산 확률 변수는 두 가지 값(0, 1) 중 하나가 일어나는 케이스에 대해서 사용한다. 하지만 세상의 대부분 케이스들은 그런 이분법적인 상황으로 나뉘어지지 않는다. 동전 던지기가 아니고 주사위라면? 인구 집단을 단순히 남성 여성이 아니라 다양한 직업군으로 나누게 된다면? 이런 상황에서 사용할 수 있는 ...
베르누이 분포 동전 던지기 같은 이진 확률 변수 $x \in {0, 1}$을 생각해보자. $x = 1$이 앞면, $x = 0$이 뒷면인데, 두 확률이 동일하지 않다고 하자. $x = 1$일 확률을 매개변수 $\mu$ 를 통해 다음과 같이 표현할 수 있다. [p(x = 1 \mu)=\mu \tag{2.1}] ...