728x90

[SQLD] SQL 활용

① 조인(Join)

EQUI(등가) 조인 (교집합)

(1) EQUI(등가) 조인

조인 : 여러 개의 릴레이션을 사용해서 새로운 릴레이션을 만드는 과정
조인의 가장 기본은 교집합을 만드는 것이다.
2개의 테이블 간에 일치하는 것을 조인한다.

EQUI 조인은 <EMP> 테이블과 <DEPT> 테이블에서 DEPTNO 칼럼을 사용하여 같은 것을 조인한다.

SELECT * 
FROM EMP, DEPT
WHERE EMP.DEPTNO = DEPT.DEPTNO;

EQUI 조인은 '='을 사용해서 2개의 테이블을 연결한다.

SELECT * 
FROM EMP, DEPT
WHERE EMP.DEPTNO = DEPT.DEPTNO
    AND EMP.ENAME LIKE '임%'    /* 조인문에 추가 조건 및 정렬을 할 수 있음. */
    ORDER BY ENAME;

(2) INNER JOIN

EQUI 조인과 마찬가지로 ISO 표준 SQL이다.
INNER JOIN은 ON 문을 사용해서 테이블을 연결한다.

SELECT * 
FROM EMP INNER JOIN DEPT    /* INNER JOIN 구로 테이블 정의 */
    ON EMP.DEPTNO = DEPT.DEPTNO;    /* ON 구를 사용해서 조인의 조건을 넣음. */

조인문에 추가 조건 및 정렬을 할 수 있다.

SELECT * 
FROM EMP INNER JOIN DEPT    
    ON EMP.DEPTNO = DEPT.DEPTNO  
    AND EMP.ENAME LIKE '임%'
    ORDER BY ENAME;

EQUI 조인을 한 후에 실행 계획을 확인해서 내부적으로 2개의 테이블을 어떻게 연결했는지 확인할 수 있다.
- <DEPT> 테이블과 <EMP> 테이블 전체를 읽은 다음에(TABLE ACCESS FULL) 해시 함수를 사용해서 2개의 테이블을 연결하였다.
  - 해시 조인(Hash Join)
    - 테이블을 해시 메모리에 적재한 후에 해시 함수로써 연결하는 방법
    - EQUI 조인만 사용 가능한 방법
    - 과정
      - 먼저 선행 테이블을 결정하고 선행 테이블에서 주어진 조건(WHERE 구)에 해당하는 행을 선택한다.
      - 해당 행이 선택되면 조인 키(Join Key)를 기준으로 해시 함수를 사용해서 해시 테이블을 메인 메모리(Main Memory)에 생성하고, 후행 테이블에서 주어진 조건에 만족하는 행을 찾는다.
      - 후행 테이블의 조인 키를 사용해서 해시 함수를 적용하여 해당 버킷을 검색한다.

(3) INTERSECT 연산

2개의 테이블에서 교집합을 조회한다.
- 2개의 테이블에서 공통된 값을 조회한다.

SELECT DEPTNO FROM EMP
INTERSECT    /* 2개의 테이블에서 교집합을 조회 */
SELECT DEPTNO FROM DEPT;

Non-EQUI(비등가) 조인

2개의 테이블 간에 조인하는 경우, '='을 사용하지 않고 '>', '<', '>=', '<=' 등을 사용한다.
정확하게 일치하지 않는 것을 조인하는 것이다.

OUTER JOIN

2개의 테이블 간에 교집합(EQUI JOIN)을 조회하고, 한쪽 테이블에만 있는 데이터도 포함시켜 조회한다.
예) <DEPT> 테이블과 <EMP> 테이블을 OUTER JOIN 할 경우
- DEPTNO가 같은 것을 조회하고, <DEPT> 테이블에만 있는 DEPTNO도 포함시킨다.
  - 왼쪽 테이블에만 있는 행을 포함하면 LEFT OUTER JOIN, 오른쪽 테이블의 행만 포함시키면 RIGHT OUTER JOIN 이라고 한다.
FULL OUTER JOIN 은 LEFT OUTER JOIN 과 RIGHT OUTER JOIN 모두를 하는 것이다.
Oracle 데이터베이스에서는 OUTER JOIN을 "(+)" 기호를 사용해서 할 수 있다.

SELECT *
FROM DEPT, EMP
WHERE EMP.DEPTNO (+)= DEPT.DEPTNO;    /* Oracle 데이터베이스의 OUTER JOIN 방법 */

(1) LEFT OUTER JOIN 과 RIGHT OUTER JOIN

LEFT OUTER JOIN
- 2개의 테이블에서 같은 것을 조회하고, 왼쪽 테이블에만 있는 것을 포함해서 조회한다.

SELECT *
FROM DEPT LEFT OUTER JOIN EMP
    ON EMP.DEPTNO = DEPT.DEPTNO;

부서명	부서코드	부서코드_1	이름
인사팀	10	10	유비
총무팀	20	20	조조
IT팀	30	30	관우
운영팀	40

RIGHT OUTER JOIN
- 2개의 테이블에서 같은 것을 조회하고, 오른쪽 테이블에만 있는 것을 포함해서 조회한다.

SELECT *
FROM DEPT RIGHT OUTER JOIN EMP
    ON EMP.DEPTNO = DEPT.DEPTNO;

관리자명	관리자	사원번호	이름
유비	1000	1000	마초
주유	1001	1001	조조
		1002	관우
		1003	장비

CROSS JOIN

조인 조건구 없이 2개의 테이블을 하나로 조인한다.
- 조인구가 없기 때문에 카타시안 곱(Cartesian Product)이 발생한다.
예) 14개의 행이 있는 테이블과 4개의 행이 있는 테이블을 조인하면 56개의 행이 조회된다.
CROSS JOIN은 FROM 절에 CROSS JOIN 구를 사용하면 된다.

SELECT *
FROM EMP CROSS JOIN DEPT;

UNION을 사용한 합집합 구현

(1) UNION

2개의 테이블을 하나로 만드는 연산
2개의 테이블 칼럼 수, 칼럼의 데이터 형식 모두가 일치해야 한다.
- 그렇지 않을 경우 오류가 발생한다.

UNION 연산은 2개의 테이블을 하나로 합치면서 중복된 데이터를 제거한다.
- 그래서 UNION은 정렬(SORT) 과정을 발생시킨다.

SELECT DEPTNO FROM EMP
UNION                   /* UNION은 중복된 데이터를 제거하면서 테이블을 합침. */
SELECT DEPTNO FROM EMP;

(2) UNION ALL

2개의 테이블을 하나로 합치는 것
UNION 처럼 중복을 제거하거나, 정렬을 유발하지는 않는다.

SELECT DEPTNO FROM EMP
UNION ALL               /* 중복을 제거하지 않고 테이블을 합침. */
SELECT DEPTNO FROM EMP;

차집합을 만드는 MINUS

MINUS 연산은 2개의 테이블에서 차집합을 조회한다.
- 먼저 쓴 SELECT 문에는 있고 뒤에 쓰는 SELECT 문에는 없는 집합을 조회한다.
MS-SQL에서는 MINUS와 동일한 연산으로 EXCEPT 가 사용된다.

SELECT DEPTNO FROM DEPT    /* DEPT : {10, 20, 30, 40} */
MINUS                     
SELECT DEPTNO FROM EMP;    /* EMP : {10, 20, 30} */

DEPTNO

<DEPT> 테이블에만 존재하는 40이 조회되는 것을 확인할 수 있다.

② 계층형 조회(CONNECT BY)

Oracle 데이터베이스에서 지원하며, 계층형으로 데이터를 조회할 수 있다.
- 역방향 조회도 가능하다.
예) 부장에서 차장, 차장에서 과장, 과장에서 대리, 대리에서 사원 순으로 트리 형태의 구조를 위에서 아래로 탐색하면서 조회

계층형 조회 테스트 데이터 입력

CREATE TABLE EMP(
    EMPNO NUMBER(10) PRIMARY KEY,
    ENAME VARCHAR2(20),
    DEPTNO NUMBER(10),
    MGR NUMBER(10),
    JOB VARCHAR2(20),
    SAL NUMBER(10)
);

INSERT INTO EMP VALUES(1000, 'TEST1', 20, NULL, 'CLERK', 800);
INSERT INTO EMP VALUES(1001, 'TEST2', 30, 1000, 'SALESMAN', 1600);
INSERT INTO EMP VALUES(1002, 'TEST3', 30, 1000, 'SALESMAN', 1250);
INSERT INTO EMP VALUES(1003, 'TEST4', 20, 1000, 'MANAGER', 2975);
INSERT INTO EMP VALUES(1004, 'TEST5', 30, 1000, 'SALESMAN', 1250);
INSERT INTO EMP VALUES(1005, 'TEST6', 30, 1001, 'MANAGER', 2850);
INSERT INTO EMP VALUES(1006, 'TEST7', 10, 1001, 'MANAGER', 2450);
INSERT INTO EMP VALUES(1007, 'TEST8', 20, 1006, 'ANALYST', 3000);
INSERT INTO EMP VALUES(1008, 'TEST9', 30, 1006, 'PRESIDENT', 5000);
INSERT INTO EMP VALUES(1009, 'TEST10', 30, 1002, 'SALESMAN', 1500);
INSERT INTO EMP VALUES(1010, 'TEST11', 20, 1002, 'CLERK', 1100);
INSERT INTO EMP VALUES(1011, 'TEST12', 30, 1001, 'CLERK', 950);
INSERT INTO EMP VALUES(1012, 'TEST13', 20, 1000, 'ANALYST', 3000);
INSERT INTO EMP VALUES(1013, 'TEST14', 10, 1000, 'CLERK', 1300);

COMMIT

SELECT MAX(LEVEL)    /* LEVEL은 계층값을 가지고 있다. */
FROM EMP
START WITH MGR IS NULL
CONNECT BY PRIOR EMPNO = MGR;

MAX(LEVEL)

트리의 최대 깊이 : 4

CONNECT BY : 트리(Tree) 형태의 구조로 질의를 수행하는 것
- START WITH 구 : 시작 조건
- CONNECT BY PRIOR 구 : 조인 조건
루트 노드로부터 하위 노드의 질의를 실행한다.
계층형 조회에서 MAX(LEVEL)을 사용하여 최대 계층 수를 구할 수 있다.
- 계층형 구조에서 마지막 리프 노드(Leaf Node)의 계층값을 구한다.

SELECT LEVEL, EMPNO, MGR, ENAME
FROM EMP
START WITH MGR IS NULL
CONNECT BY PRIOR EMPNO = MGR;

LEVEL	EMPNO	MGR	ENAME	비고
1	1000	-	TEST1	ROOT(최상위)
2	1001	1000	TEST2
3	1005	1001	TEST6
3	1006	1001	TEST7
4	1007	1006	TEST8
4	1008	1006	TEST9
3	1011	1001	TEST12
2	1002	1000	TEST3	EMPNO 1001번과 1002번의 관리자는 EMPNO 1000번
3	1009	1002	TEST10
3	1010	1002	TEST11
2	1003	1000	TEST4
2	1004	1000	TEST5
2	1012	1000	TEST13
2	1013	1000	TEST14

계층형 조회 결과를 명확히 보기 위해서 LPAD 함수를 사용할 수 있다.
- 4 * (LEVEL - 1)
  - LEVEL 값이 루트(Root)이면 1이 된다. 따라서 4 * (1 - 1) = 0 이 된다.
    - LAPD(' ', 0)이므로 아무런 의미가 없다.
  - LEVEL 값이 2이면 4 * (2 - 1) = 4가 된다.
    - LPAD(' ', 4)이므로 왼쪽 공백 4칸을 화면에 출력한다.

SELECT LEVEL, LPAD(' ', 4 * (LEVEL - 1)) || EMPNO, MGR, CONNECT_BY_ISLEAF, ENAME
FROM EMP
START WITH MGR IS NULL
CONNECT BY PRIOR EMPNO = MGR;

CONNECT BY 키워드

키워드	설명
LEVEL	- 검색 항목의 깊이를 의미한다. - 계층 구조에서 최상위 레벨이 1이 된다.
CONNECT_BY_ROOT	계층 구조에서 가장 최상위 값을 표시한다.
CONNECT_BY_ISLEAF	계층 구조에서 가장 최하위 값을 표시한다.
SYS_CONNECT_BY_PATH	계층 구조에서 전체 전개 경로를 표시한다.
NOCYCLE	순환 구조가 발생 지점까지만 전개된다.
CONNECT_BY_ISCYCLE	순환구조 발생 지점을 표시한다.

③ 서브쿼리(Subquery)

메인 쿼리(Main Query)와 서브쿼리(Subquery)

서브쿼리(Subquery)
- SELECT 문 내에 다시 SELECT 문을 사용하는 SQL문
- 형태
  - 인라인 뷰(Inline View) : FROM 구에 SELECT 문 사용
  - 스칼라 서브쿼리(Scala Subquery) : SELECT 문에 서브쿼리(Subqery) 사용
  - WHERE 구에 SELECT 문 사용

SELECT *
FROM EMP
WHERE DEPTNO = (SELECT DEPTNO    /* 서브쿼리 */
                FROM DEPT
                WHERE DEPTNO=10);

서브쿼리 밖에 있는 SELECT 문은 메인 쿼리(Main Query) 이다.

SELECT *
FROM (SELECT ROWNUM NUM, ENAME    /* 인라인 뷰(Inline View) */
      FROM EMP) a    
WHERE NUM < 5;

FROM 구에 SELECT 문을 사용하여 가상의 테이블을 만드는 효과를 얻을 수 있다.

단일 행 서브쿼리와 다중 행 서브쿼리

서브쿼리(Subquery)는 반환하는 행의 개수에 따라 다음과 같이 분류된다.
- 단일 행 서브쿼리
- 멀티 행 서브쿼리

서브쿼리 종류	설명
단일 행 서브쿼리 (Single Row Subquery)	- 서브쿼리를 실행하면 그 결과는 반드시 한 행만 조회된다. - 비교 연산자인 =, <, <=, >, >=, <> 를 사용한다.
다중 행 서브쿼리 (Multi Row Subquery)	- 서브쿼리를 실행하면 그 결과는 여러 개의 행이 조회된다. - 다중 행 비교 연산자인 IN, ANY, ALL, EXISTS 를 사용한다.

다중 행 서브쿼리(Multi Row Subquery)

서브쿼리 결과가 여러 개의 행을 반환하는 것
다중 행 연산자를 사용해야 한다.

다중 행 비교 연산자

연산자	설명
IN(Subquery)	메인 쿼리의 비교 조건이 서브쿼리의 결과 중 하나만 동일하면 참이 된다. (OR 조건)
ALL(Subquery)	- 메인 쿼리와 서브쿼리의 결과가 모두 동일하면 참이 된다. - < ALL : 최솟값을 반환한다. - > ALL : 최댓값을 반환한다.
ANY(Subquery)	- 메인 쿼리의 비교조건이 서브쿼리의 결과 중 하나 이상 동일하면 참이 된다. - < ANY : 하나라도 크게 되면 참이 된다. - > ANY : 하나라도 작게 되면 참이 된다.
EXISTS(Subquery)	메인 쿼리와 서브쿼리의 결과가 하나라도 존재하면 참이 된다.

(1) IN

반환되는 여러 개의 행 중에서 하나만 참이 되어도 참이 되는 연산

SELECT ENAME, DNAME, SAL
FROM EMP, DEPT
WHERE EMP.DEPTNO=DEPT.DEPTNO
    AND EMP.EMPNO
    IN (SELECT EMPNO 
        FROM EMP
        WHERE SAL > 2000);   /* 급여(SAL)가 2000 보다 큰 사원번호를 조회한 후, EMP.EMPNO 조회 */

<EMP> 테이블에서 SAL이 2000 이상인 사원번호를 반환하고, 반환된 사원번호와 메인 쿼리에 있는 사원번호와 비교해서 같은 것을 조회한다.

(2) ALL

메인 쿼리와 서브쿼리의 결과가 모두 동일하면 참이 되는 연산

SELECT *
FOM EMP
WHERE DEPTNO <= ALL (20, 30)    /* DEPTNO가 20, 30보다 작거나 같은 것을 조회 */

(3) EXISTS

서브쿼리로 어떤 데이터의 존재 여부를 확인하는 것
- 결과로 참 또는 거짓이 반환된다.

SELECT ENAME, DNAME, SAL
FROM EMP, DEPT
WHERE EMP.DEPTNO=DEPT.DEPTNO
    AND EXISTS (SELECT 1 
                FROM EMP
                WHERE SAL > 2000);    /* 급여(SAL)가 2000 보다 큰 사원이 있으면 TRUE가 조회됨. */

스칼라 서브쿼리(Scala Subquery)

반드시 한 행과 한 컬럼만 반환하는 서브쿼리
여러 행이 반환되면 오류가 발생한다.

SELECT ENAME AS "이름"
       SAL AS "급여"
       (SELECT AVG(SAL) FROM EMP) AS "평균급여"    /* 스칼라 서브쿼리, 1개의 행만 조회되어야 함. */
FROM EMP
WHERE EMPNO=1000;

직원 급여를 조회할 때, 평균 급여를 같이 계산하여 조회한다.

연관 서브쿼리(Correlated Subquery)

서브쿼리 내에서 메인 쿼리 내의 칼럼을 사용하는 것

SELECT *
FROM EMP a    /* a : 연관 서브쿼리 */
WHERE a.DEPTNO = (SELECT DEPTNO 
                  FROM DEPT b
                  WHERE b.DEPTNO = a.DEPTNO);    /* 메인 쿼리에서 데이터를 받아서 서브쿼리를 실행 */

④ 그룹 함수(Group Function)

ROLLUP

GROUP BY 의 칼럼에 대해서 소계(Subtotal)를 만들어 준다.
ROLLUP 을 할 때, GROUP BY 구에 칼럼이 2개 이상 오면 순서에 따라서 결과가 달라진다.

SELECT DECODE(DEPTNO, NULL, '전체합계', DEPTNO), SUM(SAL)    /* DEPTNO가 NULL이면 '전체합계' 문자 출력 */
FROM EMP
GROUP BY ROLLUP(DEPTNO);    /* ROLLUP을 사용하면 부서별 합계 및 전체합계가 계산됨. */

DECODE(DEPTNO, NULL, '전체합계', DEPTNO)	SUM(SAL)
10	3750
20	10875
30	14400
전체합계	29025

SELECT DEPTNO, JOB, SUM(SAL)
FROM EMP
GROUP BY ROLLUP(DEPTNO, JOB);    /* 부서별, 직업별 합계를 구함. ROLLUP은 소계를 구함. */

DEPTNO	JOB	SUM(SAL)	비고
10	CLERK	1300
10	MANAGER	2450
10		3750	부서별 합계
20	CLERK	1900
20	ANALYST	6000
20	MANAGER	2975
20		10875	부서별, 직업별 합계
30	CLERK	950
30	MANAGER	2850
30	SALESMAN	5600
30	PRESIDENT	5000
30		14400	전체 합계
		29025

부서별 합계, 직업별 합계, 전체 합계가 모두 조회된다.
ROLLUP 으로 실행되는 칼럼별로 소계(Subtotal)을 만들어 준다.

GROUPING 함수

ROLLUP, CUBE, GROUPING SETS 에서 생성되는 합계값을 구분하기 위해 만들어진 함수
예를 들어, 소계, 합계 등이 계산되면 GROUPING 함수는 1을 반환하고, 그렇지 않으면 0을 반환해서 합계값을 식별할 수 있다.

SELECT DEPTNO, GROUPING(DEPTNO), JOB, GROUPING(JOB), SUM(SAL)  /* GROUPING SETS으로 계산된 합계는 '1'로 표시 */
FROM EMP
GROUP BY ROLLUP(DEPTNO, JOB);

DEPTNO	GROUPING(DEPTNO)	JOB	GROUPING(JOB)	SUM(SAL)	비고
10	0	CLERK	0	1300
10	0	MANAGER	0	2450
10	0		1	3750
20	0	CLERK	0	1900
20	0	ANALYST	0	6000
20	0	MANAGER	0	2975
20	0		1	10875
30	0	CLERK	0	950
30	0	MANAGER	0	2850
30	0	SALESMAN	0	5600
30	0	PRESIDENT	0	5000
30	0		1	14400	'1'의 값으로 소계와 전체 합계를 개발자가 구분할 수 있게 된다.
	1		1	29025	'1'의 값으로 소계와 전체 합계를 개발자가 구분할 수 있게 된다.

소계와 합계가 계산된 데이터는 GROUPING 함수에서 '1'이 출력된 것을 확인할 수 있다.
GROUPING 함수는 반환값을 DECODE 혹은 CASE 문으로 식별해서 SELECT 문으로 '소계', '합계'를 구분해준다.

SELECT DEPTNO, 
       DECODE(GROUPING(DEPTNO), 1, '전체합계') TOT,    /* DECODE를 사용해서 전체 합계와 부서 합계를 구함. */
       JOB, DECODE(GROUPING(JOB), 1, '부서합계') T_DEPT, 
       SUM(SAL)
FROM EMP
GROUP BY ROLLUP(DEPTNO, JOB);

DEPTNO	TOT	JOB	T_DEPT	SUM(SAL)	비고
10		CLERK		1300
10		MANAGER		2450
10			부서합계	3750
20		CLERK		1900
20		ANALYST		6000
20		MANAGER		2975
20			부서합계	10875
30		CLERK		950
30		MANAGER		2850
30		SALESMAN		5600
30		PRESIDENT		5000
30			부서합계	14400
	전체합계		부서합계	29025

GROUPING 함수를 사용하면 사용자가 필요로 하는 데이터를 SELECT 문으로 작성하여 제공할 수 있다.

GROUPING SETS 함수

GROUP BY에 나오는 칼럼의 순서와 관계없이 다양한 소계(Subtotal)를 만들 수 있다.
GROUP BY에 나오는 칼럼의 순서와 관계없이 개별적으로 모두 처리한다.

SELECT DEPTNO, JOB, SUM(SAL)
FROM EMP
GROUP BY GROUPING SETS(DEPTNO, JOB);    /* DEPTNO와 JOB을 각각 그룹으로 합계를 계산함 */ 
                                        /* DEPTNO와 JOB의 순서가 바뀌어도 결과는 같음. */

DEPTNO	JOB	SUM(SAL)	비고
	CLERK	4150	직업별 합계
	SALESMAN	5600
	PRESIDENT	5000
	MANAGER	8275
	ANALYST	6000
30		14400	부서별 합계
20		10875
10		3750

CUBE 함수

CUBE 함수에 제시한 칼럼에 대해서 결합 가능한 모든 집계를 계산한다.
- 조합할 수 있는 경우의 수가 모두 조합된다.
다차원 집계를 제공하여 다양하게 데이터를 분석할 수 있게 한다.
예) 부서와 직업을 CUBE로 사용할 경우, 조회되는 것
- 부서별 합계
- 직업별 합계
- 부서별 직업별 합계
- 전체 합계

SELECT DEPTNO, JOB, SUM(SAL)
FROM EMP
GROUP BY CUBE(DEPTNO, JOB);    /* 모든 합계를 모두 계산하는 다차원 분석 수행 */

DEPTNO	JOB	SUM(SAL)	비고
		29025	전체 합계
	CLERK	4150	직업별 합계
	ANALYST	6000
	MANAGER	8275
	SALESMAN	5600
	PRESIDENT	5000
10		3750	부서별 합계
10	CLERK	1300
10	MANAGER	2450
20		10875	부서별 합계
20	CLERK	1900
20	ANALYST	6000
20	MANAGER	2975
30		14400	부서별 합계
30	CLERK	950	부서별, 직업별 합계
30	MANAGER	2850
30	SALESMAN	5600
30	PRESIDENT	5000

⑤ 윈도우 함수(Window Function)

윈도우 함수

행과 행 간의 관계를 정의하기 위해서 제공되는 함수
윈도우 함수를 사용해서 순위, 합계, 평균, 행 위치 등을 조작할 수 있다.

SELECT WINDOW_FUNCTION(ARGUMENTS)
    OVER (PARTITION BY 칼럼
          ORDER BY WINDOWING절)
FROM 테이블명;

윈도우 함수의 구조

구조	설명
ARGUMENTS(인수)	윈도우 함수에 따라서 0 ~ N개의 인수를 설정한다.
PARTITION BY	전체 집합을 기준에 의해 소그룹으로 나눈다.
ORDER BY	어떤 항목에 대해서 정렬한다.
WINDOWING	- 행 기준의 범위를 정한다. - ROWS : 물리적 결과의 행 수 - RANGE : 논리적인 값에 의한 범위

WINDOWING

구조	설명
ROWS	부분집합인 윈도우 크기를 물리적 단위로 행의 집합을 지정한다.
RANGE	논리적인 주소에 의해 행 집합을 지정한다.
BETWEEN ~ AND	윈도우의 시작과 끝의 위치를 지정한다.
UNBOUNDED PRECEDING	윈도우의 시작 위치가 첫 번째 행임을 의미한다.
UNBOUNDED FOLLOWING	윈도우 마지막 위치가 마지막 행임을 의미한다.
CURRENT ROW	윈도우 시작 위치가 현재 행임을 의미한다.

SELECT EMPNO, ENAME, SAL,
       SUM(SAL) OVER(ORDER BY SAL
                     ROWS BETWEEN UNBOUNDED PRECEDING    /* 첫 번째 행 */
                     AND UNBOUNDED FOLLOWING) TOTSAL    /* 마지막 행 */
FROM EMP;

EMPNO	ENAME	SAL	TOTSAL	비고
1000	TEST1	800	29025	SAL의 전체 합계를 조회한다.
1011	TEST12	950	29025
1010	TEST11	1100	29025
1002	TEST3	1250	29025
1004	TEST5	1250	29025
1013	TEST14	1300	29025
1009	TEST10	1500	29025
1001	TEST2	1600	29025
1006	TEST7	2450	29025
1005	TEST6	2850	29025
1003	TEST4	2975	29025
1007	TEST8	3000	29025
1012	TEST13	3000	29025
1008	TEST9	5000	29025

SELECT EMPNO, ENAME, SAL,
       SUM(SAL) OVER(ORDER BY SAL
                     ROWS BETWEEN UNBOUNDED PRECEDING   
                     AND CURRENT ROW) TOTSAL    /* 첫 번째 행부터 현재 행까지의 합계(누적합)를 구함. */
FROM EMP;

EMPNO	ENAME	SAL	TOTSAL	비고
1000	TEST1	800	800	행 별로 누적 합계를 구한다.
1011	TEST12	950	1750
1010	TEST11	1100	2850
1002	TEST3	1250	4100
1004	TEST5	1250	5350
1013	TEST14	1300	6650
1009	TEST10	1500	8150
1001	TEST2	1600	9750
1006	TEST7	2450	12200
1005	TEST6	2850	15050
1003	TEST4	2975	18025
1007	TEST8	3000	21025
1012	TEST13	3000	24025
1008	TEST9	5000	29025

CURRENT ROW : 데이터가 인출된 현재 행

SELECT EMPNO, ENAME, SAL,
       SUM(SAL) OVER(ORDER BY SAL
                     ROWS BETWEEN CURRENT ROW
                     AND UNBOUNDED FOLLOWING) TOTSAL    /* 현재 행부터 마지막 행까지의 합계(누적합)를 구함. */
FROM EMP;

EMPNO	ENAME	SAL	TOTSAL	비고
1000	TEST1	800	29025	현재 행부터 마지막 행까지의 합계
1011	TEST12	950	28225
1010	TEST11	1100	27275
1002	TEST3	1250	26175
1004	TEST5	1250	24925
1013	TEST14	1300	23675
1009	TEST10	1500	22375
1001	TEST2	1600	20875
1006	TEST7	2450	19275
1005	TEST6	2850	16825
1003	TEST4	2975	13975
1007	TEST8	3000	11000
1012	TEST13	3000	8000
1008	TEST9	5000	5000

순위 함수(RANK Function)

윈도우 함수는 특정 항목과 파티션에 대해서 순위를 계산할 수 있는 함수를 제공한다.

순위(RANK) 관련 함수

함수	설명
RANK	- 특정 항목 및 파티션에 대해서 순위를 계산한다. - 동일한 순위는 동일한 값이 부여된다.
DENSE_RANK	동일한 순위를 하나의 건수로 계산한다.
ROW_NUMBER	동일한 순위에 대해서 고유의 순위를 부여한다.

SELECT EMPNO, ENAME, SAL,
       RANK() OVER(ORDER BY SAL DESC) ALL_RANK,    /* SAL 로 등수를 계산 (내림차순) */
       RANK() OVER(PARTITION BY JOB ORDER BY SAL DESC) JOB_RANK    /* JOB으로 파티션을 만들고, JOB별 순위를 조회 */
FROM EMP;

EMPNO	ENAME	SAL	ALL_RANK	JOB_RANK
1008	TEST9	5000	1	1
1012	TEST13	3000	2	1
1007	TEST8	3000	2	1
1003	TEST4	2975	4	1
1005	TEST6	2850	5	2
1006	TEST7	2450	6	3
1001	TEST2	1600	7	1
1009	TEST10	1500	8	2
1013	TEST14	1300	9	1
1002	TEST3	1250	10	3
1004	TEST5	1250	10	3
1010	TEST11	1100	12	2
1011	TEST12	950	13	3
1000	TEST1	800	14	4

RANK 함수는 순위를 계산하며, 동일한 순위에는 같은 순위가 부여된다.

SELECT ENAME, SAL,
       RANK() OVER(ORDER BY SAL DESC) ALL_RANK,  
       DENSE_RANK() OVER(ORDER BY SAL DESC) DENSE_RANK    /* 동일한 순위를 하나의 건수로 계산 */
FROM EMP;

ENAME	SAL	ALL_RANK	DENSE_RANK	비고
TEST9	5000	1	1	2등이 2명이면 3등이 없지만, DENSE_RANK()는 건수로 인식하기 때문에 3등이 있게 된다.
TEST13	3000	2	2
TEST8	3000	2	2
TEST4	2975	4	3
TEST6	2850	5	4
TEST7	2450	6	5
TEST2	1600	7	6
TEST10	1500	8	7
TEST14	1300	9	8
TEST3	1250	10	9
TEST5	1250	10	9
TEST11	1100	12	10
TEST12	950	13	11
TEST1	800	14	12

DENSE_RANK 함수는 동일한 순위를 하나의 건수로 인식해서 조회한다.

SELECT ENAME, SAL,
       RANK() OVER(ORDER BY SAL DESC) ALL_RANK,  
       ROW_NUMBER() OVER(ORDER BY SAL DESC) ROW_NUM    /* 동일한 순위에 다른 고유한 순위를 부여 */
FROM EMP;

ENAME	SAL	ALL_RANK	ROW_NUM
TEST9	5000	1	1
TEST13	3000	2	2
TEST8	3000	2	3
TEST4	2975	4	4
TEST6	2850	5	5
TEST7	2450	6	6
TEST2	1600	7	7
TEST10	1500	8	8
TEST14	1300	9	9
TEST3	1250	10	10
TEST5	1250	10	11
TEST11	1100	12	12
TEST12	950	13	13
TEST1	800	14	14

ROW_NUMBER 함수는 동일한 순위에 대해서 고유한 순위를 부여한다.

집계 함수(AGGREGATE Function)

집계(AGGREGATE) 관련 윈도우 함수

함수	설명
SUM	파티션 별로 합계를 계산한다.
AVG	파티션 별로 평균을 계산한다.
COUNT	파티션 별로 행 수를 계산한다.
MAX, MIN	파티션 별로 최댓값과 최솟값을 계산한다.

SELECT ENAME, SAL,
       SUM(SAL) OVER(PARTITION BY MGR) SUM_MGR    /* 같은 관리자(MGR)에 파티션을 만들고 합계(SUM)를 계산 */
FROM EMP;

ENAME	SAL	SUM_MGR	비고
TEST14	1300	11375	같은 관리자의 급여 합계를 보여준다.
TEST2	1600	11375
TEST3	1250	11375
TEST4	2975	11375
TEST5	1250	11375
TEST13	3000	11375
TEST6	2850	6250
TEST7	2450	6250
TEST12	950	6250
TEST10	1500	2600
TEST11	1100	2600
TEST9	5000	8000
TEST8	3000	8000
TEST1	800	800

행 순서 관련 함수

상위 행의 값을 하위 행에 출력하거나 하위 행의 값을 상위 행에 출력할 수 있다.
특정 위치의 행을 출력할 수 있다.

행 순서 관련 윈도우 함수

함수	설명
FIRST_VALUE	- 파티션에서 가장 처음에 나오는 값을 구한다. - MIN 함수를 사용해서 같은 결과를 구할 수 있다.
LAST_VALUE	- 파티션에서 가장 나중에 나오는 값을 구한다. - MAX 함수를 사용해서 같은 결과를 구할 수 있다.
LAG	이전 행을 가지고 온다.
LEAD	- 윈도우에서 특정 위치의 행을 가지고 온다. - 기본값 : 1

SELECT DEPTNO, ENAME, SAL,
       FIRST_VALUE(ENAME) OVER(PARTITION BY DEPTNO     /* 첫 번째 행을 가지고 옴, 부서 파티션을 만듦. */
                               ORDER BY SAL DESC 
                               ROWS UNBOUNDED PRECEDING) AS DEPT_A    
FROM EMP;

DEPTNO	ENAME	SAL	DEPT_A	비고
10	TEST7	2450	TEST7	10번 부서 TEST7과 TEST14가 있고, 이 중에서 TEST7의 급여가 많다.
10	TEST14	1300	TEST7
20	TEST8	3000	TEST8
20	TEST13	3000	TEST8
20	TEST4	2975	TEST8
20	TEST11	1100	TEST8
20	TEST1	800	TEST8
30	TEST9	5000	TEST9
30	TEST6	2850	TEST9
30	TEST2	1600	TEST9
30	TEST10	1500	TEST9
30	TEST3	1250	TEST9
30	TEST5	1250	TEST9
30	TEST12	950	TEST9

FIRST_VALUE 함수는 파티션에서 조회된 행 중에서 첫 번째 행의 값을 가지고 온다.

SELECT DEPTNO, ENAME, SAL,
       LAST_VALUE(ENAME) OVER(PARTITION BY DEPTNO     /* 마지막 행을 가지고 옴, 부서 파티션을 만듦. */
                              ORDER BY SAL DESC 
                              ROWS BETWEEN CURRENT ROW AND UNBOUNDED FOLLOWING) AS DEPT_A    
FROM EMP;

DEPTNO	ENAME	SAL	DEPT_A	비고
10	TEST7	2450	TEST14	10번 부서 TEST7과 TEST14가 있고, 이중에서 TEST14의 급여가 적다.
10	TEST14	1300	TEST14
20	TEST8	3000	TEST1
20	TEST13	3000	TEST1
20	TEST4	2975	TEST1
20	TEST11	1100	TEST1
20	TEST1	800	TEST1
30	TEST9	5000	TEST12
30	TEST6	2850	TEST12
30	TEST2	1600	TEST12
30	TEST10	1500	TEST12
30	TEST3	1250	TEST12
30	TEST5	1250	TEST12
30	TEST12	950	TEST12

LAST_VALUE 함수는 파티션에서 조회된 행 중에서 마지막 행의 값을 가지고 온다.

SELECT DEPTNO, ENAME, SAL,
    LAG(SAL) OVER(ORDER BY SAL DESC) AS PRE_SAL
FROM EMP;

DEPTNO	ENAME	SAL	PRE_SAL
30	TEST9	5000	-
20	TEST13	3000	5000
20	TEST8	3000	3000
20	TEST4	2975	3000
30	TEST6	2850	2975
10	TEST7	2450	2850
30	TEST2	1600	2450
30	TEST10	1500	1600
10	TEST14	1300	1500
30	TEST3	1250	1300
30	TEST5	1250	1250
20	TEST11	1100	1250
30	TEST12	950	1100
20	TEST1	800	950

LAG 함수는 이전의 값을 가지고 온다.

SELECT DEPTNO, ENAME, SAL,
    LEAD(SAL, 2) OVER(ORDER BY SAL DESC) AS PRE_SAL
FROM EMP;

DEPTNO	ENAME	SAL	PRE_SAL
30	TEST9	5000	3000
20	TEST13	3000	2975
20	TEST8	3000	2850
20	TEST4	2975	2450
30	TEST6	2850	1600
10	TEST7	2450	1500
30	TEST2	1600	1300
30	TEST10	1500	1250
10	TEST14	1300	1250
30	TEST3	1250	1100
30	TEST5	1250	950
20	TEST11	1100	800
30	TEST12	950	-
20	TEST1	800	-

LEAD 함수는 지정된 위치의 행을 가지고 온다.
- 기본값은 1이며, 첫 번째 행의 값을 가지고 오는 것이다.

비율 관련 함수

누적 백분율, 순서별 백분율, 파티션을 N분으로 분할한 결과 등을 조회할 수 있다.

비율 관련 윈도우 함수

함수	설명
CUME_DIST	- 파티션 전체 건수에서 현재 행보다 작거나 같은 건수에 대한 누적 백분율을 조회한다. - 누적 분포상의 위치는 0~1 사이의 값을 가진다.
PERCENT_RANK	파티션에서 제일 먼저 나온 것을 0으로, 제일 늦게 나온 것을 1로 하여 값이 아닌 행의 순서별 백분율을 조회한다.
NTILE	파티션별로 전체 건수를 ARGUMENT 값으로 N 등분한 결과를 조회한다.
RATIO_TO_REPORT	파티션 내에 전체 SUM(칼럼)에 대한 행 별 칼럼값의 백분율을 소수점까지 조회한다.

SELECT DEPTNO, ENAME, SAL,
       PERCENT_RANK() OVER(PARTITION BY DEPTNO
                           ORDER BY SAL DESC) AS PERCENT_SAL    /* 부서 내의 등수를 백분율로 구함. */  
FROM EMP;

DEPTNO	ENAME	SAL	PERCENT_SAL	비고
10	TEST7	2450	0	같은 부서에서 자신의 급여 퍼센트(등수)를 구한다.
10	TEST14	1300	1	같은 부서에서 자신의 급여 퍼센트(등수)를 구한다.
20	TEST8	3000	0
20	TEST13	3000	0
20	TEST4	2975	.5
20	TEST11	1100	.75
20	TEST1	800	1
30	TEST9	5000	0
30	TEST6	2850	.1666666666666666666666666666666666666667
30	TEST2	1600	.3333333333333333333333333333333333333333
30	TEST10	1500	.5
30	TEST3	1250	.6666666666666666666666666666666666666667
30	TEST5	1250	.6666666666666666666666666666666666666667
30	TEST12	950	1

PERCENT_RANK 함수는 파티션에서 등수의 퍼센트를 구한다.

SELECT DEPTNO, ENAME, SAL,
       NTILE(4) OVER(ORDER BY SAL DESC) AS N_TILE    /* 4개로 등분하여 분류 */  
FROM EMP;

DEPTNO	ENAME	SAL	N_TILE	비고
30	TEST9	5000	1	급여가 높은 순으로 4개로 등분한다.
20	TEST13	3000	1
20	TEST8	3000	1
20	TEST4	2975	1
30	TEST6	2850	2
10	TEST7	2450	2
30	TEST2	1600	2
30	TEST10	1500	2
10	TEST14	1300	3
30	TEST3	1250	3
30	TEST5	1250	3
20	TEST11	1100	4
30	TEST12	950	4
20	TEST1	800	4

NTILE(4) 는 4등분으로 분할하라는 의미로, 위의 예에서는 급여가 높은 순으로 1~4 등분으로 분할한다.

⑥ 테이블 파티션(Table Partition)

파티션 기능

파티션은 대용량의 테이블을 여러 개의 데이터 파일에 분리해서 저장한다.
테이블의 데이터가 물리적으로 분리된 데이터 파일에 저장되면 입력, 수정, 삭제, 조회 성능이 향상된다.
파티션은 각각의 파티션 별로 독립적으로 관리될 수 있다.
- 파티션 별로 백업하고 복구가 가능하면 파티션 전용 인덱스 생성도 가능하다.
파티션은 Oracle 데이터베이스의 논리적 관리 단위인 테이블 스페이스 간에 이동이 가능하다.
데이터를 조회할 때 데이터의 범위를 줄여서 성능을 향상시킨다.

Range Partition

테이블의 칼럼 중에서 값의 범위를 기준으로 여러 개의 파티션으로 데이터를 나누어 저장하는 것

List Partition

특정 값을 기준으로 분할하는 방법

Hash Partition

데이터베이스 관리 시스템이 내부적으로 해시 함수를 사용해서 데이터를 분할한다.
결과적으로 데이터베이스 관리 시스템이 알아서 분할하고 관리하는 것이다.

Composite Partition

여러 개의 파티션 기법을 조합해서 사용하는 것

파티션 인덱스

4가지 유형의 인덱스를 제공한다.
Oracle 데이터베이스는 Global Non-Prefixed 를 지원하지 않는다.

구분	주요 내용
Global Index	여러 개의 파티션에서 하나의 인덱스를 사용한다.
Local Index	해당 파티션 별로 각자의 인덱스를 사용한다.
Prefixed Index	파티션 키와 인덱스 키가 동일한다.
Non Prefixed Index	파티션 키와 인덱스 키가 다르다.

728x90

저작자표시 비영리 동일조건

'Certificate > SQLD' 카테고리의 다른 글

[SQLD] 실전 문제 : SQL 기본 ① (1)	2022.06.25
[SQLD] 실전 문제 : 데이터 모델과 성능 (0)	2022.06.23
[SQLD] 실전 문제 : 데이터 모델링의 이해 (0)	2022.06.21
[SQLD] SQL 최적화의 원리 (0)	2022.01.20
[SQLD] SQL 기본 (0)	2022.01.18
[SQLD] 데이터 모델과 성능 (0)	2022.01.17
[SQLD] 데이터 모델링(Data Modeling) (0)	2022.01.14
[SQLD] SQLD 소개 (0)	2022.01.13

⚠️AdBlock이 감지되었습니다. 원할한 페이지 표시를 위해 AdBlock을 꺼주세요.⚠️

[SQLD] SQL 활용

[SQLD] SQL 활용

① 조인(Join)

EQUI(등가) 조인 (교집합)

(1) EQUI(등가) 조인

(2) INNER JOIN

(3) INTERSECT 연산

Non-EQUI(비등가) 조인

OUTER JOIN

(1) LEFT OUTER JOIN 과 RIGHT OUTER JOIN

CROSS JOIN

UNION을 사용한 합집합 구현

(1) UNION

(2) UNION ALL

차집합을 만드는 MINUS

② 계층형 조회(CONNECT BY)

CONNECT BY 키워드

③ 서브쿼리(Subquery)

메인 쿼리(Main Query)와 서브쿼리(Subquery)

단일 행 서브쿼리와 다중 행 서브쿼리

다중 행 서브쿼리(Multi Row Subquery)

다중 행 비교 연산자

(1) IN

(2) ALL

(3) EXISTS

스칼라 서브쿼리(Scala Subquery)

연관 서브쿼리(Correlated Subquery)

④ 그룹 함수(Group Function)

ROLLUP

GROUPING 함수

GROUPING SETS 함수

CUBE 함수

⑤ 윈도우 함수(Window Function)

윈도우 함수

순위 함수(RANK Function)

순위(RANK) 관련 함수

집계 함수(AGGREGATE Function)

집계(AGGREGATE) 관련 윈도우 함수

행 순서 관련 함수

행 순서 관련 윈도우 함수

비율 관련 함수

비율 관련 윈도우 함수

⑥ 테이블 파티션(Table Partition)

파티션 기능

Range Partition

List Partition

Hash Partition

Composite Partition

파티션 인덱스

'Certificate > SQLD' 카테고리의 다른 글

✏️ 카테고리

🏷️ 태그 목록

🗒️ 최근에 올라온 글

⭐ 인기 카테고리

📅 달력

📦 글 보관함

티스토리툴바