SQL BOOSTER - OUTER JOIN
1. OUTER JOIN이란
- 이너-조인은 조인 조건에 만족한 데이터만 결과에 나올 수 있다. 반면에 아우터 조인은 조인 조건에 만족하지 않은 데이터도 결과에 나온다.
- 아우터-조인을 설명하기 위해 기준 데이터 집합과 탐조 데이터 집합이란 용어를 정의하자
- 기준 데이터 집합: 아우터-조인의 기준이 되는 집합
- 참조 데이터 집합: 아우터-조인의 참조가 되는 집합
- 기준 데이터 집합은 조인 조건을 만족하지 않아도 모두 결과에 포함된다.
- 아우터-조인을 사용하려면, 조인 조건 컬럼 한쪽에 +를 추가하면 된다. (+가 있는 쪽이 참조 데이터 집합이다.)
--이너조인
SELECT T1.CUS_ID, T1.CUS_NM, T2.CUS_ID,T2.EVL_LST_NO
FROM M_CUS T1, T_ITM_EVL T2
WHERE T1.CUS_ID = 'CUS_0002' AND T1.CUS_ID = T2.CUS_ID;
--아우터조인
SELECT T1.CUS_ID, T1.CUS_NM, T2.CUS_ID,T2.EVL_LST_NO
FROM M_CUS T1, T_ITM_EVL T2
WHERE T1.CUS_ID = 'CUS_0002'
AND T1.CUS_ID = T2.CUS_ID(+);
- 조인 조건에 +표시가 있으니 아우터-조인이다.
- + 표시가 붙은 T2는 아우터 조인의 참조 데이터 집합이다.
- + 표시가 없는 T1은 아우터 조인의 기준 데이터 집합이다.
> 기준 데이터 집합은 조인에 성공 못 해도 결괏값이 나온다. (이때, 참조쪽 결과는 null로 채워짐)
SELECT T1.CUS_ID, T1.CUS_NM, T2.CUS_IT, T2.ITM_ID, T2.EVL_LST_NO
FROM M_CUS T1, T_ITM_EVL T2
WHERE T1.CUS_ID IN ('CUS_0002','CUS_0011')
AND T1.CUS_IT = T2.CUS_ID(+)
ORDER BY T1.CUS_ID;
2. OUTER-JOIN 필터 조건
아우터-조인에는 참조 데이터 집합의 필터 조건에도 + 표시를 추가해야 한다. 아래 두 개 SQL을 살펴보자
SELECT T1.CUS_ID, T1.CUS_NM, T2.CUS_ID, T2.ITM_ID, T2.EVL_LST_NO, T2.EVL_DT
FROM M_CUS T1, T_ITM_EVL T2
WHERE T1.CUS_ID IN ('CUS_0073')
AND T1.CUS_ID = T2.CUS_ID(+)
AND T2.EVL_DT = TO_DATE('20170201','YYYYMMDD')
AND T2.EVL_DT < TO_DATE ('20170301','YYYYMMDD');
SELECT T1.CUS_ID, T1.CUS_NM, T2.CUS_ID, T2.ITM_ID, T2.EVL_LST_NO, T2.EVL_DT
FROM M_CUS T1, T_ITM_EVL T2
AND T1.CUS_ID = T2.CUS_ID(+)
AND T2.EVL_DT(+) = TO_DATE('20170201','YYYYMMDD')
AND T2.EVL_DT(+) < TO_DATE ('20170301','YYYYMMDD');
- 아우터-조인을 하면서, T2 컬럼쪽에 +를 사용했다 (WHERE 문)
- 왼쪽의 SQL은 조회되는 결과가 없다. 오른쪽만 결과가 나온다. 이는 참조 데이터 집합 쪽 필터 조건에 +표시 때문이다.
- 참조 쪽 필터 조건에 + 사용 : 아우터-조인 전에 필터 조건에 사용된다.
- 팜조 쪽 필터 조건에 + 미사용 : 아우터-조인 후 조인 결과에 필터 조건이 사용된다.
- 위쪽 SQL은 아우터 조인이 먼저 처리된 후 필터가 적용된다. -> 아우터 조인이 이루어지면, 참조 데이터 집합의 EVL_DT는 NULL이된다. 그렇다면, 다음 AND 라인을 만족하는 데이터가 없음으로, 조회결과가 없다. 결과적으로 이너조인과 같아진다.
- 기본적으로 아우터 조인을 사용할 때는 + 필터 조건을 표시해야한다. 이게 필요없다면, 이너조인을 쓰는게 맞다.
3. 실행 불가능한 OUTER-JOIN
아우터-조인에서 + 표시가 된 참조 데이터 집합은 두 개 이상의 기준 데이터 집합을 동시에 가질 수 없다.
SELECT T1.CUS_ID, T2.ITM_ID, T1.ORD_DT, T3.EVL_PT
FROM T_ORD T1, T_ROD_DET T2, T_ITM_EVL T3
WHERE T1.ORD_SEQ = T2.ORD_SEQ
-- 생략
AND T3.CUS_ID(+) = T1.CUS_ID
AND T3.ITM_ID(+) = T2.ITM_ID;
위 SQL은 불가능한 아우터 조인의 예시이다. 참조 데이터 집합은 기준 데이터 집합을 동시에 두 개 이상 가질 수 없다.
이를 해결하려면, 인라인 뷰를 하나 만들어야한다.
SELECT T0.CUS_ID, T0.ITM_ID, T0.ORD_DT, T3.ITM_ID, T3.EVL_PT
FROM
(
SELECT T1.CUS_ID, T2.ITM_ID, T1.ORD_DT
FROM T_ORD T1, T_ORD_DET T2
WHERE T1.ORD_SEQ = T2.ORD_SEQ
AND T1.CUS_ID ='CUS_0002'
AND T1.ORD_DT >= TO_DATE('20170122','YYYYMMDD')
AND T1.ORD_DT < TO_DATE ('20170123','YYYYMMDD')
)T0
,T_ITM_EVL T3
WHERE T3.CUS_ID(+) = T0.CUS_ID
AND T3.ITM_ID(+) = T0.ITM_ID
ORDER BY T0.CUS_ID;
4. OUTER-JOIN이 포함된 여러 테이블의 조인
- 아우터-조인과 이너-조인을 동시에 사용할 때 주의할 점을 알아보자
SELECT T1.CUS_ID, T2.ORD_SEQ, T3.ORD_SEQ, T3.ITM_ID
FROM M_CUS T1, T_ORD T2, T_ORD_DET T3
WHERE T1.CUS_ID = 'CUS_0073'
AND T1.CUS_ID = T2.CUS_ID(+)
AND T2.ORD_DT(+) >= TO_DATE ('20170122','YYYYMMDD')
AND T2.ORD_DT(+) < TO_DATE ('20170123','YYYYMMDD')
AND T3.ORD_SEQ = T2.ORD_SEQ;
- 위 SQL의 조인 조건은 T1과 T2를 아우터 조인하고, T2와 T3를 이너 조인으로 처리하고 있다.
- 아우터 조인이 있음에도 불구하고, 조회되는 데이터가 한건도 없다. 원인은 다음과 같다.
- 왼쪽 1번 결과는 T1과 T2가 아우터 조인 처리된 결과이다. T2테이블이 null로 채워져있다.
- 이를 다시 T3와 이너조인하면, 결과가 있을 수 없다.
- 조인 결과가 나오게하려면, T3.ORD_SEQ(+) = T2.ORD_SEQ와 같이 아우터 조인으로 변경해야한다.
* 여러 테이블이 조인될 때, 아우터 조인이 수행된 참조 데이터 집합은 기준 집합이 되어서 다른 테이블과 아우터 조인 해야한다.
5. OUTER-JOIN 응용
아우터-조인은 조인에 성공하지 못해도 기준 데이터 집합은 무조건 조회되는 특징이 있다.
해당 특성은 분석 리포트에서 실적이 없는 마스터도 결과에 포함시킬 때 유용하다!!
SELECT T1.CUS_ID, COUNT(*) ORD_CNT_1, COUNT(T2.ORD_SEQ) ORD_CNT_2
FROM M_CUS T1, T_ORD T2
WHERE T1.CUS_ID = T2.CUS_ID(+)
AND T2.ORD_DT(+) >= TO_DATE('20170101','YYYYMMDD')
AND T2.ORD_DT(+) < TO_DATE('20170201','YYYYMMDD')
GROUP BY T1.CUS_ID
ORDER BY COUNT(*), T1.CUS_ID;
고객 테이블은 기준 집합으로 아우터 조인 했기 때문에, 주문이 없는 고객도 모두 조회 가능하다.
주문 건수를 구하기 위해 COUNT 집계함수를 사용하는데, 2번 라인은 COUNT(*)을 수행했고, 3번 라인은 COUNT(T2.ORD_SEQ)를 사용했다.