SQL 기본 및 활용 · 집계와 정렬 11 / 32

GROUP BY, HAVING, ORDER BY 결과 읽기

집계 함수, 그룹화, 그룹 조건, 정렬이 결과 행 수와 표시 순서를 어떻게 바꾸는지 시험 풀이 순서로 정리합니다.

출제 빈도 ★★★★★ 관련 문제 10개 | GROUP BYHAVINGCOUNTROLLUPCUBE

집계 문제는 행 수 변화부터 봅니다

GROUP BY가 없는 SELECT는 보통 조건을 만족한 행을 그대로 보여줍니다. 하지만 GROUP BY가 있으면 여러 행이 그룹 단위로 묶이고, 결과 행 수가 그룹 수만큼 줄어듭니다.

SELECT deptno, COUNT(*) AS emp_count
FROM emp
GROUP BY deptno;

이 쿼리는 사원 한 명당 한 행이 아니라 부서 하나당 한 행을 반환합니다.

-- COUNT(*) = 14, COUNT(comm) = 3 (comm 있는 사원만)
-- → NULL 인 comm 은 11개
SELECT COUNT(*), COUNT(comm), COUNT(*) - COUNT(comm) AS null_count
FROM emp;

GROUP BY를 사용하면 SELECT 절에는 다음 중 하나만 올 수 있습니다.

-- ✗ 잘못된 예: job 이 그룹 기준도 집계도 아님
SELECT deptno, job, COUNT(*)
FROM emp
GROUP BY deptno;

위 쿼리는 job이 그룹 기준도 집계 함수도 아니므로 오류가 발생합니다. 부서별로 여러 직무가 있을 수 있어 DBMS가 어떤 job을 보여줘야 할지 결정할 수 없기 때문입니다.

GROUP BY에 표현식도 가능

컬럼명뿐 아니라 함수·식도 그룹 기준이 됩니다. 예: 이름 첫 글자별 집계.

SELECT SUBSTR(ename, 1, 1) AS initial, COUNT(*)
FROM emp
GROUP BY SUBSTR(ename, 1, 1);

단 SELECT의 별칭을 GROUP BY에 쓸 수 없습니다 (실행 순서 때문). 표현식을 그대로 반복 작성합니다.

WHERE sal >= 1000

HAVING AVG(sal) >= 2000

SELECT deptno, AVG(sal) AS avg_sal
FROM emp
WHERE job <> 'PRESIDENT'
GROUP BY deptno
HAVING AVG(sal) >= 2000;

WHERE는 사장 행을 먼저 제거하고, HAVING은 부서별 평균을 계산한 뒤 그룹을 제거합니다. 개별 행 조건은 WHERE에 두어야 처리 대상이 줄어들어 성능에 유리합니다.

ORDER BY는 최종 결과의 표시 순서를 정합니다.

SELECT deptno, COUNT(*) AS emp_count
FROM emp
GROUP BY deptno
ORDER BY emp_count DESC, deptno ASC;

정렬 기준이 여러 개이면 앞 기준이 같을 때 다음 기준을 사용합니다. 위 쿼리는 사원 수가 많은 부서가 먼저 나오고, 사원 수가 같으면 부서번호가 작은 순서로 표시됩니다.

GROUPING(col) 함수는 결과 행이 해당 컬럼의 소계 행인지(1) 아닌지(0)를 알려줍니다. NULL과 소계-NULL을 구별할 때 사용합니다.

SELECT 논리 실행 순서

작성 순서는 SELECT → FROM → WHERE … 이지만 평가는 FROM부터 시작합니다.

WHERE는 행을 줄이고, GROUP BY는 행을 묶고, HAVING은 묶인 결과를 다시 거릅니다.