1. 정규화를 통한 성능 향상 전략
- 정규화는 기본적으로 데이터에 대한 중복성을 제거해주고 데이터가 관심사별로 처리되는 경우가 많아 성능이 향상되는 특징을 가지고 있다. 물론 SQL문장에서 조인으로 인한 성능저하가 나타나는 경우도 있긴 함. 이럴 때는 반정규화 해줘야함.
일반적으로 정규화를 하면 입력/수정/삭제 성능이 향상되고 조회 성능은 저하될 수도 향상될 수도 있음.
- 정규화를 수행한다고 해서 반드시 조회 성능이 저하되는 것은 아님.
정규화를 통해 조회 성능이 향상되는 사례 - 2차 정규화 사례에 해당
제3절. 반정규화와 성능
1. 반정규화의 대상 고려하기
데이터가 대량이고 성능이 저하될 것으로 예상이 되면 다음 4가지를 고려하여 반정규화를 고려한다.
n 자주 사용되는 테이블에 접근하는 프로세스의 수가 많고 항상 일정한 범위만을 조회하는 경우
n 테이블에 대량의 데이터가 있고 대량의 데이터 범위를 자주 처리하는 경우에 처리범위를 일정하게 줄이지 않으면 성능을 보장할 수 없을 경우에 검토
n 통계성 프로세스에 의해 통계 정보를 필요로 할 때 별도의 통계테이블(반정규화 테이블)을 생성한다.
n 테이블에 지나치게 많은 조인이 걸려 데이터를 조회하는 작업이 기술적으로 어려울 경우 반정규화를 검토
1. 반정규화 외에 다른 방법으로 처리 가능한지 탐색해보기
è 뷰를 사용하면 해결할 수 있는가? (조인)
è 클러스터링 적용, 인덱스 조정, 파티셔닝 기법을 적용 (대량 데이터)
è 기타의 경우 응용 어플리케이션에서 로직을 구사하는 방법을 변경함으로써 성능을 향상시킬 수 있다. 데이터를 캐쉬하는 등등
2. 반정규화외에 방법이 없다면 적용하기
반정규화의 기법
테이블 병합 |
1:1 관계 테이블 병합 | |
1:M 관계 테이블 병합 | ||
슈퍼/서브타입 테이블 병합 | ||
테이블 분할 |
수직분할 | 컬럼단위의 테이블을 디스크I/O를 분산처리하기 위해 테이블을 1:1로 분리하여 성능향상 |
수평분할 | 로우단위의 집중 발생되는 트랜잭션을 분석하여 디스크I/O및 데이터 접근의 효율성을 높여 성능을 향상하기 위하여 로우단위로 테이블 쪼갬 | |
테이블 추가 |
중복 테이블 추가 | 다른 업무이거나 서버가 다른 경우 테이블 구조를 중복하여 원격조인을 제거하여 성능 향상 |
통계 테이블 추가 | SUM/AVG 등을 미리 수행하여 계산해두고 조회 시 성능을 향상시킴 | |
이력 테이블 추가 | 이력테이블 중 마스터테이블에 존재하는 레코드를 중복하여 이력테이블에 존재시키는 유형 | |
부분 테이블추가 | 하나의 테이블의 전체 칼럼 중 자주 이용하는 집중화된 칼럼들이 있을 때 디스크I/O를 줄이기 위해 해당 컬럼들을 모아놓은 별도의 반정규화된 테이블을 생산한다. |
칼럼 반정규화 기법
중복칼럼 추가 | 조인에 의해 처리할 때 성능저하를 예방하기 위해( 조인감소 위해) 중복칼럼추가 |
파생칼럼 추가 | 트랜잭션이 처리되는 시점에 계산에 의해 발생되는 성능저하를 예방하기 위해 미리값을 계산하여 칼럼에 보관함 |
이력테이블 칼럼 추가 | 대량의 이력데이터를 처리할 때 불특정 날 조회나 최근값을 조회할 때 나타날 수 있는 성능저하를 예방하기 위해 이력테이블에 기능성 칼럼(최근값여부, 시작과 종료일자) 등을 추가함 |
PK에 의한 칼럼 추가 | |
응용시스템 오작동을 위한 칼럼 추가 | 업무적으로는 의미가 없으나 사용자가 데이터처리를 하다가 잘못 처리하여 원래값으로 복기하기를 원하는 경우 이전 데이터를 임시적으로 중복하여 보관하는 기법. |
관계 반정규화
중복관계 추가 | 조인이 가능하지만 성능저하를 예방하기 위해 추가적인 관계를 맺는 방법 |
반정규화를 통한 성능향상 사례 1
최근 변경된 값을 조회하려고 할 때, 반정규화를 시키지 않으면 여러 번 조인을 해야해서 복잡한 SQL구문이 나온다. 왼쪽의
모델을 적절하게 반정규화를 적용하여
모델을 적절하게 반정규화를 적용하여 가장 최근데 변경된 값을 마스터에 위치시키면 아주 간단하게 SQL문 작성 가능하다.
반정규화를 통한 성능향상 사례 2
서버B의 연계테이블에서 부서명에 따른 연계상태코드를 가져오는 SQL문을 작성한다면 ㅇ
연계테이블 -> 접수 -> 부서 코드로 접근을 해야한다. 아주 비효율적이다.
그래서 서버A에 있는 부서테이블의 부서명을 서버B의 연계테이블에 부서명으로 속성 반정규화를 함으로써 향상시킬 수 있다.
⊙ 반정규화를 할 때 기억할 것은 데이터를 입력.수정,삭제할 때는 성능이 떨어진다는 것, 데이터 무결성 유지에도 유의할 것
제3절. 반정규화와 성능
1. 반정규화의 대상 고려하기
데이터가 대량이고 성능이 저하될 것으로 예상이 되면 다음 4가지를 고려하여 반정규화를 고려한다.
n 자주 사용되는 테이블에 접근하는 프로세스의 수가 많고 항상 일정한 범위만을 조회하는 경우
n 테이블에 대량의 데이터가 있고 대량의 데이터 범위를 자주 처리하는 경우에 처리범위를 일정하게 줄이지 않으면 성능을 보장할 수 없을 경우에 검토
n 통계성 프로세스에 의해 통계 정보를 필요로 할 때 별도의 통계테이블(반정규화 테이블)을 생성한다.
n 테이블에 지나치게 많은 조인이 걸려 데이터를 조회하는 작업이 기술적으로 어려울 경우 반정규화를 검토
1. 반정규화 외에 다른 방법으로 처리 가능한지 탐색해보기
è 뷰를 사용하면 해결할 수 있는가? (조인)
è 클러스터링 적용, 인덱스 조정, 파티셔닝 기법을 적용 (대량 데이터)
è 기타의 경우 응용 어플리케이션에서 로직을 구사하는 방법을 변경함으로써 성능을 향상시킬 수 있다. 데이터를 캐쉬하는 등등
2. 반정규화외에 방법이 없다면 적용하기
반정규화의 기법
테이블 병합 |
1:1 관계 테이블 병합 | |
1:M 관계 테이블 병합 | ||
슈퍼/서브타입 테이블 병합 | ||
테이블 분할 |
수직분할 | 컬럼단위의 테이블을 디스크I/O를 분산처리하기 위해 테이블을 1:1로 분리하여 성능향상 |
수평분할 | 로우단위의 집중 발생되는 트랜잭션을 분석하여 디스크I/O및 데이터 접근의 효율성을 높여 성능을 향상하기 위하여 로우단위로 테이블 쪼갬 | |
테이블 추가 |
중복 테이블 추가 | 다른 업무이거나 서버가 다른 경우 테이블 구조를 중복하여 원격조인을 제거하여 성능 향상 |
통계 테이블 추가 | SUM/AVG 등을 미리 수행하여 계산해두고 조회 시 성능을 향상시킴 | |
이력 테이블 추가 | 이력테이블 중 마스터테이블에 존재하는 레코드를 중복하여 이력테이블에 존재시키는 유형 | |
부분 테이블추가 | 하나의 테이블의 전체 칼럼 중 자주 이용하는 집중화된 칼럼들이 있을 때 디스크I/O를 줄이기 위해 해당 컬럼들을 모아놓은 별도의 반정규화된 테이블을 생산한다. |
칼럼 반정규화 기법
중복칼럼 추가 | 조인에 의해 처리할 때 성능저하를 예방하기 위해( 조인감소 위해) 중복칼럼추가 |
파생칼럼 추가 | 트랜잭션이 처리되는 시점에 계산에 의해 발생되는 성능저하를 예방하기 위해 미리값을 계산하여 칼럼에 보관함 |
이력테이블 칼럼 추가 | 대량의 이력데이터를 처리할 때 불특정 날 조회나 최근값을 조회할 때 나타날 수 있는 성능저하를 예방하기 위해 이력테이블에 기능성 칼럼(최근값여부, 시작과 종료일자) 등을 추가함 |
PK에 의한 칼럼 추가 | |
응용시스템 오작동을 위한 칼럼 추가 | 업무적으로는 의미가 없으나 사용자가 데이터처리를 하다가 잘못 처리하여 원래값으로 복기하기를 원하는 경우 이전 데이터를 임시적으로 중복하여 보관하는 기법. |
관계 반정규화
중복관계 추가 | 조인이 가능하지만 성능저하를 예방하기 위해 추가적인 관계를 맺는 방법 |
반정규화를 통한 성능향상 사례 1
최근 변경된 값을 조회하려고 할 때, 반정규화를 시키지 않으면 여러 번 조인을 해야해서 복잡한 SQL구문이 나온다. 왼쪽의
모델을 적절하게 반정규화를 적용하여
모델을 적절하게 반정규화를 적용하여 가장 최근데 변경된 값을 마스터에 위치시키면 아주 간단하게 SQL문 작성 가능하다.
반정규화를 통한 성능향상 사례 2
서버B의 연계테이블에서 부서명에 따른 연계상태코드를 가져오는 SQL문을 작성한다면 ㅇ
연계테이블 -> 접수 -> 부서 코드로 접근을 해야한다. 아주 비효율적이다.
그래서 서버A에 있는 부서테이블의 부서명을 서버B의 연계테이블에 부서명으로 속성 반정규화를 함으로써 향상시킬 수 있다.
⊙ 반정규화를 할 때 기억할 것은 데이터를 입력.수정,삭제할 때는 성능이 떨어진다는 것, 데이터 무결성 유지에도 유의할 것
제3절. 반정규화와 성능
1. 반정규화의 대상 고려하기
데이터가 대량이고 성능이 저하될 것으로 예상이 되면 다음 4가지를 고려하여 반정규화를 고려한다.
n 자주 사용되는 테이블에 접근하는 프로세스의 수가 많고 항상 일정한 범위만을 조회하는 경우
n 테이블에 대량의 데이터가 있고 대량의 데이터 범위를 자주 처리하는 경우에 처리범위를 일정하게 줄이지 않으면 성능을 보장할 수 없을 경우에 검토
n 통계성 프로세스에 의해 통계 정보를 필요로 할 때 별도의 통계테이블(반정규화 테이블)을 생성한다.
n 테이블에 지나치게 많은 조인이 걸려 데이터를 조회하는 작업이 기술적으로 어려울 경우 반정규화를 검토
1. 반정규화 외에 다른 방법으로 처리 가능한지 탐색해보기
è 뷰를 사용하면 해결할 수 있는가? (조인)
è 클러스터링 적용, 인덱스 조정, 파티셔닝 기법을 적용 (대량 데이터)
è 기타의 경우 응용 어플리케이션에서 로직을 구사하는 방법을 변경함으로써 성능을 향상시킬 수 있다. 데이터를 캐쉬하는 등등
2. 반정규화외에 방법이 없다면 적용하기
반정규화의 기법
테이블 병합 |
1:1 관계 테이블 병합 | |
1:M 관계 테이블 병합 | ||
슈퍼/서브타입 테이블 병합 | ||
테이블 분할 |
수직분할 | 컬럼단위의 테이블을 디스크I/O를 분산처리하기 위해 테이블을 1:1로 분리하여 성능향상 |
수평분할 | 로우단위의 집중 발생되는 트랜잭션을 분석하여 디스크I/O및 데이터 접근의 효율성을 높여 성능을 향상하기 위하여 로우단위로 테이블 쪼갬 | |
테이블 추가 |
중복 테이블 추가 | 다른 업무이거나 서버가 다른 경우 테이블 구조를 중복하여 원격조인을 제거하여 성능 향상 |
통계 테이블 추가 | SUM/AVG 등을 미리 수행하여 계산해두고 조회 시 성능을 향상시킴 | |
이력 테이블 추가 | 이력테이블 중 마스터테이블에 존재하는 레코드를 중복하여 이력테이블에 존재시키는 유형 | |
부분 테이블추가 | 하나의 테이블의 전체 칼럼 중 자주 이용하는 집중화된 칼럼들이 있을 때 디스크I/O를 줄이기 위해 해당 컬럼들을 모아놓은 별도의 반정규화된 테이블을 생산한다. |
칼럼 반정규화 기법
중복칼럼 추가 | 조인에 의해 처리할 때 성능저하를 예방하기 위해( 조인감소 위해) 중복칼럼추가 |
파생칼럼 추가 | 트랜잭션이 처리되는 시점에 계산에 의해 발생되는 성능저하를 예방하기 위해 미리값을 계산하여 칼럼에 보관함 |
이력테이블 칼럼 추가 | 대량의 이력데이터를 처리할 때 불특정 날 조회나 최근값을 조회할 때 나타날 수 있는 성능저하를 예방하기 위해 이력테이블에 기능성 칼럼(최근값여부, 시작과 종료일자) 등을 추가함 |
PK에 의한 칼럼 추가 | |
응용시스템 오작동을 위한 칼럼 추가 | 업무적으로는 의미가 없으나 사용자가 데이터처리를 하다가 잘못 처리하여 원래값으로 복기하기를 원하는 경우 이전 데이터를 임시적으로 중복하여 보관하는 기법. |
관계 반정규화
중복관계 추가 | 조인이 가능하지만 성능저하를 예방하기 위해 추가적인 관계를 맺는 방법 |
반정규화를 통한 성능향상 사례 1
최근 변경된 값을 조회하려고 할 때, 반정규화를 시키지 않으면 여러 번 조인을 해야해서 복잡한 SQL구문이 나온다. 왼쪽의
모델을 적절하게 반정규화를 적용하여
모델을 적절하게 반정규화를 적용하여 가장 최근데 변경된 값을 마스터에 위치시키면 아주 간단하게 SQL문 작성 가능하다.
반정규화를 통한 성능향상 사례 2
서버B의 연계테이블에서 부서명에 따른 연계상태코드를 가져오는 SQL문을 작성한다면 ㅇ
연계테이블 -> 접수 -> 부서 코드로 접근을 해야한다. 아주 비효율적이다.
그래서 서버A에 있는 부서테이블의 부서명을 서버B의 연계테이블에 부서명으로 속성 반정규화를 함으로써 향상시킬 수 있다.
⊙ 반정규화를 할 때 기억할 것은 데이터를 입력.수정,삭제할 때는 성능이 떨어진다는 것, 데이터 무결성 유지에도 유의할 것
제3절. 반정규화와 성능
1. 반정규화의 대상 고려하기
데이터가 대량이고 성능이 저하될 것으로 예상이 되면 다음 4가지를 고려하여 반정규화를 고려한다.
n 자주 사용되는 테이블에 접근하는 프로세스의 수가 많고 항상 일정한 범위만을 조회하는 경우
n 테이블에 대량의 데이터가 있고 대량의 데이터 범위를 자주 처리하는 경우에 처리범위를 일정하게 줄이지 않으면 성능을 보장할 수 없을 경우에 검토
n 통계성 프로세스에 의해 통계 정보를 필요로 할 때 별도의 통계테이블(반정규화 테이블)을 생성한다.
n 테이블에 지나치게 많은 조인이 걸려 데이터를 조회하는 작업이 기술적으로 어려울 경우 반정규화를 검토
1. 반정규화 외에 다른 방법으로 처리 가능한지 탐색해보기
è 뷰를 사용하면 해결할 수 있는가? (조인)
è 클러스터링 적용, 인덱스 조정, 파티셔닝 기법을 적용 (대량 데이터)
è 기타의 경우 응용 어플리케이션에서 로직을 구사하는 방법을 변경함으로써 성능을 향상시킬 수 있다. 데이터를 캐쉬하는 등등
2. 반정규화외에 방법이 없다면 적용하기
반정규화의 기법
테이블 병합 |
1:1 관계 테이블 병합 | |
1:M 관계 테이블 병합 | ||
슈퍼/서브타입 테이블 병합 | ||
테이블 분할 |
수직분할 | 컬럼단위의 테이블을 디스크I/O를 분산처리하기 위해 테이블을 1:1로 분리하여 성능향상 |
수평분할 | 로우단위의 집중 발생되는 트랜잭션을 분석하여 디스크I/O및 데이터 접근의 효율성을 높여 성능을 향상하기 위하여 로우단위로 테이블 쪼갬 | |
테이블 추가 |
중복 테이블 추가 | 다른 업무이거나 서버가 다른 경우 테이블 구조를 중복하여 원격조인을 제거하여 성능 향상 |
통계 테이블 추가 | SUM/AVG 등을 미리 수행하여 계산해두고 조회 시 성능을 향상시킴 | |
이력 테이블 추가 | 이력테이블 중 마스터테이블에 존재하는 레코드를 중복하여 이력테이블에 존재시키는 유형 | |
부분 테이블추가 | 하나의 테이블의 전체 칼럼 중 자주 이용하는 집중화된 칼럼들이 있을 때 디스크I/O를 줄이기 위해 해당 컬럼들을 모아놓은 별도의 반정규화된 테이블을 생산한다. |
칼럼 반정규화 기법
중복칼럼 추가 | 조인에 의해 처리할 때 성능저하를 예방하기 위해( 조인감소 위해) 중복칼럼추가 |
파생칼럼 추가 | 트랜잭션이 처리되는 시점에 계산에 의해 발생되는 성능저하를 예방하기 위해 미리값을 계산하여 칼럼에 보관함 |
이력테이블 칼럼 추가 | 대량의 이력데이터를 처리할 때 불특정 날 조회나 최근값을 조회할 때 나타날 수 있는 성능저하를 예방하기 위해 이력테이블에 기능성 칼럼(최근값여부, 시작과 종료일자) 등을 추가함 |
PK에 의한 칼럼 추가 | |
응용시스템 오작동을 위한 칼럼 추가 | 업무적으로는 의미가 없으나 사용자가 데이터처리를 하다가 잘못 처리하여 원래값으로 복기하기를 원하는 경우 이전 데이터를 임시적으로 중복하여 보관하는 기법. |
관계 반정규화
중복관계 추가 | 조인이 가능하지만 성능저하를 예방하기 위해 추가적인 관계를 맺는 방법 |
반정규화를 통한 성능향상 사례 1
최근 변경된 값을 조회하려고 할 때, 반정규화를 시키지 않으면 여러 번 조인을 해야해서 복잡한 SQL구문이 나온다. 왼쪽의
모델을 적절하게 반정규화를 적용하여
모델을 적절하게 반정규화를 적용하여 가장 최근데 변경된 값을 마스터에 위치시키면 아주 간단하게 SQL문 작성 가능하다.
반정규화를 통한 성능향상 사례 2
서버B의 연계테이블에서 부서명에 따른 연계상태코드를 가져오는 SQL문을 작성한다면 ㅇ
연계테이블 -> 접수 -> 부서 코드로 접근을 해야한다. 아주 비효율적이다.
그래서 서버A에 있는 부서테이블의 부서명을 서버B의 연계테이블에 부서명으로 속성 반정규화를 함으로써 향상시킬 수 있다.
⊙ 반정규화를 할 때 기억할 것은 데이터를 입력.수정,삭제할 때는 성능이 떨어진다는 것, 데이터 무결성 유지에도 유의할 것
'노력만이 살길! > SQLD' 카테고리의 다른 글
SQL 기본 DDL문 (0) | 2021.06.01 |
---|---|
제6절 분산데이터베이스와 성능 (0) | 2021.06.01 |
제5절 데이터베이스의 구조와 성능 (0) | 2021.06.01 |
제 4절 대량 데이터에 따른 성능 (0) | 2021.06.01 |
1절. 성능 데이터 모델링 (0) | 2021.06.01 |