데이터베이스2025. 3. 1. 11:38

SQLP : 제3과목은 SQL 고급활용 및 튜닝 이다.

 

 

3과목. SQL 고급활용 및 튜닝

1. SQL 수행 구조
2. SQL 분석 도구
3. 인덱스 튜닝
4. 조인 튜닝
5. SQL 옵티마이저
6. 고급 SQL 튜닝
7. Lock과 트랜잭션 동시성 제어

 

 

 

 

 

데이터베이스
- 물리적인 OS 파일의 집합 (데이터파일, Redo Log File, Control FIle 등)

인스턴스
- SGA 공유 메모리 영역과 이를 액세스하는 프로세스 집합

SQL 언어 특징
- 구조적 (Structured) 집합적 (Set-based) 선언적 (Declarative) 언어이다.
- 절차적 (Procedural) 언어는 아니다 : PL/SQL, T-SQL에서 구현한다.



백그라운드 프로세스

System Monitor (SMON)
- 인스턴스를 관리, 장애 발생 시 인스턴스 복구하고, 임시 세그먼트와 익스텐트를 모니터링한다.

Process Monitor (PMON)
- 프로세스를 감시, 이상이 생긴 프로세스의 리소스를 복구

Database Writer (DBWn)
- 버퍼캐시에 있는 Dirty 버퍼를 파일에 기록

Log Writer (LGWR)
- Redo 로그 버퍼를 Redo 로그 파일에 기록

Archiver (ARCn)
- Redo 로그가 꽉 차면, Archive Log 파일로 백업한다.

Checkpoint (CKPT)
- 데이터베이스 변경사항인 버퍼를 데이터 파일로 저장하는 것을 보장

Recoverer(RECO)
- 데이터베이스 복구 시 사용




데이터 저장 구조

 

블록(페이지) 데이터 I/O의 최소단위, 블록 단위로 읽어들인다.
익스텐트 테이블 스페이스로부터 공간을 할당받는 단위
논리적으로 인접한 블록의 집합
세그먼트 익스텐트의 집합
하나의 테이블(비파티션 테이블)은 하나의 세그먼트이다.
테이블 세그먼트, 인덱스 세그먼트가 있다.
테이블 스페이스 세그먼트를 담는 컨테이너로, 여러 데이터 파일로 구성된다.




버퍼 블록의 상태

Free 버퍼
- 데이터가 읽히지 않아 비어 있는 상태

DIrty 버퍼
- 버퍼캐시에 적재된 이후 변경이 발생했지만, 데이터파일에 기록되지 않은 상태

Pinned 버퍼
읽기 또는 쓰기 작업을 위해 현재 액세스 되고 있는 버퍼 블록



Undo 로그
- Transaction Rollback 시 사용
- Transaction Recovery
- Read Consistency

Redo 로그
- Database Recovery
- Cache Recovery
- Fast Commit

 



Redo 메커니즘

 

Log Force at commit 트랜잭션의 영속성을 위해, 적어도 커밋 시점에는 Redo 로그를 데이터 파일에 기록한다.
Fast Commit Redo 로그를 믿고, 빠르게 커밋을 완료할 수 있다.
Write Ahead Logging Dirty 블록을 데이터 파일에 기록하기 전에, Redo 엔트리를 Redo 로그 파일에 기록했음이 보장되야 한다.



메모리 영역

SGA (System Global Area)
- 공유 메모리 그룹, 모든 서버 및 백그라운드 프로스세에 공유된다.
- Shared Pool, 데이터베이스 버퍼캐시, Redo 로그 버퍼, 딕셔너리 캐시

PGA (Program Global Area)
- 비공유 메모리 구조 그룹
- 한 프로세스 혹은 스레드의 개별적인 메모리 공간
- 정렬 공간 (Sort Area), 세션 정보 (Session Information), 커서 상태 정보(Cursor State), 변수 저장 공간 (Stack Area)

UGA (User Global Area)
- 로그온 정보나 세션이 필요로 하는 정보를 저장하고 있는 세션 메모리
- Shared Server의 경우 SGA 에 존재
- Dedicated Server일 경우  PGA 내부에 존재

CGA (Call Global Area)
- 데이터베이스 콜(parse, execute, fetch)에 필요하고, 끝나면 해제되는 데이터를 담고 있다.



Single Block I/O
- 기본적인 인덱스 사용 시 단일 블록으로 읽어들인다.

Multi Block I/O
- 인접한 블록을 함께 읽어 들인다.
- 한 익스텐트 경계를 넘지는 못한다.
- Index Fast Full Scan, Table Full Scan 에서 다중 블록으로 읽어들인다.

Direct Path I/O 는 버퍼 캐시를 경유하지 않는다.
(병렬 프로세스로 테이블을 Full Scan)

 


LRU 알고리즘
- 가장 오래전에 사용된 데이터 블록을 버퍼캐시에서 밀어내는 알고리즘
- 사용빈도가 높은 데이터 블록이 버퍼캐시에 오래 남아 있도록 한다.


Shared Pool

빠른 Parsing을 위해 Hard Parsing을 줄이고 Soft Parsing의 비율을 높여 Oracle Database의 성능을 높히는 것

Soft Parsing

- Library Cache에 저장되어 있는 SQL문을 수행하여 Parse 작업없이 기존에 있는 실행계획대로 실행

 

Hard Parsing

- Parsing 작업을 수행하여 SQL문 확인 및 실행계획을 새로 생성함

 


Library Cache

- Parsing 정보를 저장하는 메모리

- Oracle Instance SGA Shared Pool 영역에 존재
- SQL 과 실행계획, PL/SQL 프로그램(프로시저, 함수, 트리거 등) 캐싱

 

Data Dictionary Cache

- Parsing에 필요한 Data Dictionary 정보를 저장하는 메모리


Result Cache

- Parsing 없이 결과를 확인할 수 있도록 Query의 결과값만 저장하는 메모리


Reserved Pool

- Parsing 크기가 큰 데이터를 저장하는 메모리

 

 

Posted by 헝개
데이터베이스2025. 2. 26. 16:11

SQLD / SQLP 공통 : 제2과목은 SQL 기본 및 활용 이다.

 

 

2과목. SQL 기본 및 활용

- SQL 기본
- SQL 활용
- 관리 구문

 

 

 

 

 

 

 

DDL
- 데이터 정의어 (Data Definition Language)
- CREATE, ALTER, DROP, RENAME, TRUNCATE

DML
- 데이터 조작어 (Data Manipulation Language)
- SELECT, INSERT, UPDATE, DELETE, MERGE

DCL
- 데이터 제어어 (Data Control Language)
- GRANT, REVOKE

TCL
- 트랜잭션 제어어 (Transaction Control Language)
- COMMIT, ROLLBACK, SAVEPOINT

 

 

 

MS-SQL 은 자동 커밋으로, begin tran 을 사용하지 않으면, DML 문장이 바로 커밋된다.
오라클 은 반대로, DML 문장 사용후 commit / rollback 을 하지 않으면, 트랜잭션이 끝나지 않은 상태이므로, Lock 이 걸린다.

 



제약조건

PK (Primary Key)
- 데이터를 고유하게 식별하기 위한 기본키, NULL 값은 불가

Unique Key
- 데이터를 고유하게 식별하기 위한 고유키로, NULL 값은 제약 대상에서 제외

NOT NULL
- NULL 값을 금지

CHECK
- True / False 의 논리식으로 값의 범위를 지정

FK (FOREIGN KEY)
- 테이블간의 관계에서 기본키를 다른 테이블의 외래키로 지정하여 사용




함수

ABS
- 절대값 : 음수 -> 양수

FLOOR
- 내림 함수
- 3.14 => 3, -3.14 => -4

TRUNC
- 숫자 : 지정한 자리수(없으면 소수점) 을 날려버리는 함수
- 날짜 : 날짜의 시간을 날려 버림, YY : 년도 빼고 나머지 절사, MM : 년/월 빼고 나머지 절사
- 3.14 => 3, -3.14 => -3

ROUND
- 반올림

TO_NUMBER, TO_DATE, TO_CHAR
- 숫자, 날짜, 문자 변환

LOWER, UPPER
- 소문자, 대문자 변환

SUBSTR, LENGTH
- 문자열 자르기, 문자열 길이

LTRIM, RTRIM, TRIM
- 문자열 왼쪽 공백 제거, 오른쪽 공백 제거, 양쪽 공백 제거

COALESCE
- COALESCE(v1, v2, v3) : 앞에서 부터 NULL 이 아닌 최초값

NVL
- NVL(expr, v1) : expr 이 NULL 이면 v1, NULL 이 아니면 expr

NVL2
- NVL2(expr, v1, v2) : expr 이 NULL 이면 v2, NULL 이 아니면 v1

ISNULL
- MSSQL 함수, NVL 과 동일

NULLIF
- NULLIF(expr, v1) : expr 과 v1 이 같으면 NULL, 같지 않으면 expr

DECODE
- DECODE(expr, c1, v1, c2, v2, v3) : expr 이 c1 이면 v1, c2 일때 v2, 그외에는 v3

LPAD, RPAD
- 왼쪽에 문자 채우기, 오른쪽에 문자 채우기
- LPAD('ABCD', 10, ' ') =>  '      ABCD' => 왼쪽에 스페이스를 채워서 10자리 문자로 만든다.

집계함수
- COUNT, SUM, AVG, MAX, MIN, STDDEV, VARIAN
- 갯수, 합계, 평균, 가장큰값, 가장작은값, 표준편차, 분산
- NULL 은 제외된다.


CASE 문
- case expr when 1 then '참' else '거짓' end : expr 이 1이면 참 아니면 거짓
- case when expr <= 10 then '참' else '거짓' end : expr 이 10 이하면 참, 아니면 거짓


GROUP BY / HAVING
- 집계함수 Count 에서 데이터가 없으면 0 이 나오지만, having 절에 의해 데이터가 없으면, no records 이다.


ORDER BY
- 기본정렬은 오름차순 ASC 이고, 내림차순은 DESC 이다.
- 오라클은 NULL 이 가장 큰 값으로 간주하여, 오름차순에서 가장 아래에 위치한다.
- MSSQL 은 NULL 이 가장 작은 값으로 간주하여, 오름차순에서 가장 위에 위치한다.



SELECT 실행순서

순서 쿼리
5 SELECT
1 FROM
2 WHERE
3 GROUP BY
4 HAVING
6 ORDER BY





TOP N 쿼리

MSSQL
select top 10 * from order by col1

Oracle
select *
from (
     select *
      from
      order by col1
)
where rownum <= 10




INNER JOIN
- 조건에 일치하는 행만 반환한다.
from A inner join B on A.col1 = B.col1
from A join B on A.col1 = B.col1
from A, B where A.col1 = B.col1

- using 사용
from A join B using(col1)


OUTER JOIN
- Join 조건에 일치하는 행과, 일치하지 않는 행도 반환한다.

 


left outer join

from A left outer join B on A.col1 = B.col1
from A left join B on A.col1 = B.col1
from A, B where A.col1 = B.col1(+)

- 조건에 일치하는 행과 왼쪽 테이블 기준으로 오른쪽에는 일치하지 않는 행도 반환한다.
- A, B 테이블에 일치하는 데이터와, A에만 있고 B에는 없는 행도 반환


right outer join

from A right outer join B on A.col1 = B.col1
from A right join B on A.col1 = B.col1
from A, B where A.col1(+) = B.col1

- 조건에 일치하는 행과 오른쪽 테이블 기준으로 왼쪽에는 일치하지 않는 행도 반환한다.
- A, B 테이블에 일치하는 데이터와, B에만 있고 A에는 없는 행도 반환


full outer join

from A full outer join B on A.col1 = B.col1


- 조건에 일치하는 행과 양쪽 테이블의 조건에 일치하지 않는 행도 반환한다.
- A, B 테이블에 일치하는 데이터와, A에만 있고 B에는 없는 행, B에만 있고 A에는 없는 행도 반환


NATURAL JOIN
- A, B 테이블에 같은 이름의 모든 컬럼이 자동으로 연결된다.
- SELECT 절에 EMP.col 테이블명을 지정해서 쓰면 오류가 발생한다.

from A natural join B


CROSS JOIN
- join 조건이 없는 경우, 테이블간에 모든 데이터 조합으로 행을 반환한다.
- M * N 의 카티션 행 조합

from A cross join B



집합 연산자

UNION
- 합집합, 중복데이터는 제외

UNION ALL
- 합집합, 중복데이터 유지

INTERSECT
- 교집합, 결과에서 중복데이터는 제외

EXCEPT (오라클 MINUS)
- 차집합 , 결과에서  중복데이터는 제외
- A 에서 B 의 데이터를 제외한 결과




계층형질의

START WITH
CONNECT BY

조직도와 같은 Tree 구조의 데이터를 조회할 때 사용한다.

가상컬럼
level : 해당 행이 ROOT 데이터이면 1, 하위 데이터이면 2, 그 하위이면 +1 씩 증가
connect_by_isleaf : 해당 행이 LEAF 데이터 이면 1, 아니면 0
connect_by_iscycle : 중복 참조이면 1, 아니면 0 : 현 데이터의 하위 데이터가, 하위 데이터의 현데이터로 지정한 경우, 무한 루프에 빠지게 된다.

select level, ( lpad(' ', 4 * (level-1)) || empno ) as empno
, connect_by_isleaf as isleaf
from emp
start with empno is null
connect by prior mgr = empno;

start with 조건에는 root 노드를 지정하고
connect by 에는 하위노드를 찾는 방법을 지정한다.

prior 에 지정된 컬럼에서 상대편 컬럼으로 찾아간다.

CONNECT BY PRIOR 하위 컬럼 = 상위 컬럼 : 상위 -> 하위로 가는 순방향 전개
CONNECT BY PRIOR 상위 컬럼 = 하위 컬럼 : 하위 -> 상위로 가는 역방향 전개

ORDER SIBLINGS BY
- order by 와 같이 정렬을 수행하나, 같은 level 간의 정렬 순위를 지정한다.

NOCYCLE
- connect by NOCYCLE prior mgr = empno
- 데이터 입력실수로, 이전에 전개된 데이터가 다시 나타나는 현상이 발생하면 무한루프에 빠지게 된다.
- 이전에 전개된 데이터가 다시 나오면 전개를 멈추는 옵션.



서브쿼리
- 괄호로 묶인 SELECT 절

단일행 서브쿼리
- 결과행이 1개만 나오는 서브쿼리
- select 쿼리 안에 단일 값 조회시 사용되거나, wehere 절의 비교 연산자 등에 온다.

다중행 서브쿼리
- 결과행이 n 개 나오는 서브쿼리
- from 절의 쿼리에 오거나, where 절의 in , all, any, some, exists 등에 온다.



뷰(VIEW)

독립성 - 테이블구조가 변경되어도, 뷰를 사용하는 응용프로그램은 변경할 필요가 없다.
편리성 - 복잡한 질의나 자주 사용하는 질의를 뷰로 만들면, 쿼리가 간단해 진다.
보안성 - 숨기고 싶은 정보는 제외하고, 정보(컬럼) 를 제공할 수 있다.



그룹 함수

ROLLUP
- 지정된 컬럼의 소계와 합계를 구하는 함수
- 인수의 순서에 따라 결과가 달라진다.

group by rollup(dname, job)
- (dname, job) 별 소계, dname 별 소계, 전체 합계를 구한다.

 


CUBE
- 가능한 모든 조합의 소계와 합계를 구한다.
- 인수의 순서는 상관이 없다.

group by cube(dname, job)
- (dname, job) 별 소계, dname 별 소계, job 별 소계, 전체 합계를 구한다.


GROUPING SETS
- 소계 / 합계를 직접 선택하여 지정할 수 있는 함수
- () 또는 null 을 쓰면 전체 합계를 구한다.

group by grouping sets( (dname, job), (dname), () )
- 이렇게 쓰면 group by rollup(dname, job) 과 동일하다.

group by grouping sets( (dname, job), (dname), (job), () )
- 이렇게 쓰면 group by cube(dname, job) 과 동일하다.

 


GROUPING 함수
- select 절에서 해당 행이 소계에 사용된 행인지 여부를 판단할 때 사용한다.

select (case when grouping(job) = 1 then 'JOB합계' else job end )
- 부서별 모든 소계행인경우, JOB합계로 표시하고, 아닌경우 job 명칭을 표시한다.




Window 함수

partition by

sum(sal) over(partition by deptno)

sum(sal) over(partition by deptno group by emp range between unbounded preceding and current row)

rows
- 물리적인 결과 행의 수를 지정한다.

range
- 논리적인 값에 의한 범위를 지정한다.

n preceding
- n 개 앞의 행

unbounded preceding
- 첫번째 행

n following
- n 개 뒤의 행

unbounded following
- 마지막 행

current row
- 현재 행



RANGE UNBOUNDED PRECEDING
SUM(sal) OVER(partition by mgr order by sal range unbounded preceding)
= RANGE BETWEEN UNBOUNDED PRECEDING AND CURRENT ROW 와 동일하다.
- 파티션 내에서 첫번째 행 부터 현재 행까지의 합계 즉 누적합을 표시

ROWS BETWEEN 1 PRECEDING AND 1 FOLLOWING
SUM(sal) OVER(partition by mgr order by sal rows between 1 preceding and 1 following)
- 현재행+앞에1행+뒤에1행 합계

RANGE BETWEEN CURRENT ROW AND UNBOUNDED FOLLOWING
SUM(sal) OVER(partition by mgr order by sal range between current row and unbounded following)
- 현재행부터 마지막 행까지 합계



CTE(Common Table Expression)
- 일시적인 결과 세트를 정의하고 이를 나중에 쿼리에서 참조할 수 있게 하는 방법

CTE와 서브쿼리의 차이점
- 가독성: CTE는 복잡한 쿼리를 여러 부분으로 나누어 가독성 높여준다.
- 재사용성: CTE는 동일한 쿼리 내에서 여러 번 재사용 가능
- 성능: CTE와 서브쿼리의 성능 차이는 데이터베이스 시스템과 쿼리의 복잡도 따라 다름
- CTE는 재귀적 쿼리에 유리


WITH kor_restaurants AS (
     SELECT *
      FROM restaurants 
      WHERE rest_type = 'kor'
)

재귀적 CTE

WITH cte (n) AS 
(
      SELECT 1
      UNION ALL
      SELECT n+1 FROM cte WHERE n < 5
)



NTILE
- 전체건수를 지정한 건수로 N등분

LAG
- N개 앞의 행 값 조회

LEAD
- N개 뒤의 행 값 조회



NULL 값
- 아직 정해지지 않은 미지의 값

NULL 비교는 IS NULL / IS NOT NULL 을 사용한다.

where in (list) 에서 list 에 NULL 이 있으면, 실제 NULL 인 데이터는 제외 된다.
- where ID in (1, 2, NULL) : ID 가 NULL 인 데이터는 제외되고, 1이나 2인 데이터만 조회된다.

 

where not in (list) 에서 list 에 NULL 이 있으면, 전체가 false 가 되어, 결과집합이 없다.

- where ID not in (1, 2, NULL) : ID <> 1 and ID <> 2 and ID <> NULL  => and 조건에 의해 하나라도 false 면 모두 false 이다.



NULL 과의 연산은 NULL 이 된다.
NULL + 10 => NULL

집계함수에서 NULL 값이 있다면 제외된다.
- SUM, COUNT 등

 



순위

 

ROW_NUMBER() 1,2,3 순차적으로 순위를 매김
RANK() 1,1,1,4,5,6 동일 값이면 같은 순위를 갖고, 다음순위는 건너뜀.
DENSE_RANK() 1,1,1,2,3,4 동일 값이면 같은 순위를 갖고, 다음순위로 넘어감.

 




PIVOT
- 행을 열로 변환한다.

SELECT *
FROM 테이블
PIVOT ( 그룹합수(집계컬럼) FOR 피벗컬럼 IN (피벗컬럼값 AS 별칭 ... )

SELECT job, d1, d2, d3 
FROM emp PIVOT ( 
      SUM(sal) FOR deptno IN ('10' AS d1, '20' AS d2, '30' AS d3) 
)


UNPIVOT
- 열을 행으로 변환한다.


SELECT *
FROM 테이블
UNPIVOT ( 컬럼별칭(값) FOR 컬럼별칭(열) IN (피벗열명 AS '별칭', ... )

SELECT col_nm, col_val
FROM emp UNPIVOT (
      col_val FOR col_nm IN (col1, col2, col3)
)

 

 

 

정규표현식

 

REGEXP_LIKE
- Like 연산과 유사하여 정규식 패턴을 검색

REGEXP_LIKE(srcstr, pattern[,match_option])

 

SELECT A.*
  FROM REG_TEST A
 WHERE REGEXP_LIKE(A.DATA, '[0-9]') ;

SELECT A.*
  FROM REG_TEST A
 WHERE REGEXP_LIKE(A.DATA, '[[:digit:]]');
숫자가 포함된 데이터 찾기
SELECLT A.*
FROM REG_TEST A
WHERE REGEXP_LIKE(A.DATA, '^[[:punct:]]*$');
특수문자로만 되어 있는 데이터 찾기

 

 

 

REGEXP_REPLACE
- 정규식 패턴을 검색하여 대체 문자열로 변경

REGEXP_REPLACE(source_char, pattern[,replace_string[,position[,occurrence[,math_param]]]]

 

SELECT A.*
  FROM REG_TEST A
 WHERE REGEXP_REPLACE(A.DATA, '[0-9]') IS NULL
숫자만 있는 데이터 찾기
SELECT A.*
FROM REG_TEST A
WHERE REGEXP_REPLACE(A.DATA, '[^0-9]') IS NULL
AND NOT REGEXP_LIKE(A.DATA, '[[:punct:]]')
문자만 있는 데이터 찾기

 



REGEXP_INSTR
- 정규식 패턴을 검색하여 위치 반환

REGEXP_INSTR(source_char, pattern[,position][,occurrence][,return oprion][,match option])

select REGEXP_INSTR('123123123123','123',5) from dual;

5번째부터 시작해서 123 이 나오는 위치
7
 SELECT ename
     , REGEXP_INSTR(ename, 'MI|AD|AM') AS result
  FROM temp
MI 또는 AD 또는 AM 중에 일치하는 첫번째 위치

 

 

REGEXP_SUBSTR
- 정규식 패턴을 검색하여 부분 문자 추출

REGEXP_SUBSTR(source_char, pattern[,position][,occurrence][,match option])

 

SELECT REGEXP_SUBSTR('2024-03-08', '[^-/.]+')       AS date_year
, REGEXP_SUBSTR('2024/03/08', '[^-/.]+', 1, 2) AS date_month
, REGEXP_SUBSTR('2024.03.08', '[^-/.]+', 1, 3) AS date_day
FROM dual
2024
03
08

 



REGEXP_COUNT
- 정규식 패턴을 검색하여 발견된 횟수를 반환

REGEXP_COUNT(source_char, pattern[,position][,occurrence][,match option])

SELECT REGEXP_COUNT('AAA,BBB,CCC,DDD', ',')    AS result1
, REGEXP_COUNT('AAA,BBB,CCC,DDD', ',', 5) AS result2
FROM dual
3
2

 

 

 

Posted by 헝개
데이터베이스2025. 2. 25. 17:15

SQLD / SQLP 공통 : 제1과목은 데이터 모델링의 이해 이다.

 

 

1과목. 데이터 모델링의 이해

- 데이터 모델링의 이해
- 데이터 모델과 SQL

 

 

 

 

 

엔터티
- 업무에 필요하고 유용한 정보를 저장하고 관리하기 위한 집합적, 영속적으로 존재하는 단위
- 인스턴스의 집합

속성
- 엔터티에서 관리하고자 하는 의미상 더 이상 분리되지 않는 최소의 데이터 단위
- 엔터티에 속하는 개체들의 특성
- 엔터티를 설명하고 인스턴스의 구성요소가 된다.
- 하나의 속성은 하나의 속성값을 가진다.

관계
- 엔터티와 엔터티 사이의 연결 관계성
- 두개의 엔터티로부터 인스턴스를 연관짓는 행위
- 인스턴스 간에 논리적인 연관관계로 존재 또는 행위로서 연관성이 부여된 상태



도메인
- 속성이 가질 수 있는 값의 범위
- 엔터티 내에서 속성에 대한 데이터 타입, 크기, 제약사항을 지정하는 것.



엔터티 분류

유형무형에 따른 분류

유형 엔터티 물리적인 형태가 있고, 지속적으로 활용, ex) 사원, 상품
개념 엔터티 물리적인 형태가 없고, 겨념적 정보로 구분. ex) 조직, 보험
사건 엔터티 업무에서 발생되는 자료. ex) 주문, 수강

 


발생시점에 의한 분류

기본 엔터티 업무에 독립적으로 존재하는 정보. ex) 사원,부서,고객,상품 등
중심 엔터티 기본엔터티에서 발생하는, 업무의 중심이 되는 엔터티. ex) 계약,주문 등
행위 엔터티 2개이상의 부모엔터티로부터 발생. ex) 주문내역,계약변경이력 등




스키마
외부 스키마 : 데이터베이스의 사용자 관점
개념 스키마 : 통합 관점, 데이터베이스 관리자 관점
내부 스키마 : 물리적 관점, 시스템 설계자 관점


관계(Relationship) 표기법
- 관계명
- 관계차수 : 1:1, 1:N, N:N
- 관계선택사양 : 필수, 옵션

식별자
- 엔터티를 대표하는 속성으로, 인스턴스를 구분할 수 있다.

주식별자/보조식별자
- 주식별자 : 유일성, 최소성, 존재성, 불변성을 만적하는 대표 식별자
- 보조식별자 : 유일성은 만족하지만 대표성을 만족하지 못하는 식별자

내부식별자/외부식별자
- 내부식별자: 엔터티 내부에서 스스로 생성되는 식별자
- 외부식별자: 다른 엔터티와의 관계로 생성되는 식별자

단일식별자/복합식별자
- 단일식별자 : 하나의 속성
- 복합식별자 : 2개 이상의 복합 속성

본질식별자/인조식별자
- 본질식별자 : 비지니스 프로세스에서 만들어지는 식별자
- 인조식별자 : 인위적으로 만들어지는 식별자




데이터베이스 모델링의 특징
- 추상화, 단순화, 명확화

모델링의 3단계
- 개념적 모델링 : 추상적, 업무 중심적, 포괄적인 수준의 모델링
- 논리적 모델링 : 세부속성, 식별자, 관계를 표현, 정규화
- 물리적 모델링 : 데이터베이스 성능을 고려한 설계


정규화
- 데이터의 일관성, 유연성, 중복을 제거하고 데이터를 분해를 하는 과정
- 이상현상을 제거하는 설계 기법이다.

제1정규화
- 속성의 원자성 확보 : 속성은 하나의 속성값을 가져야 한다.
- 기본키(PK) 설정

제2정규화
- 기본키 중에 특정 컬럼에만 종속된 경우, 부분 함수 종속성 제거

제3정규화
- 이행 함수 종속성 제거


이상현상

삽입이상 데이터 삽입시, 의도치 않은 값들도 삽입 되는 현상
갱신이상 데이터 수정시, 일부 데이터만 갱신되어, 데이터의 일관성 유지가 안되는 현상
삭제이상 데이터 삭제시, 의도와 다른 값들이 삭제되는 현상




반정규화
- 데이터베이스의 성능 향상을 위해 데이터의 중복을 허용하거나, 조인을 줄이는 목적으로 하는 성능 향상 방법


 
분산데이터베이스
- 병렬처리로 빠른 응답이 가능, 용량확 장이 쉬움
- 보안이나 무결성이 안좋다. 여러 네트워크에 분산되어 관리와 통제가 어렵다.




트랜잭션의 4가지 특징 (ACID)

원자성 (Atomicity) 분해가 불가능한 업무의 최소단위로, 전부 처리되거나, 전부 처리되지 않아야 한다.
일관성 (Consistency) 트랜잭션 결과로 데이터베이스 상태가 모순되지 않아야 한다.
격리성 (Isolation) 트랜잭션의 중간 값에 다른 트랜잭션이 접근할 수 없다.
영속성 (Durability) 트랜잭션의 결과가 데이터베이스에 영속적으로 저장된다.

 



Posted by 헝개