728x90

[SQLD] 데이터 모델링(Data Modeling)

① 데이터 모델링의 이해

데이터 모델링

현실세계를 데이터베이스로 표현하기 위해서 추상화 한다.
데이터 모델링을 하기 위해서는 고객과의 의사소통을 통해 고객의 업무 프로세스를 이해해야 한다.
고객의 업무 프로세스를 이해한 후, 데이터 모델링 표기법을 사용해서 모델링을 한다.
고객이 쉽게 이해할 수 있도록 복잡하지 않게 모델링해야 한다.
고객의 업무 프로세스를 추상화하고, 소프트웨어를 분석/설계하면서 점점 더 상세해진다.
고객의 비즈니스 프로세스를 이해하고 비즈니스 프로세스의 규칙을 정의한다.
- 정의된 비지니스 규칙을 데이터 모델로 표현한다.

데이터 모델링의 특징

데이터 모델링은 추상화해야 한다.
- 추상화는 공통적인 특징을 찾고 간략하게 표현한다.
데이터 모델링은 단순화해야 한다.
- 복잡한 문제를 피하고 누구나 이해할 수 있게 표현한다.
데이터 모델링은 명확해야 한다.
- 의미적 해석이 모호하지 않고 명확하게 해석되어야 한다.

특징	설명
추상화(Abstraction)	현실 세계를 간략하게 표현한다.
단순화(Simplification)	누구나 쉽게 이해할 수 있도록 표현한다.
명확성(Clarity)	명확하게 의미가 해석되어야 하고 한 가지 의미를 가져야 한다.

데이터 모델링의 단계

(1) 개념적 모델링(Conceptual Data Modeling)

고객의 비지니스 프로세스를 분석하고 업무 전체에 대해서 데이터 모델링을 수행한다.
복잡하게 표현하지 않고, 중요한 부분을 위주로 모델링하는 단계
업무적 관점에서 모델링하며, 기술적 용어는 가급적 사용하지 않는다.
엔티티(Entity)와 속성(Attribute)을 도출하고 개념적 ERD(Entity Relationship Diagram)를 작성한다.

(2) 논리적 모델링(Logical Data Modeling)

개념적 모델링을 논리적 모델링으로 변환하는 작업
식별자를 도출하고 필요한 모든 릴레이션을 정의한다.
정규화를 수행해서 데이터 모델의 독립성을 확보한다.

(3) 물리적 모델링(Physical Modeling)

데이터베이스를 실제 구축한다.
- 테이블, 인덱스, 함수 등을 생성한다.
성능, 보안, 가용성을 고려해서 구축한다.

데이터 모델링 단계	설명
개념적 모델링	- 전사적 관점에서 기업의 데이터를 모델링한다. - 추상화 수준이 가장 높은 수준의 모델링이다. - 계층형 데이터 모델, 네트워크 모델, 관계형 모델에 관계없이 업무 측면에서 모델링한다.
논리적 모델링	- 특정 데이터베이스 모델에 종속한다. - 식별자를 정의하고 관계, 속성 등을 모두 표현한다. - 정규화를 통해서 재사용성을 높인다.
물리적 모델링	- 구축할 데이터베이스 관리 시스템에 테이블, 인덱스 등을 생성하는 단계이다. - 성능, 보안, 가용성을 고려하여 데이터베이스를 구축한다.

데이터 모델링 관점

관점(View)	설명
데이터	- 비지니스 프로세스에서 사용되는 데이터 - 구조 분석, 정적 분석
프로세스	- 비즈니스 프로세스에서 수행하는 작업 - 시나리오 분석, 도메인 분석, 동적 분석
데이터와 프로세스	- 프로세스와 데이터 간의 관계 - CRUD(Create, Read, Update, Delete) 분석

데이터 모델링을 위한 ERD(Entity Relationship Diagram)

1976년 피터첸(Peter Chen)이 Entity Relationship Model 표기법을 만들었으며, 사실상 데이터 모델링의 표준으로 사용되고 있다.
엔티티와 엔티티 간의 관계를 정의하는 모델링 방법이다.

(1) ERD 작성 절차

① 엔티티를 도출하고 그린다.
- 업무에서 관리해야 하는 집합을 도출한다.
② 엔티티를 배치한다.
- 엔티티를 도출한 후 엔티티를 배치한다.
- 중요한 엔티티를 왼쪽 상단에 배치한다.
③ 엔티티 간의 관계를 설정한다.
④ 관계명을 서술한다.
- 엔티티 간의 어떤 행위나 존재가 있는지 표현한다.
⑤ 관계 참여도를 표현한다.
- 관계 참여도 : 1개의 엔티티와 다른 엔티티 간의 참여하는 관계 수
- 예) '고객이 여러 개의 계좌를 개설할 수 있다.' 와 같은 의미를 표현하는 것
⑥ 관계의 필수 여부를 표현한다.
- 필수 : 반드시 존재해야 하는 것
- 예) '모든 고객은 반드시 하나의 계좌를 개설해야 한다.' 와 같은 의미를 표현하는 것

(2) ERD 작성 시 고려사항

중요한 엔티티를 가급적 왼쪽 상단에 배치한다.
ERD는 이해하기 쉬워야 하고, 너무 복잡하지 않아야 한다.

데이터 모델링 고려사항

(1) 데이터 모델의 독립성

독립성이 확보된 모델은 고객의 업무 변화에 능동적으로 대응할 수 있다.
독립성을 확보하기 위해서는 중복된 데이터를 제거해야 한다.
정규화 : 데이터 중복을 제거하는 방법

(2) 고객 요구사항의 표현

데이터 모델링으로 고객과 데이터 모델러 간에 의사소통을 할 수 있어야 하므로, 고객의 요구사항을 간결하고 명확하게 표현해야 한다.

(3) 데이터 품질 확보

데이터베이스 구축 시에 데이터 표준을 정의하고 표준 준수율을 관리해야 한다.
데이터 표준을 확보해야 데이터 품질을 향상시킬 수 있다.

② 3중 스키마(3-Level Schema)

3층 스키마

사용자, 설계자, 개발자가 데이터베이스를 보는 관점에 따라 데이터베이스를 기술하고 이들 간의 관계를 정의한 ANSI 표준
- ANSI SQL 표준 : SQL문이 모든 데이터베이스 관리 시스템에서 호환되도록 정의한 표준
데이터베이스의 독립성을 확보하기 위한 방법
데이터의 독립성을 확보하면 다음의 장점을 갖는다.
- 데이터 복잡도 증가
- 데이터 중복 제거
- 사용자 요구사항 변경에 따른 대응력 향상
- 관리 및 유지보수 비용 절감
3단계 계층으로 분리해서 독립성을 확보하는 방법으로, 각 계층을 뷰(View)라고도 한다.
3중 스키마의 독립성

독립성	설명
논리적 독립성	개념 스키마가 변경되더라도 외부 스키마가 영향을 받지 않는 것
물리적 독립성	내부 스키마가 변경되도라도 개념 스키마가 영향을 받지 않는 것

3층 스키마 구조

특징	설명
외부 스키마 (External Schema)	- 사용자 관점, 업무상 관련이 있는 데이터 접근 - 관련 데이터베이스의 뷰(View)를 표시한다. - 응용 프로그램이 접근하는 데이터베이스를 정의한다.
개념 스키마 (Conceptual Schema)	- 설계자 관점, 사용자 전체 집단의 데이터베이스 구조 - 전체 데이터베이스 내의 규칙과 구조를 표현한다. - 통합 데이터베이스 구조이다.
내부 스키마 (Internal Schema)	- 개발자 관점, 데이터베이스의 물리적 저장 구조이다. - 데이터 저장 구조, 레코드 구조, 필드 정의, 인덱스 등을 의미한다.

③ 엔티티(Entity)

엔티티(Entity)

업무에서 관리해야 하는 데이터 집합
저장되고 관리되어야 하는 데이터
개념, 사건, 장소 등의 명사

인물	엔티티의 의미
Peter Chen (1976)	엔티티는 변별할 수 있는 사물이다.
James Martin (1989)	정보를 저장할 수 있는 어떤 것이다.
C.J Date (1986)	데이터베이스 내부에서 변별 가능한 객체이다.
Thomas Bruce (1992)	정보가 저장될 수 있는 장소, 사람, 사건, 개념, 물건 등이다.

엔티티 도출

엔티티는 고객의 비즈니스 프로세스에서 관리되어야 하는 정보를 추출해야 한다.

예 : 비지니스 프로세스

1. 고객이 회원가입을 한다. 회원으로 가입할 때는 회원ID, 패스워드, 이름, 주소, 전화번호 등을 입력해야 한다.
2. 회원으로 가입하기 위해서는 반드시 하나의 계좌를 개설해야 한다.
3. 고객은 계좌를 여러 개 개설할 수 있다.
4. 계좌를 개설할 때는 계좌번호, 계좌명, 예수금, 계좌개설 지점, 계좌담당자가 입력된다.

엔티티 도출

엔티티 특징

특징	설명
식별자	- 엔티티는 유일한 식별자가 있어야 한다. - 예) 회원ID, 계좌번호
인스턴스 집합	- 2개 이상의 인스턴스가 있어야 한다. - 즉, 고객정보는 2명 이상 있어야 한다.
속성	- 엔티티는 반드시 속성을 가지고 있다. - 예) 고객 엔티티에 회원ID, 패스워드, 이름, 주소, 전화번호
관계	- 엔티티는 다른 엔티티와 최소한 1개 이상의 관계가 있어야 한다. - 예) 고객은 계좌를 개설한다.
업무	- 엔티티는 업무에서 관리되어야 하는 집합이다. - 예) 고객, 계좌

릴레이션과 테이블, 인스턴스(Instance)
- 릴레이션과 테이블은 같은 의미라고 해석하면 된다.
  - 릴레이션에 기본키 및 제약조건을 설정하면 테이블이 된다.
- 단, Relationship은 릴레이션 간의 관계를 의미한다.
- 인스턴스는 릴레이션이 가질 수 있는 값을 의미한다.
  - 간단히 행의 수를 의미한다.

엔티티 종류

유형과 무형에 따른 종류
- 분류 기준 : 물리적 형태의 존재 여부

종류	설명
유형 엔티티 (Tangible Entity)	- 업무에서 도출되며 지속적으로 사용되는 엔티티 - 예) 고객, 강사, 사원 등
개념 엔티티 (Conceptual Entity)	- 유형 엔티티는 물리적 형태가 있지만, 개념 엔티티는 물리적 형태가 없다. - 개념적으로 사용되는 엔티티이다. - 예) 거래소 종목, 코스닥 종목, 생명보험 상품
사건 엔티티 (Event Entity)	- 비지니스 프로세스를 실행하면서 생성되는 엔티티이다. - 예) 주문 체결, 취소주문, 수수료 청구 등

발생 시점에 따른 종류

종류	설명
기본 엔티티 (Basic Entity)	- 키 인티티(Key Entity)라고도 한다. - 다른 엔티티로부터 영향을 받지 않고 독립적으로 생성되는 엔티티이다. - 예) 고객, 상품, 부서 등
중심 엔티티 (Main Entity)	- 기본 엔티티와 행위 엔티티 간의 중간에 있는 것 - 즉, 기본 엔티티로부터 발생되고 행위 엔티티를 생성하는 것 - 예) 계좌, 주문, 취소, 체결 등
행위 앤티티 (Active Entity)	- 2개 이상의 엔티티로부터 발생하는 것 - 예) 주문 이력, 체결 이력 등

④ 속성(Attribute)

속성(Attribute)

업무에서 필요한 정보인 엔티티가 가지는 항목
더 이상 분리되지 않는 단위로, 업무에 필요한 데이터를 저장할 수 있음.
인스턴스의 구성요소이고 의미적으로 더 이상 분해되지 않음.

속성의 특징과 종류

(1) 속성의 특징

속성 : 업무에서 관리되는 정보
속성은 하나의 값만 가진다.
주식별자에게 함수적으로 종속된다.
- 기본키가 변경되면, 속성의 값도 변경된다.

(2) 속성의 종류

분해 여부에 따른 속성의 종류

특징	설명
단일(값) 속성 (Single-valued Attribute)	- 하나의 의미로 구성된 것 - 예) 회원ID, 이름 등
복합 속성 (Composite Attribute)	- 여러 개의 의미가 있는 것 - 예) 주소 (시, 군, 동 등으로 분해될 수 있음.)
다중값 속성 (Multi-valued Attribute)	- 속성에 여러 개의 값을 가질 수 있는 것 - 예) 상품 리스트 - 다중값 속성은 엔티티로 분해된다.

특성에 따른 속성의 분류

특징	설명
기본 속성 (Basic Attribute)	- 비지니스 프로세스에서 도출되는 본래의 속성 - 예) 회원ID, 이름, 계좌번호, 주문일자 등
설계 속성 (Designed Attribute)	- 데이터 모델링 과정에서 발생되는 속성 - 유일한 값을 부여한다. - 예) 상품코드, 지점코드 등
파생 속성 (Derived Attribute)	- 다른 속성에 의해서 만들어지는 속성 - 예) 합계, 평균

도메인(Domain)
- 속성이 가질 수 있는 값의 범위
- 예) 성별이라는 속성의 도메인은 '남자'와 '여자' 이다.

⑤ 관계(Relationship)

관계(Relationship)

관계 : 엔티티 간의 관련성
분류
- 존재 관계 : 2개의 엔티티가 존재 여부의 관계가 있는 것
- 행위 관계 : 2개의 엔티티가 어떤 행위에 의한 관련성이 있는 것

관계의 종류

(1) 존재 관계

엔티티 간의 상태를 의미한다.
예) 고객이 은행에 회원가입을 하면, 관리점이 할당되고, 그 할당된 관리점에서 고객을 관리한다.

(2) 행위 관계

엔티티 간에 어떤 행위가 있는 것
예) 계좌를 사용해서 주문을 발주하는 관계
- 증권회사는 계좌를 개설하고 주문을 발주한다.

관계 차수(Cardinality)

(1) 관계 차수(Relation Cardinality)

두 개의 엔티티 간에 관계에 참여하는 수
예) 1명의 고객은 여러 개의 계좌를 개설할 수 있다.
- 1대 N 관계

(2) 관계 차수의 종류

① 1대1 관계

종류	설명
완전 1대1	하나의 엔티티에 관계되는 엔티티의 관계가 하나인 경우로, 반드시 존재한다.
선택적 1대1	하나의 엔티티에 관계되는 엔티티의 관계가 하나이거나 없을 수도 있다.

② 1대N 관계

엔티티에 행이 하나 있을 때 다른 엔티티의 값이 여러 개 있는 관계
예) 고객은 여러 개의 계좌를 가질 수 있다.

③ M대 N관계

2개의 엔티티가 서로 여러 개의 관계를 가지고 있는 것
예) 1명의 학생이 여러 개의 과목을 수강할 수 있다.
- 반대로, 한 개의 과목은 여러 명의 학생이 수강한다.
  - M대N 관계의 발생
관계형 데이터베이스에서 M대N 관계의 조인(Join)
- 카테시안 곱(Cartesian Product)의 발생
  - M대 N의 관계를 1대N, N대1로 해소해야 함.

④ 필수적 관계와 선택적 관계

필수적 관계는 '|' 로 표현되고, 선택적 관계는 'O'로 표현된다.

구분	설명
필수적 관계	- 반드시 하나가 있어야 하는 관계 - 예) 고객이 반드시 있어야 계좌를 개설할 수 있다.
선택적 관계	- 없을 수도 있는 관계 - 예) 고객은 있지만, 계좌가 없을 수도 있다면 선택적 관계가 된다.

식별 관계와 비식별 관계

(1) 식별 관계(Identification Relationship)

<고객> 과 <계좌> 엔티티에서 <고객> 은 독립적으로 존재할 수 있는 강한 개체(Strong Entity)이다.
- 강한 개체(Strong Entity) : <고객>
  - 누구에게도 지배되지 않는 독립적인 개체
  - 어떤 다른 엔티티에게 의존하지 않고 독립적으로 존재
  - 다른 엔티티와 관계를 가질 때, 다른 엔티티에게 기본키를 공유한다.
  - 식별 관계로 표현된다.
    - <고객> 엔티티의 기본적인 회원ID를 <계좌> 엔티티의 기본키의 하나로 공유 하는 것
  - 기본키 값이 변경되면, 식별 관계(기본키를 공유받은)에 있는 엔티티의 값도 변경된다.
- 약한 개체(Weak Entity) : <계좌>
  - 개체의 존재가 다른 개체의 존재에 달려 있는 개체

(2) 비식별 관계(Non-Identification Relationship)

강한 개체의 기본키를 다른 엔티티의 기본키가 아닌 일반 칼럼(열)으로 관계를 가지는 것
점선으로 표현한다.

예) <관리점> 엔티티의 기본 키는 지점코드이고, <고객> 엔티티와 비식별 관계를 가지고 있다.
- 지점코드는 <고객> 엔티티의 기본키가 아닌 일반 칼럼(열)로 참조된다.
<계좌> 엔티티는 <고객> 엔티티의 회원ID 칼럼을 기본키로 공유하고 있다.
- 이러한 관계를 식별 관계라고 하고, 실선으로 표현한다.

⑥ 엔티티 식별자(Entity Identifier)

식별자 : 엔티티를 대표할 수 있는 유일성을 만족하는 속성
예) 회원ID, 계좌번호, 주민등록번호, 외국인등록번호, 여권번호 등

주식별자(기본키, Primary Key)

최소성 : 주식별자는 최소성을 만족하는 키이다.
대표성 : 주식별자는 엔티티를 대표할 수 있어야 한다.
유일성 : 주식별자는 엔티티의 인스턴스를 유일하게 식별한다.
불변성 : 주식별자는 자주 변경되지 않아야 한다.

키의 종류

데이터베이스 키	설명
기본키 (Primary Key)	후보키 중에서 엔티티를 대표할 수 있는 키
후보키 (Candidate Key)	유일성과 최소성을 만족시키는 키
슈퍼키 (Super Key)	유일성은 만족하지만, 최소성을 만족하지 않는 키
대체키 (Alternate Key)	여러 개의 후보키 중에서 기본키를 선정하고 남은 키
외래키 (Foreign Key)	- 하나 혹은 다수의 다른 테이블의 기본키 필드를 가리키는 것 - 참조 무결성(Referential Integrity)을 확인하기 위해 사용되는 키 - 허용된 데이터 값만 데이터베이스에 저장하기 위해 사용

식별자의 종류

식별자는 대표성, 생성 여부, 속성의 수, 대체 여부 로 분류된다.

(1) 식별자의 대표성

주식별자 : 엔티티를 대표할 수 있는 식별자
- 예) 회원ID가 <고객> 엔티티의 주식별자가 됨.
대표성 여부에 따른 식별자의 종류

종류	설명
주식별자	- 유일성과 최소성을 만족하면서, 엔티티를 대표하는 식별자 - 다른 엔티티와 참조 관계로 연결될 수 있다.
보조 식별자	유일성과 최소성은 만족하지만 대표성을 만족하지 못하는 식별자

(2) 생성 여부

생성 여부에 따른 식별자의 종류

종류	설명
내부 식별자	- 엔티티 내부에서 스스로 생성되는 식별자 - 예) 부서코드, 주문번호, 종목코드 등
외부 식별자	- 다른 엔티티와의 관계로 인하여 만들어지는 식별자 - 예) <계좌> 엔티티의 회원ID

(3) 속성의 수

속성의 수에 따른 식별자의 종류

종류	설명
단일 식별자	- 하나의 속성으로 구성 - 예) <고객> 엔티티의 회원ID
복합 식별자	- 2개 이상의 속성으로 구성

(4) 대체 여부

대체 여부에 따른 식별자의 종류

종류	설명
본질 식별자	비지니스 프로세스에서 만들어지는 식별자
인조 식별자	- 인위적으로 만들어지는 식별자 - 다음의 경우에 사용 - 후보 식별자 중에서 주식별자로 선정할 것이 없을 경우 - 주식별자가 너무 많은 칼럼으로 되어 있는 경우 - 순서번호(Sequence Number)를 사용해서 식별자를 만든다.

728x90

저작자표시 비영리 동일조건 (새창열림)

'Certificate > SQLD' 카테고리의 다른 글

[SQLD] 실전 문제 : 데이터 모델과 성능 (0)	2022.06.23
[SQLD] 실전 문제 : 데이터 모델링의 이해 (0)	2022.06.21
[SQLD] SQL 최적화의 원리 (0)	2022.01.20
[SQLD] SQL 활용 (0)	2022.01.19
[SQLD] SQL 기본 (0)	2022.01.18
[SQLD] 데이터 모델과 성능 (0)	2022.01.17
[SQLD] SQLD 소개 (0)	2022.01.13
국가공인 SQL 개발자(SQLD) 자격증 시험 개요 (0)	2022.01.13

⚠️AdBlock이 감지되었습니다. 원할한 페이지 표시를 위해 AdBlock을 꺼주세요.⚠️

일	월	화	수	목	금	토
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

[SQLD] 데이터 모델링(Data Modeling)

[SQLD] 데이터 모델링(Data Modeling)

① 데이터 모델링의 이해

데이터 모델링

데이터 모델링의 특징

데이터 모델링의 단계

(1) 개념적 모델링(Conceptual Data Modeling)

(2) 논리적 모델링(Logical Data Modeling)

(3) 물리적 모델링(Physical Modeling)

데이터 모델링을 위한 ERD(Entity Relationship Diagram)

(1) ERD 작성 절차

(2) ERD 작성 시 고려사항

데이터 모델링 고려사항

(1) 데이터 모델의 독립성

(2) 고객 요구사항의 표현

(3) 데이터 품질 확보

② 3중 스키마(3-Level Schema)

3층 스키마

3층 스키마 구조

③ 엔티티(Entity)

엔티티(Entity)

엔티티 도출

엔티티 특징

엔티티 종류

④ 속성(Attribute)

속성(Attribute)

속성의 특징과 종류

(1) 속성의 특징

(2) 속성의 종류

⑤ 관계(Relationship)

관계(Relationship)

관계의 종류

(1) 존재 관계

(2) 행위 관계

관계 차수(Cardinality)

(1) 관계 차수(Relation Cardinality)

(2) 관계 차수의 종류

식별 관계와 비식별 관계

(1) 식별 관계(Identification Relationship)

(2) 비식별 관계(Non-Identification Relationship)

⑥ 엔티티 식별자(Entity Identifier)

주식별자(기본키, Primary Key)

키의 종류

식별자의 종류

(1) 식별자의 대표성

(2) 생성 여부

(3) 속성의 수

(4) 대체 여부

'Certificate > SQLD' 카테고리의 다른 글

✏️ 카테고리

🏷️ 태그 목록

🗒️ 최근에 올라온 글

⭐ 인기 카테고리

📅 달력

📦 글 보관함

티스토리툴바