별의 공부 블로그 🧑🏻‍💻
728x90
728x170

[SQLD] 데이터 모델링(Data Modeling)

① 데이터 모델링의 이해

데이터 모델링

  • 현실세계를 데이터베이스로 표현하기 위해서 추상화 한다.
  • 데이터 모델링을 하기 위해서는 고객과의 의사소통을 통해 고객의 업무 프로세스를 이해해야 한다.
  • 고객의 업무 프로세스를 이해한 후, 데이터 모델링 표기법을 사용해서 모델링을 한다.
  • 고객이 쉽게 이해할 수 있도록 복잡하지 않게 모델링해야 한다.
  • 고객의 업무 프로세스를 추상화하고, 소프트웨어를 분석/설계하면서 점점 더 상세해진다.
  • 고객의 비즈니스 프로세스를 이해하고 비즈니스 프로세스의 규칙을 정의한다. 
    • 정의된 비지니스 규칙을 데이터 모델로 표현한다.

 

데이터 모델링의 특징

  • 데이터 모델링은 추상화해야 한다.
    • 추상화는 공통적인 특징을 찾고 간략하게 표현한다.
  • 데이터 모델링은 단순화해야 한다.
    • 복잡한 문제를 피하고 누구나 이해할 수 있게 표현한다.
  • 데이터 모델링은 명확해야 한다.
    • 의미적 해석이 모호하지 않고 명확하게 해석되어야 한다.
특징 설명
추상화(Abstraction) 현실 세계를 간략하게 표현한다.
단순화(Simplification) 누구나 쉽게 이해할 수 있도록 표현한다.
명확성(Clarity) 명확하게 의미가 해석되어야 하고 한 가지 의미를 가져야 한다.

 

데이터 모델링의 단계

(1) 개념적 모델링(Conceptual Data Modeling)

  • 고객의 비지니스 프로세스를 분석하고 업무 전체에 대해서 데이터 모델링을 수행한다.
  • 복잡하게 표현하지 않고, 중요한 부분을 위주로 모델링하는 단계
  • 업무적 관점에서 모델링하며, 기술적 용어는 가급적 사용하지 않는다.
  • 엔티티(Entity)속성(Attribute)을 도출하고 개념적 ERD(Entity Relationship Diagram)를 작성한다.

 

(2) 논리적 모델링(Logical Data Modeling)

  • 개념적 모델링을 논리적 모델링으로 변환하는 작업
  • 식별자를 도출하고 필요한 모든 릴레이션을 정의한다.
  • 정규화를 수행해서 데이터 모델의 독립성을 확보한다.

 

(3) 물리적 모델링(Physical Modeling)

  • 데이터베이스를 실제 구축한다.
    • 테이블, 인덱스, 함수 등을 생성한다.
  • 성능, 보안, 가용성을 고려해서 구축한다.
데이터 모델링 단계 설명
개념적 모델링 - 전사적 관점에서 기업의 데이터를 모델링한다.
- 추상화 수준이 가장 높은 수준의 모델링이다.
- 계층형 데이터 모델, 네트워크 모델, 관계형 모델에 관계없이 업무 측면에서 모델링한다.
논리적 모델링 - 특정 데이터베이스 모델에 종속한다.
- 식별자를 정의하고 관계, 속성 등을 모두 표현한다.
- 정규화를 통해서 재사용성을 높인다.
물리적 모델링 - 구축할 데이터베이스 관리 시스템에 테이블, 인덱스 등을 생성하는 단계이다.
- 성능, 보안, 가용성을 고려하여 데이터베이스를 구축한다.

 

  • 데이터 모델링 관점
관점(View) 설명
데이터 - 비지니스 프로세스에서 사용되는 데이터
- 구조 분석, 정적 분석
프로세스 - 비즈니스 프로세스에서 수행하는 작업
- 시나리오 분석, 도메인 분석, 동적 분석
데이터와 프로세스 - 프로세스와 데이터 간의 관계
- CRUD(Create, Read, Update, Delete) 분석

 

데이터 모델링을 위한 ERD(Entity Relationship Diagram)

  • 1976년 피터첸(Peter Chen)Entity Relationship Model 표기법을 만들었으며, 사실상 데이터 모델링의 표준으로 사용되고 있다.
  • 엔티티와 엔티티 간의 관계를 정의하는 모델링 방법이다.

 

(1) ERD 작성 절차

  • ① 엔티티를 도출하고 그린다.
    • 업무에서 관리해야 하는 집합을 도출한다.
  • ② 엔티티를 배치한다.
    • 엔티티를 도출한 후 엔티티를 배치한다.
    • 중요한 엔티티를 왼쪽 상단에 배치한다.
  • ③ 엔티티 간의 관계를 설정한다.
  • 관계명을 서술한다.
    • 엔티티 간의 어떤 행위나 존재가 있는지 표현한다.
  • 관계 참여도를 표현한다.
    • 관계 참여도 : 1개의 엔티티와 다른 엔티티 간의 참여하는 관계 수
    • 예) '고객이 여러 개의 계좌를 개설할 수 있다.' 와 같은 의미를 표현하는 것
  • ⑥ 관계의 필수 여부를 표현한다.
    • 필수 : 반드시 존재해야 하는 것
    • 예) '모든 고객은 반드시 하나의 계좌를 개설해야 한다.' 와 같은 의미를 표현하는 것

 

(2) ERD 작성 시 고려사항

  • 중요한 엔티티를 가급적 왼쪽 상단에 배치한다.
  • ERD는 이해하기 쉬워야 하고, 너무 복잡하지 않아야 한다.

 

데이터 모델링 고려사항

(1) 데이터 모델의 독립성

  • 독립성이 확보된 모델은 고객의 업무 변화에 능동적으로 대응할 수 있다.
  • 독립성을 확보하기 위해서는 중복된 데이터를 제거해야 한다.
  • 정규화 : 데이터 중복을 제거하는 방법

 

(2) 고객 요구사항의 표현

  • 데이터 모델링으로 고객과 데이터 모델러 간에 의사소통을 할 수 있어야 하므로, 고객의 요구사항을 간결하고 명확하게 표현해야 한다.

 

(3) 데이터 품질 확보

  • 데이터베이스 구축 시에 데이터 표준을 정의하고 표준 준수율을 관리해야 한다.
  • 데이터 표준을 확보해야 데이터 품질을 향상시킬 수 있다.

 

② 3중 스키마(3-Level Schema)

3층 스키마

  • 사용자, 설계자, 개발자가 데이터베이스를 보는 관점에 따라 데이터베이스를 기술하고 이들 간의 관계를 정의한 ANSI 표준
    • ANSI SQL 표준 : SQL문이 모든 데이터베이스 관리 시스템에서 호환되도록 정의한 표준
  • 데이터베이스의 독립성을 확보하기 위한 방법
  • 데이터의 독립성을 확보하면 다음의 장점을 갖는다.
    • 데이터 복잡도 증가
    • 데이터 중복 제거
    • 사용자 요구사항 변경에 따른 대응력 향상
    • 관리 및 유지보수 비용 절감
  • 3단계 계층으로 분리해서 독립성을 확보하는 방법으로, 각 계층을 뷰(View)라고도 한다.
  • 3중 스키마의 독립성
독립성 설명
논리적 독립성 개념 스키마가 변경되더라도 외부 스키마가 영향을 받지 않는 것
물리적 독립성 내부 스키마가 변경되도라도 개념 스키마가 영향을 받지 않는 것

 

3층 스키마 구조

특징 설명
외부 스키마
(External Schema)
- 사용자 관점, 업무상 관련이 있는 데이터 접근
- 관련 데이터베이스의 뷰(View)를 표시한다.
- 응용 프로그램이 접근하는 데이터베이스를 정의한다.
개념 스키마
(Conceptual Schema)
- 설계자 관점, 사용자 전체 집단의 데이터베이스 구조
- 전체 데이터베이스 내의 규칙구조를 표현한다.
- 통합 데이터베이스 구조이다.
내부 스키마
(Internal Schema)
- 개발자 관점, 데이터베이스의 물리적 저장 구조이다.
- 데이터 저장 구조, 레코드 구조, 필드 정의, 인덱스 등을 의미한다.

 

③ 엔티티(Entity)

엔티티(Entity)

  • 업무에서 관리해야 하는 데이터 집합
  • 저장되고 관리되어야 하는 데이터
  • 개념, 사건, 장소 등의 명사
인물 엔티티의 의미
Peter Chen (1976) 엔티티는 변별할 수 있는 사물이다.
James Martin (1989) 정보를 저장할 수 있는 어떤 것이다.
C.J Date (1986) 데이터베이스 내부에서 변별 가능한 객체이다.
Thomas Bruce (1992) 정보가 저장될 수 있는 장소, 사람, 사건, 개념, 물건 등이다.

 

엔티티 도출

  • 엔티티는 고객의 비즈니스 프로세스에서 관리되어야 하는 정보를 추출해야 한다.

 

예 : 비지니스 프로세스
1. 고객이 회원가입을 한다. 회원으로 가입할 때는 회원ID, 패스워드, 이름, 주소, 전화번호 등을 입력해야 한다.
2. 회원으로 가입하기 위해서는 반드시 하나의 계좌를 개설해야 한다.
3. 고객은 계좌를 여러 개 개설할 수 있다.
4. 계좌를 개설할 때는 계좌번호, 계좌명, 예수금, 계좌개설 지점, 계좌담당자가 입력된다.
  • 엔티티 도출

 

엔티티 특징

특징 설명
식별자 - 엔티티는 유일한 식별자가 있어야 한다.
- 예) 회원ID, 계좌번호
인스턴스 집합 - 2개 이상의 인스턴스가 있어야 한다.
- 즉, 고객정보는 2명 이상 있어야 한다.
속성 - 엔티티는 반드시 속성을 가지고 있다.
- 예) 고객 엔티티에 회원ID, 패스워드, 이름, 주소, 전화번호
관계 - 엔티티는 다른 엔티티와 최소한 1개 이상의 관계가 있어야 한다.
- 예) 고객은 계좌를 개설한다.
업무 - 엔티티는 업무에서 관리되어야 하는 집합이다.
- 예) 고객, 계좌

 

  • 릴레이션과 테이블, 인스턴스(Instance)
    • 릴레이션테이블같은 의미라고 해석하면 된다.
      • 릴레이션기본키제약조건을 설정하면 테이블이 된다.
    • 단, Relationship릴레이션 간의 관계를 의미한다.
    • 인스턴스릴레이션이 가질 수 있는 값을 의미한다.
      • 간단히 행의 수를 의미한다.

 

엔티티 종류

  • 유형무형에 따른 종류
    • 분류 기준 : 물리적 형태의 존재 여부
종류 설명
유형 엔티티
(Tangible Entity)
- 업무에서 도출되며 지속적으로 사용되는 엔티티
- 예) 고객, 강사, 사원 등
개념 엔티티
(Conceptual Entity)
- 유형 엔티티는 물리적 형태가 있지만, 개념 엔티티는 물리적 형태가 없다.
- 개념적으로 사용되는 엔티티이다.
- 예) 거래소 종목, 코스닥 종목, 생명보험 상품
사건 엔티티
(Event Entity)
- 비지니스 프로세스를 실행하면서 생성되는 엔티티이다.
- 예) 주문 체결, 취소주문, 수수료 청구 등

 

  • 발생 시점에 따른 종류
종류 설명
기본 엔티티
(Basic Entity)
- 키 인티티(Key Entity)라고도 한다.
- 다른 엔티티로부터 영향을 받지 않고 독립적으로 생성되는 엔티티이다.
- 예) 고객, 상품, 부서 등
중심 엔티티
(Main Entity)
- 기본 엔티티행위 엔티티 간의 중간에 있는 것
- 즉, 기본 엔티티로부터 발생되고 행위 엔티티를 생성하는 것
- 예) 계좌, 주문, 취소, 체결 등
행위 앤티티
(Active Entity)
- 2개 이상의 엔티티로부터 발생하는 것
- 예) 주문 이력, 체결 이력 등

 

 

④ 속성(Attribute)

속성(Attribute)

  • 업무에서 필요한 정보인 엔티티가 가지는 항목
  • 더 이상 분리되지 않는 단위로, 업무에 필요한 데이터를 저장할 수 있음.
  • 인스턴스의 구성요소이고 의미적으로 더 이상 분해되지 않음.

 

속성의 특징과 종류

(1) 속성의 특징

  • 속성 : 업무에서 관리되는 정보
  • 속성은 하나의 값만 가진다.
  • 주식별자에게 함수적으로 종속된다.
    • 기본키변경되면, 속성의 값변경된다.

 

(2) 속성의 종류

  • 분해 여부에 따른 속성의 종류
특징 설명
단일(값) 속성
(Single-valued Attribute)
- 하나의 의미로 구성된 것
- 예) 회원ID, 이름 등
복합 속성
(Composite Attribute)
- 여러 개의 의미가 있는 것
- 예) 주소 (시, 군, 동 등으로 분해될 수 있음.)
다중값 속성
(Multi-valued Attribute)
- 속성에 여러 개의 을 가질 수 있는 것
- 예) 상품 리스트
- 다중값 속성은 엔티티로 분해된다.

 

  • 특성에 따른 속성의 분류
특징 설명
기본 속성
(Basic Attribute)
- 비지니스 프로세스에서 도출되는 본래의 속성
- 예) 회원ID, 이름, 계좌번호, 주문일자 등
설계 속성
(Designed Attribute)
- 데이터 모델링 과정에서 발생되는 속성
- 유일한 값을 부여한다.
- 예) 상품코드, 지점코드 등
파생 속성
(Derived Attribute)
- 다른 속성에 의해서 만들어지는 속성
- 예) 합계, 평균

 

  • 도메인(Domain)
    • 속성이 가질 수 있는 값의 범위
    • 예) 성별이라는 속성의 도메인은 '남자'와 '여자' 이다.

 

⑤ 관계(Relationship)

관계(Relationship)

  • 관계 : 엔티티 간의 관련성
  • 분류
    • 존재 관계 : 2개의 엔티티가 존재 여부의 관계가 있는 것
    • 행위 관계 : 2개의 엔티티가 어떤 행위에 의한 관련성이 있는 것

 

관계의 종류

(1) 존재 관계

  • 엔티티 간의 상태를 의미한다.
  • 예) 고객이 은행에 회원가입을 하면, 관리점이 할당되고, 그 할당된 관리점에서 고객을 관리한다.

 

(2) 행위 관계

  • 엔티티 간에 어떤 행위가 있는 것
  • 예) 계좌를 사용해서 주문을 발주하는 관계
    • 증권회사는 계좌를 개설하고 주문을 발주한다.

 

관계 차수(Cardinality)

(1) 관계 차수(Relation Cardinality)

  • 두 개의 엔티티 간에 관계에 참여하는 수
  • 예) 1명의 고객은 여러 개의 계좌를 개설할 수 있다.
    • 1대 N 관계

관계 차수의 종류

 

(2) 관계 차수의 종류

① 1대1 관계

종류 설명
완전 1대1 하나의 엔티티에 관계되는 엔티티의 관계가 하나인 경우로, 반드시 존재한다.
선택적 1대1 하나의 엔티티에 관계되는 엔티티의 관계가 하나이거나 없을 수도 있다.

 

② 1대N 관계

  • 엔티티에 행이 하나 있을 때 다른 엔티티의 값이 여러 개 있는 관계
  • 예) 고객은 여러 개의 계좌를 가질 수 있다.

 

③ M대 N관계

  • 2개의 엔티티가 서로 여러 개의 관계를 가지고 있는 것
  • 예) 1명의 학생이 여러 개의 과목을 수강할 수 있다.
    • 반대로, 한 개의 과목은 여러 명의 학생이 수강한다.
      • M대N 관계의 발생
  • 관계형 데이터베이스에서 M대N 관계의 조인(Join)
    • 카테시안 곱(Cartesian Product)의 발생
      • M대 N의 관계를 1대N, N대1로 해소해야 함.

 

④ 필수적 관계와 선택적 관계

  • 필수적 관계 '|' 로 표현되고, 선택적 관계 'O'로 표현된다.
구분 설명
필수적 관계 - 반드시 하나가 있어야 하는 관계
- 예) 고객이 반드시 있어야 계좌를 개설할 수 있다.
선택적 관계 - 없을 수도 있는 관계
- 예) 고객은 있지만, 계좌가 없을 수도 있다면 선택적 관계가 된다.

 

식별 관계와 비식별 관계

(1) 식별 관계(Identification Relationship)

  • <고객><계좌> 엔티티에서 <고객> 독립적으로 존재할 수 있는 강한 개체(Strong Entity)이다.
    • 강한 개체(Strong Entity) : <고객>
      • 누구에게도 지배되지 않는 독립적인 개체
      • 어떤 다른 엔티티에게 의존하지 않고 독립적으로 존재
      • 다른 엔티티와 관계를 가질 때, 다른 엔티티에게 기본키를 공유한다.
      • 식별 관계로 표현된다.
        • <고객> 엔티티의 기본적인 회원ID를 <계좌> 엔티티의 기본키의 하나로 공유 하는 것
      • 기본키 값변경되면, 식별 관계(기본키를 공유받은)에 있는 엔티티의 값도 변경된다.
    • 약한 개체(Weak Entity) : <계좌>
      • 개체의 존재가 다른 개체의 존재에 달려 있는 개체

 

(2) 비식별 관계(Non-Identification Relationship)

  • 강한 개체기본키를 다른 엔티티의 기본키가 아닌 일반 칼럼(열)으로 관계를 가지는 것
  • 점선으로 표현한다.

  • 예) <관리점> 엔티티의 기본 키지점코드이고, <고객> 엔티티와 비식별 관계를 가지고 있다.
    • 지점코드<고객> 엔티티의 기본키가 아닌 일반 칼럼(열)로 참조된다.
  • <계좌> 엔티티는 <고객> 엔티티의 회원ID 칼럼을 기본키로 공유하고 있다.
    • 이러한 관계를 식별 관계라고 하고, 실선으로 표현한다.

 

⑥ 엔티티 식별자(Entity Identifier)

  • 식별자 : 엔티티를 대표할 수 있는 유일성을 만족하는 속성
  • 예) 회원ID, 계좌번호, 주민등록번호, 외국인등록번호, 여권번호 등

 

주식별자(기본키, Primary Key)

  • 최소성 : 주식별자는 최소성을 만족하는 키이다.
  • 대표성 : 주식별자는 엔티티를 대표할 수 있어야 한다.
  • 유일성 : 주식별자는 엔티티의 인스턴스를 유일하게 식별한다.
  • 불변성 : 주식별자는 자주 변경되지 않아야 한다.

 

키의 종류

데이터베이스 키 설명
기본키
(Primary Key)
후보키 중에서 엔티티를 대표할 수 있는 키
후보키
(Candidate Key)
유일성최소성을 만족시키는 키
슈퍼키
(Super Key)
유일성은 만족하지만, 최소성을 만족하지 않는
대체키
(Alternate Key)
여러 개의 후보키 중에서 기본키를 선정하고 남은
외래키
(Foreign Key)
- 하나 혹은 다수다른 테이블 기본키 필드를 가리키는 것
- 참조 무결성(Referential Integrity)을 확인하기 위해 사용되는 키
- 허용된 데이터 값만 데이터베이스에 저장하기 위해 사용

 

식별자의 종류

  • 식별자는 대표성, 생성 여부, 속성의 수, 대체 여부 로 분류된다.

 

(1) 식별자의 대표성

  • 주식별자 : 엔티티를 대표할 수 있는 식별자
    • 예) 회원ID<고객> 엔티티의 주식별자가 됨.
  • 대표성 여부에 따른 식별자의 종류
종류 설명
주식별자 - 유일성최소성을 만족하면서, 엔티티를 대표하는 식별자
- 다른 엔티티와 참조 관계로 연결될 수 있다.
보조 식별자 유일성최소성은 만족하지만 대표성을 만족하지 못하는 식별자

 

(2) 생성 여부

  • 생성 여부에 따른 식별자의 종류
종류 설명
내부 식별자 - 엔티티 내부에서 스스로 생성되는 식별자
- 예) 부서코드, 주문번호, 종목코드 등
외부 식별자 - 다른 엔티티와의 관계로 인하여 만들어지는 식별자
- 예) <계좌> 엔티티의 회원ID

 

(3) 속성의 수

  • 속성의 수에 따른 식별자의 종류
종류 설명
단일 식별자 - 하나의 속성으로 구성
- 예) <고객> 엔티티의 회원ID
복합 식별자 - 2개 이상의 속성으로 구성

 

(4) 대체 여부

  • 대체 여부에 따른 식별자의 종류
종류 설명
본질 식별자 비지니스 프로세스에서 만들어지는 식별자
인조 식별자 - 인위적으로 만들어지는 식별자
- 다음의 경우에 사용
  - 후보 식별자 중에서 주식별자로 선정할 것이 없을 경우
  - 주식별자가 너무 많은 칼럼으로 되어 있는 경우
- 순서번호(Sequence Number)를 사용해서 식별자를 만든다.

 

728x90
그리드형(광고전용)
⚠️AdBlock이 감지되었습니다. 원할한 페이지 표시를 위해 AdBlock을 꺼주세요.⚠️


📖 Contents 📖