본문 바로가기

Data Science/SQLD

[SQLD] 데이터 모델링의 이해 1-1. 데이터 모델의 이해

반응형

과목1. 데이터 모델링의 이해

 

[1] 데이터 모델의 이해

1. 모델링의 이해

가. 모델링 정의
모델링 : 표기법에 의해 규칙을 가지고 표기하는 것

나. 모델링의 특징
추상화, 단순화, 명확화

다. 모델링의 세 가지 관점
데이터관점, 프로세스 관점, 데이터와 프로세스의 상관관점
데이터 관점 : 어떤 데이터와 관련이 있는지 또는 데이터 간의 관계는 무엇인지 (What, Data)
프로세스 관점 : 실제하고 있는 일, 무엇을 해야하는 지 (How, Process)
데이터와 프로세스의 상관관점 : 일의 방법에 따라 데이터는 어떻게 영향을 받는지 (interaction)

-> 데이터베이스를 구축하기 위한 데이터 모델링 기준

2. 데이터 모델의 기본 개념 이해

가. 모델링 정의
데이터베이스의 논리적인 구조를 이해하는 데이터 모델을 이해하는 것 : SQL 문장을 어떻게 구성할지에 대한 지식과 효율적인 구성에 대한 핵심 이론
-> 데이터를 시스템 구축 방법론에 의해 분석하고 설계하여 정보시스템을 구축하는 과정

데이터 모델링을 하는 이유
1. 정보들을 일정한 표기법에 의해 표현 -> 업무 내용을 정확하게 분석
2. 분석된 모델을 가지고 실제 데이터베이스를 생성해 개발 및 데이터관리에 사용하기 위한 것
-> 데이터 모델링 자체로서 업무를 설명하고 분석하는 부분에도 매우 중요하다

나. 데이터 모델이 제공하는 기능
(시스템) 가시화, (구조 및 행동) 명세화, (구축) 구조화된 틀을 제공, (과정) 문서화, 세부사항 숨기는 관점 제공, 구체화 된 상세 수준의 표현방법 제공

3. 데이터 모델링의 중요성 및 유의점
파급효과 (leverage), 요구사항의 간결한 표현(Conciseness), 데이터 품질(Data Quality)

가. 파급효과
각 단위 테스트들이 성공적으로 수행되고 완료되면, 병행테스트, 통합테스트 수행
-> 만일 이 단계에서 문제 발생으로 인한 데이터 구조의 변경시 일련의 변경작업은 매우 큰 위험요소

나. 복잡한 정보 요구사항의 간결한 표현(Conciseness)
데이터모델은 요구사항의 한계를 가장 명확하고 간결하게 표현하는 도구
설계 도면에 해당, 정보요구사항을 이해하고 운용할 수 있고, 데이터 정합성을 유지하도록 하는 것
-> 정확하고 간결하게 표현

다. 데이터 품질 (Data Quality)
데이터 구조의 문제
1) 중복 (Duplication)
여러 장소에 같은 정보를 저장하는 잘못을 하지 않도록 한다.
2) 비유연성 (Inflexibility)
데이터의 정의를 데이터 사용 프로세스와 분리
3) 비일관성 (Inconsistency)
데이터와 데이터간 상호연관 관계에 대한 명확한 정의를 통해 위험을 예방

4. 데이터 모델링의 3단계 진행
시간에 따라 진행되는 과정으로 추상화 수준에 따라
개념적 데이터 모델, 논리적 데이터 모델, 물리적 데이터 모델

추상적
개념적 데이터 모델 : 업무중심적, 포괄적인 수준
논리적 데이터 모델 : 업무의 모습과 흐름에 따른 구체화된 업무중심의 데이터 모델, 재사용성이 높음
물리적 데이터 모델 : 데이터베이스의 저장구조에 따라 고려한 방식
구체적

가. 개념적 데이터 모델링 (Conceptual Data Modeling)
데이터 요구사항을 찾고 분석하는데서 시작하며, 핵심 엔터티와 그들 간의 관계를 발견하고, E-R다이어그램 생성
1) 사용자와 시스템 개발자가 데이터 요구사항을 발견하는 것을 지원, 추상적이므로, 구조화를 쉽게하ㅏ고, 시스템 기능에 대해서 논의할 수 있는 기반을 형성
2) 어떻게 변형되어야 하는가를 이해하는데 유용, 고립된(Stand Alone) 시스템도 쉽게 표현되고 설명됨

나. 논리적 데이터 모델링 (Logical Data Modeling)
설계 프로세스의 Input으로 비즈니스 정보의 논리적인 구조와 규칙을 명확하게 표현하는 기법 또는 과정
어떻게 누가 엑세스 / 비즈니스 데이터에 존재하는 사실들을 인식해 기록
시스템 설계의 전 과정을 지원하는 : 과정의 도구

정규화 : 논리적 데이터 모델 상세화 과정의 대표적인 활동
1) 일관성 확보
2) 중복 제거
-> 속성들이 가장 적절한 엔터티에 배치되도록 => 신뢰성있는 데이터 구조

상세화 : 식별자 확정, 정규화, M:M 관계 해소, 참조 무결성 규칙 정의, 이력 관리에 대한 전략 정의

다. 물리적 데이터 모델링 (Physical Data Modeling)
물리적 스키마 : 어떻게 컴퓨터 하드웨어에 표현될 것인가

5. 프로젝트 생명주기(Life Cycle)에서 데이터 모델링
Waterfall : 분석과 설계단계로 구분
정보공학이나 구조적 방법론 : 분석단계에서 논리적 데이터 모델링, 설계 단계에서 물리적 데이터 모델링

데이터와 애플리케이션 축으로 구분돼 프로젝트 진행 -> 상호 집중을 지속적 수행하면서 단계절 완성도 높인다.
객체지향의 경우 데이터와 프로세스를 한꺼번에 바라보면서 모델링 전개 -> 일체형으로 진행

6. 데이터 모델링에서 데이터 독립성의 이해
가. 데이터독립성의 필요성
기능화된 구성 : 고유한 기능을 유지시키며 그 기능을 극대화
컴포넌트 기반 모듈 구성 : 각각의 고유한 기능을 가지며 다른 기능을 가지는 컴포넌트와 인터페이스를 가지게하는 모습으로 정의

SOA의 단위 ‘서비스’ : 독립적인 비즈니스로 처리 가능한 단위, 독립성을 구성해 다른 서비스와 결합해 프로세스로 제공해도 의미가 있는 단위

-> 다른 기능의 변경으로부터 쉽게 변경 되지 않고 기능을 제공

데이터 독립성 <-> 데이터 종속성
종속의 주체 ‘응용’ : 사용자 요구사항을 처리하는 사용자 접점의 인터페이스 오브젝트

이전의 파일 방식으로 데이터 구성시
->  사용자 접근하는 유형에 따라 데이터를 구성하는 방법이 영향을 받게 된다.

-> 유지보수 비용을 절감하고 데이터 복잡도를 낮추어 중복된 데이터를 줄이기 위한 목적
-> 요구사항에 대해 화면과 데이터베이스 간에 서로 독립성을 유지하기 위한 목적

효과
1) 각 View의 독립성을 유지하고 계층별 View에 영향을 주지 않고 변경이 가능
2) 단계별 Schema에 따라 데이터 정의어와 데이터 조작어가 다름을 제공

데이터 독립성의 이해
: 구조, 독립성, 사상

나. 데이터베이스 3단계 구조
외부단계, 개념적단계, 내부적 단계
: 서로 간섭되지 않는 모델

외부단계      (외부 스키마): 사용자와 가까운 단계 [사용자 관점]
개념적 단계 (개념 스키마) : 사용자가 처리하는 통합된 뷰를 설계하는 도구 [통합 관점]
내부적 단계 (내부 스키마: 데이터가 물리적으로 저장된 방법에 대한 스키마 구조 [물리적 저장 구조]

라. 두 영역의 데이터 독립성
각각의 영역에 대한 독립성을 지정하는 용어:
논리적 독립성, 물리적 독립성
논리적 독립성 : 외부의 변경에도 개념 스키마가 변하지 않는 특성, 개념 스키마가 변경되어도 외부 스키마에는 영향을 미치지 않음
물리적 독립성 : 내부스키마가 변경되어도 외부/개념 스키마는 영향을 받지 않음 [저장장치 구조변경 포함]

마. 사상(Mapping)
상호 독립적인 개념을 연결시켜주는 다리
논리적 사상(외부적/개념적 사상) : 외부 화면이나 사용자에게 인터페이스하기 위한 스키마 구조는 개념적 스키마와 연결
물리적 사상(개념적/내부적 사상) : 통합된 개념적 스키마 구조와 물리적으로 독립된 구조의 물리적인 테이블스페이스와 연결되는 구조

데이터 독립성을 보장하기 위해서 사상을 하는 스크립트(DDL)를 DBA가 필요할 때마다 변경해야한다.
-> 각 단계의 독립성을 보장하기 위해 변경사항 발생시 DBA가 적절하게 작업을 해줘서 독립성이 보장

반응형