1. 데이터와 정보
2. 데이터베이스
3. 데이터베이스 활용
데이터의 어원
: 라틴어 dare 주어진것
Data Drivien Decision Making
: 데이터 주도(기반) 의사결정
1. 분류
정성적 데이터
: 텍스트나 추상적 묘사로 이루어진 데이터
정량적 데이터 (=계량적 데이터)
: 수치로 이루어진 데이터
2. 유형
정형 데이터
: 데이터의 구조가 정해진 데이터 -> 관계형 데이터베이스, 스프레드 시트의 데이터 구조는 테이블
(연산이 가능)
반정형 데이터 (=정형 데이터의 특성과 비정형 데이터의 특성을 모두 가진 데이터)
: 형식과 구조가 유연하지만 연산이 불가능한 파일 형식의 데이터로 스키마 정보를 함께 담는다. -> JSON, XML, HTML
(연산이 불가능)
비정형 데이터
: 형식이 정해지지 않은 데이터로 이미지, 동영상, 음성
3. 역할
암묵지
: 습득된 무형의 지식
형식지
: 형식화된 대상이 존재해 전달과 공유가 용이한 지식
암묵지 <-> 형식지
: (공동화 -> 표출화 -> 연결화 -> 내면화 -> 공동화)를 통해 지식이 확산되는 과정
(1) 표출화 : 암묵지 -> 형식지로 실체화해 표출하는 것
(2) 연결화 : 형식지 간 구조가 체계화돼 정리되는 것
(3) 내면화 : 체계화된 형식지를 통한 학습으로 습득해 암묵지화 되는 것
(4) 공동화 : 서로 공유를 통해 암묵지를 발전시킨 것
4. 데이터와 정보 :DIKW 피라미드
데이터 -> 정보 -> 지식 -> 지혜
: Data -> Information -> Knowledge -> Wisdom
(1) 객관적 사실 -> A: 500원 B: 1000원
(2) 사실을 통해 정리한 자료 -> A가 더 저렴하다.
(3) 어떠한 자료를 보고 판단한 결과 : A를 사는 게 좋다.
(4) 지식을 통해 깊은 이해를 통한 추상적 추론 : A를 파는 곳은 다른 것도 더 저렴할 것
1. 데이터베이스
: 정보처리와 체계적 수집,축적해 활용하도록 정보 집합체
2. DBMS
: 데이터베이스 구축 관리 소프트웨어
3. 종류
관계형 DBMS (RDBMS)
:테이블 구조로 저장한 DBMS
객체지향 DBMS -> 현재는 관계형 DBMS가 발전해 객체지향적인 특징을 가지도록 변화함
: 멀티미디어 데이터 지원
네트워크 DBMS
: 계층형 트리의 확장으로 망 형태
계층형 DBMS
: 데이터 관계를 트리구조로 정의해 부모/자식 노드를 갖는 DBMS
3. 정의 (통.저.공.변)
통합된 데이터
: 중복을 최소화한 데이터
저장된 데이터
공용 데이터
: 응용 시스템과 사용자가 공동으로 사용하는 데이터
변화되는 데이터
: 현 시점의 정보를 정확히 나타내도록하는 데이터 -> 변경사항을 적용한 데이터
4. 구성요소
메타 데이터
: 데이터를 설명하는 (구조화된) 데이터
인덱스
: 데이터를 쉽게 찾도록 하는 데이터 구조
스키마
: 데이터 구조와 유형을 정의한 데이터
(메타 데이터의 일종으로 볼 수도 있다.)
*SQL
데이터 접근 언어로 테이블 단위로 조작을 통해 데이터 전처리에 사용
5. 특징
실시간 접근성 (Real Time Accessibility)
계속적인 변화 (Continuous Evolution)
동시 공유 (Concurrent Sharing)
내용에 의한 참조 (Content Reference)
: 데이터 안의 주제적 성향을 참조하고 데이터들끼리 유기적으로 연결
'Data Science > ADsP' 카테고리의 다른 글
3과목. 데이터 분석 개념원리 (0) | 2024.02.21 |
---|---|
3과목. 데이터 분석 (1) | 2024.01.30 |
2과목. 데이터 분석 기획 (0) | 2024.01.28 |
1과목. 데이터의 이해 (0) | 2024.01.28 |
ADsP 과목과 합격 기준 (0) | 2023.10.07 |