[DB] DB 개요
▶ ⭐️DB란?
여러 사용자들이 공용할 수 있도록 통합, 저장된 운영 데이터의 집합
- 통합 데이터: 데이터를 통합하여 중복 최소화(효율성 위해 통제된 중복 허용)
- 운영 데이터: 기능을 수행하기 위해 반드시 필요한 데이터의 집합(단순 입출력 데이터X, 임시 데이터X)
▷ DB 특징
- 계속적인 변화 : 삽입 · 삭제 · 수정을 통해 현재성과 정확성을 유지
- 내용에 의한 참조 : 저장된 주소나 위치가 아닌 내용(값)으로 참조
- 실시간 접근성
- 동시 공용
▶ 데이터의 유형
▷ 구조와 형태에 따른 분류
- 정형 데이터
- 구조화된 데이터
- 데이터 구조에 대한 설명과 데이터 내용 별도로 유지됨
- ex) 테이블, 엑셀 스프레드시트
- 반정형 데이터
- 구조에 따라 저장되지만, 데이터 내용 안에 구조에 대한 설명이 존재
- 즉, 구조를 파악하는 파싱 과정이 필요하고 보통 파일 형태로 저장
- ex) HTML, JSON 문서, XML
- 비정형 데이터
- 정해진 구조가 없이 저장된 데이터
- 텍스트, 영상, 이미지, 워드나 PDF 문서
▷ 데이터 특성에 따른 분류
- 수치형 데이터
- 이산형 데이터
- 크기 비교와 산술적인 연산 가능, 양적데이터
- 개수 셀 수 있는 띄엄띄엄 단절된 숫자 값 가짐
- ex) 고객수, 판매량
- 연속형 데이터
- 측정 통해 얻어지는 연속적으로 이어진 숫자 값 가짐
- ex) 키, 몸무게, 온도
- 이산형 데이터
- 범주형 데이터
- 명목형 데이터
- 순서가 없는 값을 가지는 데이터
- ex) 성별, 혈액형, 거주 지역, MBTI 유형
- 순서형 데이터
- 순서가 있는 값을 가지는 데이터
- ex) 학년, 학점 등급, 회원 등급
- 명목형 데이터
- 텍스트 데이터
- 이외데이터
- 음성, 이미지, 영상 데이터 등이 있음
▶ 문제
▷ 데이터의 유형 분류
- 영화 관람 후기 - 비정형 텍스트 데이터
- 도서 DB의 도서 장르 - 정형 범주형 중 명목형 데이터
- 통화 내용 녹음한 음성 파일 - 비정형 음성 데이터
- 고객 DB의 가입 고객 수 - 정형 수치형 중 이산형 데이터
- 물류 고객 창고 관리를 위해 온도/습도를 시간별로 기록한 센서 데이터 - 비정형 수치형 중 연속형 데이터
📎참조
- 데이터베이스 개론 - 한빛 아카데미
댓글남기기