1️⃣ 데이터베이스의 필요성
🧡 데이터와 정보
- 데이터
- 현실세계에서 단순히 관찰하거나 측정하여 수집한 사실 or 값
- ex. 온도
- 정보
- 데이터를 처리한 결과물
- ex. 평균기온
🧡 정보처리
- 정보처리
- 데이터에서 정보를 추출하는 과정 or 방법
- 데이터 → 정보처리 (가공) → 정보
🧡 정보시스템과 데이터베이스
- 정보시스템
- 조직 운영에 필요한 데이터를 수집&저장 이후, 필요할 때 유용한 정보를 만들어줌
- ex. 산업/정보 정보시스템
- 데이터베이스
- 정보시스템 안에서 데이타를 저장하다가 필요할 때 꺼내줌
2️⃣ 데이터베이스의 정의와 특징
🧡 데이터베이스
- 데이터베이스 정의
- 공유 데이터
- 특정 조직의 여러 사용자가 함께 소유하고 이용할 수 있는 공용 데이터
- 통합 데이터
- 최소의 중복과 통제 가능한 중복만 허용하는 데이터
- 저장 데이터
- 컴퓨터가 접근할 수 있는 매체에 저장된 데이터
- 운영 데이터
- 조직의 주요 기능을 수행하기 위해 지속적으로 꼭 필요한 데이터
- 공유 데이터
- 데이터베이스 특징
- 실시간 접근
- 사용자의 데이터 요구에 실시간으로 응답
- 계속 변화
- 데이터의 계속적인 삽입, 삭제, 수정을 통해 현재의 정확한 데이터를 유지
- 동시 공유
- 서로 다른 데이터의 동시 사용뿐만 아니라 같은 데이터의 동시사용도지원
- 내용 기반 참조
- 데이터가 저장된 주소나 위치가 아닌 내용으로 참조 가능
- 예) 재고량이 1,000개 이상인 제품의 이름을 검색하시오.
- 실시간 접근
3️⃣ 데이터 과학 시대의 데이터
🧡 형태에 따른 데이터 분류
- 정형 데이터
- 반정형 데이터
- 비정형 데이터
🧡 정형 데이터
- 정형 데이터
- 미리 정해진 구조에 따라 저장
- 구조화된 데이터
- → 데이터의 구조와 내용이 별도로 유지된다
- 엑셀 스프레드 시트, 관계 DB의 테이블
- 고정된 숫자, 고정된 문자의 형태
🧡 반정형 데이터
- 반정형 데이터
- 구조에 따라 저장
- but 데이터 내용 안에 구조에 대한 설명이 존재
- 파싱 작업 필요 (구조 파악 작업)
- ex. JSON, XML
🧡 비정형 데이터
- 비정형 데이터
- 정해진 구조 없이 저장된 데이터
- ex. 영상, 이미지, 워드, PDF
🧡 특성에 따른 데이터 분류
- 범주형 데이터
- 명목
- 순서
- 수치형 데이터
- 이산
- 연속
🧡 범주형 데이터
- 범주형 데이터
- 범주로 구분할 수 있는 값 (종류 존재)
- 산술연산X, 크기비교X
- 오직 구분/분류를 위한 것
- 질적 데이터
- 명목형 데이터
- 순서, 즉 서열이 없는 값을 가지는 데이터
- ex. 성별, 혈액형, 학과명, 거주 지역, 음식 메뉴, MBTI 검사 결과
- 순서형 데이터
- 순서, 즉 서열이 있는 값을 가지는 데이터
- ex. 학년, 학점, 회원 등급
🧡 수치형 데이터
- 수치형 데이터
- 크기비교, 산술연산 O
- 숫자 값 데이터
- 양적 데이터
- 이산형 데이터
- 개수를 셀 수 있는 띄엄띄엄 단절된 숫자 값을 가지는 데이터
- ex. 고객 수, 판매량, 합격자 수
- 연속형 데이터
- 측정을 통해 얻어지는 연속적으로 이어진 숫자 값을 가지는 데이터
- ex. 키, 몸무게, 온도, 점수
🧡 정성적 데이터와 정량적 데이터
- 정성적 데이터
- 계산 불가능
- 범주형 데이터
- 비정형 데이터
- 정량적 데이터
- 계산 가능
- 수치형 데이터
- 정형 데이터
- 정량적 데이터가 정성적 데이터에 비해 처리/저장 비용이 낮음
💻 Reference
'IT > 데이터베이스' 카테고리의 다른 글
[Chapter 05] 관계 데이터 모델 (0) | 2024.05.14 |
---|---|
[Chapter 04] 데이터 모델링 (1) | 2024.05.14 |
[Chapter 03] 데이터베이스 시스템 (0) | 2024.05.08 |
[Chapter 02] 데이터베이스 관리 시스템 (0) | 2024.05.08 |