반응형
정형데이터, 반정형데이터, 비정형데이터
정형데이터
사람들이 보기 좋은 행과 열로 되어있는 데이터이고, 대부분 업무에 사용되는 데이터형식
엑셀이 대표적이다. 파이썬에서는 Pandas로 자주 쓰인다.
종류
텍스트 파일 (TXT, CSV, BAT,..)
소프트웨어 전용 파일(EXCEL, SPSS, ...)
데이터 베이스 파일(DB)
반정형 데이터 (비정형+정형)
비정형과 정형의 합친 꼴로 웹브라우저에서 자주쓰인다.
파이썬에서는 JSON을 내장함수(라이브러리)로 자주 이용한다.
종류
JSON파일(Key-Value쌍으로 이루어짐) -> 자바스크립트가 자주 쓰이기 때문에 웹에서 데이터 교환시 사용
XML파일(Tag를 통해 데이터를 설명) -> HTML보다 자유로운 태크이다.
비정형 데이터
정형적이지 않은 데이터로 대표적 라이브러리로는 OpenCv(컴퓨터 비전)가 있다.
이미지 파일(JPG, PNG)
멀티미디어 파일(오디오, 동영상)
바이너리 파일(0과 1로 이루어짐)을 의미한다.
반응형