본문 바로가기
정보처리기사/실기

데이터베이스 - 신기술

by Anonymouszero 2025. 7. 16.
반응형

1. DB관련 신기술
 : 빅 데이터, 브로드 데이터, 메타 데이터, 디지털 아카이빙, 하둡, 맵리듀스, 타조, 데이터 다이어트, 데이터 마이닝, OLAP

빅 데이터(Big Data) - 기존의 관리 방법이나 분석 체계로는 처리하기 어려운 막대한 양의 정형/비정형 데이터 집합
- 기업이나 정부, 포털 등이 빅데이터를 효과적으로 분석하여 미래를 예측해
  최적의 대응 방안을 찾고 수익으로 연결하여 새로운 가치를 창출하기 때문에 주목받음
브로드 데이터(Broad Data) - 다양한 채널에서 소비자와 상호 작용을 통해 생성된 것
- 기업 마케팅에 있어 효율적이고 다양한 데이터
- 이전에 사용하지 않거나 알지 못했던 새로운 데이터나
  기존 데이터에 새로운 가치가 더해진 데이터
메타 데이터(Meta Data) - 일련의 데이터를 정의하고 설명해 주는 데이터
- 컴퓨터에서는 데이터 사전의 내용, 스키마 등을 의미
- HTML 문서에서는 메타 태그 내의 내용이 메타 데이터
디지털 아카이빙(Digital Archiving) - 디지털 정보 자원을 장기적으로 보존하기 위한 작업
- 아날로그 콘텐츠는 디지털로 변환한 후 압축해서 저장하고, 
  디지털 콘텐츠도 체계적으로 분류하고 메타 데이터를 만들어 DB화하는 작업
하둡(Hadoop) - 오픈 소스를 기반으로 한 분산 컴퓨팅 플랫폼
- 일반 PC급 컴퓨터들로 가상화된 대형 스토리지를 형성하고 그 안에 보관된
  거대한 데이터 세트를 병렬로 처리할 수 있도록 개발된 자바 소프트웨어 프레임워크
- 구글, 야후 등에 적용되고 있음
맵리듀스(MapReduce) - 대용량 데이터를 분산 처리하기 위한 목적으로 개발된 프로그래밍 모델
- 흩어져 있는 데이터를 연관성 있는 데이터 분류로 묶는 Map 작업을 수행한 후
중복 데이터를 제거하고 원하는 데이터를 추출하는 Reduce 작업을 수행
- Google에 의해 고안되었음
- 대표적인 대용량 데이터 처리를 위한 병렬 처리 기법으로 많이 사용됨
타조(Tajo) - 오픈 소스 기반 분산 컴퓨팅 플랫폼인 아파치 하둡(Apache Hadoop) 기반의
  분산 데이터 웨어하우스 프로젝트
데이터 다이어트(Data Diet) - 데이터를 삭제하는 것이 아니라 압축하고, 중복된 정보는 중복을 배제하고,
  새로운 기준에 따라 나누어 저장하는 작업
데이터 마이닝(Data Mining) - 대량의 데이터를 분석하여 데이터에 내재된 변수 사이의 상호관계를 규명하여
  일정한 패턴을 찾아내는 기법
OLAP(Online Analytical Processing) 다차원으로 이루어진 데이터로부터 통계적인 요약 정보를 분석하여 의사결정에 활용하는 방식
OLAP 연산 : Roll-up, Drill-down, Drill-through, Drill-across, Pivoting, Slicing, Dicing

 

반응형