designing-data-intensive-applications

Part 3 파생 데이터

레코드 시스템과 파생 데이터 시스템

10장 - 일괄 처리

유닉스 도구로 일괄 처리하기

단순 로그 분석

연쇄 명령 대 맞춤형 프로그램

정렬 대 인메모리 집계

유닉스 철학

동일 인터페이스

로직과 연결의 분리

투명성과 실험

맵리듀스와 분산 파일 시스템

맵리듀스 작업 실행하기

맵리듀스의 분산 실행

맵리듀스 워크플로

리듀스 사이드 조인과 그룹화

맵 사이드 조인

일괄 처리 워크플로의 출력

검색 색인 구축

일괄 처리의 출력으로 키-값을 저장

일괄 처리 출력에 관한 철학

하둡과 분산 데이터베이스의 비교

저장소의 다양성

처리 모델의 다양성

빈번하게 발생하는 결함을 줄이는 설계

맵리듀스를 넘어

중간 상태 구체화

데이터플로 엔진

내결함성

구체화에 대한 논의

그래프와 반복 처리

고수준 API와 언어

선언형 질의 언어로 전환

정리