Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
Tags
- Ubuntu 20.04
- 네이버
- 웹/모바일
- 부스트캠프
- 네이버 부스트 코스
- 백준 #baekjoon # 2563
- 운영체제론
- Virtual Box 7.0.6
- 8기
- id # tr # 환경변수
- 보기 편하라고 만든
- 후기
Archives
- Today
- Total
Miner
스트리밍 데이터 처리(4) - 처리 시스템 구조 본문
처리 시스템 구조
Producer(Publisher)가 있어서 데이터 생성
생성된 데이터를 메세지 큐와 같은 시스템에 저장
- Kafka, Kinesis, Pub/Sub 등의 시스템 존재
- 데이터 스트림(Kafka에서는 토픽이라 부름) 마다 별도의 데이터 보유 기한 설정
Consumer(Subscriber)가 있어서 큐로부터 데이터를 읽어서 처리
- Consumer마다 별도 포인터 유지, 다수의 Consumer가 데이터 읽기를 공동 수행하기도 함
해당 기술을 이용해서,
구글 검색 엔진의 데이터 처리 - 계속적인 검색 인덱스 업데이트
구글이 기술적인 부분을 공개하지 않았지만 가능하다는 것을 보여줌,,
'데이터 엔지니어링 > 실시간 처리' 카테고리의 다른 글
스트리밍 데이터 처리(6) - 장점/단점 (0) | 2024.02.11 |
---|---|
스트리밍 데이터 처리(5) - 람다 아키텍처 (0) | 2024.02.11 |
스트리밍 데이터 처리(3) - 배치/실시간 (0) | 2024.02.11 |
스트리밍 데이터 처리(2) (0) | 2024.02.09 |
스트리밍 데이터 처리(1) (0) | 2024.02.09 |