Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
Tags
- Virtual Box 7.0.6
- 8기
- Ubuntu 20.04
- id # tr # 환경변수
- 보기 편하라고 만든
- 부스트캠프
- 웹/모바일
- 후기
- 네이버 부스트 코스
- 백준 #baekjoon # 2563
- 운영체제론
- 네이버
Archives
- Today
- Total
Miner
Redshift 본문
- AWS 에서 제공하는 클라우드 기반의 완전 관리형 데이터 웨어하우스 서비스이다
- PetaByte 규모의 데이터까지 처리할 수 있다.
- PostgreSQL 을 기반으로 두고 있어 표준 SQL 을 이용하는 데이터 처리를 지원하며 이를 통해 BI를 얻을 수 있다.
- 고성능 컴퓨팅과 분산 스토리지 기능을 결합해 대규모 데이터 집합의 저장, 분석 및 쿼리 수행에 최적화되어 있음
- 컬럼 기반 스토리지가 사용 가능하다. / 데이터의 압축률을 높이고 저장 용량을 최적화
- 대용량 병렬 처리(MPP) 기능을 제공한다. / 대규모 데이터 집합을 빠르게 처리 가능
- SQL 기반의 쿼리 언어를 지원한다.
- 다른 AWS 서비스와 통합되어 있어 데이터를 쉽게 가지고 올 수 있다. / 높은 유연성과 확장성
- 다만 RedShift는 고정 비용 옵션이기 때문에 제약이 존재한다. 그래서 대용량의 데이터를 처리할 때는 Redshift 가 아닌 가변 비용 옵션의 데이터 웨어하우스 서비스 Big Query 와 Snowflake 를 쓰는 게 낫다.
- Cluster는 하나 이상의 Compute Node로 구성된다
- 두 개 이상의 Compute Node 가 구성되면 Leader Node 가 이를 조정하고 외부통신을 처리
- 모든 Client Application 은 Leader Node 와만 직접 상호 작용한다.
참조 :
https://velog.io/@ssongji/AWS-RedShift