Spark(6) - Spark 사용

Notice

Recent Posts

Tags more

Archives

관리 메뉴

Miner

데이터 엔지니어링/Spark

MineTime76 2024. 1. 30. 17:15

기본적으로 대용량 데이터 배치 처리, 스트림 처리, 모델 빌딩

1) 대용량 비구조화된 데이터 처리하기 (ETL / ELT)

2) ML 모델에 사용되는 대용량 피쳐 처리 (배치 / 스트림)

3) Spark ML을 이용한 대용량 훈련 데이터 모델 학습

대용량 비구조화된 데이터 처리하기 (Hive의 대체 기술)

ETL 혹은 ELT

ML 모델에 사용되는 대용량 피쳐 처리

'데이터 엔지니어링/Spark' Related Articles