Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
Tags
- 웹/모바일
- 백준 #baekjoon # 2563
- 후기
- 네이버 부스트 코스
- Ubuntu 20.04
- 운영체제론
- id # tr # 환경변수
- 네이버
- 부스트캠프
- 보기 편하라고 만든
- 8기
- Virtual Box 7.0.6
Archives
- Today
- Total
Miner
Spark(10) - 프로그램 구조 본문
Spark Session 생성
Spark 프로그램의 시작은 Spark Session 이라는 Object를 만드는 것 그리고 Spark Session에 다양한 환경설정을 하게 됨
- 프로그램마다 하나를 만들어 Spark Cluster와 통신: Singleton 객체
- Spark 2.0에서 처음 소개됨
Spark Session을 통해 Spark이 제공해주는 다양한 기능을 사용
- DataFrame, SQL, Streaming, ML API 모두 이 객체로 통신
- config 메소드를 이용해 다양한 환경설정 가능
- 단 RDD와 관련된 작업을 할때는 SparkSession 밑의 sparkContext 객체를
사용
Spark Session API 문서
pyspark.sql.SparkSession — PySpark 3.1.1 documentation (apache.org)
'데이터 엔지니어링 > Spark' 카테고리의 다른 글
Spark(9) - 데이터 구조 (0) | 2024.02.07 |
---|---|
Spark(8) : 데이터 처리 (0) | 2024.02.07 |
Spark(7) (0) | 2024.01.30 |
Spark(6) - Spark 사용 (0) | 2024.01.30 |
Spark(5) - Spark (0) | 2024.01.30 |