網站首頁 編程語言 正文
1.簡版
--master yarn-cluster \
--jars mysql-connector-java-8.0.28.jar,sparklens-0.3.2-s_2.11.jar \
--driver-class-path mysql-connector-java-8.0.28.jar \
--conf spark.executor.extraClassPath=sparklens-0.3.2-s_2.11.jar \
--conf spark.extraListeners=com.qubole.sparklens.QuboleJobListener \
--conf spark.sparklens.reporting.disabled=true \
--conf spark.sparklens.data.dir=/projects/sparklens \
--conf spark.default.parallelism=1900 \
--conf spark.sql.shuffle.partitions=1900 \
--conf spark.dynamicAllocation.maxExecutors=250 \
--conf spark.dynamicAllocation.executorIdleTimeout=120s \
--conf spark.dynamicAllocation.initialExecutors=200 \
--conf spark.dynamicAllocation.minExecutors=200 \
--conf spark.executor.cores=3 \
--conf spark.executor.memory=512m \
--conf spark.executor.memoryOverhead=1g \
--conf spark.blacklist.enabled=true \
--conf spark.yarn.nodemanager.vmem-check-enabled=false \
--conf spark.yarn.nodemanager.pmem-check-enabled=false \
--conf spark.speculation.quantile=0.5 \
--conf spark.speculation.multiplier=1.4 \
--conf spark.yarn.dist.files=hdfs://projects/log4j2.properties#log4j2.propertie \
--conf "spark.driver.extraJavaOptions=-Dlog4j.configuration=file:log4j2.propertie" \
--conf "spark.executor.extraJavaOptions=-Dlog4j.configuration=file:log4j2.propertie" \
2.詳細注釋版
# 給下面的 Spark 啟動配置加上注釋
--master yarn-cluster \ # 設置 Spark 的運行模式為 yarn-cluster,即在 YARN 集群中運行應用程序
--jars mysql-connector-java-8.0.28.jar,sparklens-0.3.2-s_2.11.jar \ # 添加外部的 JAR 包 mysql-connector-java-8.0.28.jar 和 sparklens-0.3.2-s_2.11.jar
--driver-class-path mysql-connector-java-8.0.28.jar \ # 設置 Driver 運行時的 classpath,將 mysql-connector-java-8.0.28.jar 添加到 classpath 中
--conf spark.executor.extraClassPath=sparklens-0.3.2-s_2.11.jar \ # 設置 Executor 運行時的 classpath,將 sparklens-0.3.2-s_2.11.jar 添加到 classpath 中
--conf spark.extraListeners=com.qubole.sparklens.QuboleJobListener \ # 啟用 QuboleJobListener,用于監控 Spark 作業的性能指標
--conf spark.sparklens.reporting.disabled=true \ # 禁用 SparkLens 的報告功能,避免浪費資源
--conf spark.sparklens.data.dir=/projects/sparklens \ # 指定 SparkLens 存儲數據的目錄
--conf spark.default.parallelism=1900 \ # 設置默認并行度,即每個任務的分區數,默認值為核數 * 2
--conf spark.sql.shuffle.partitions=1900 \ # 設置 Shuffle 操作的分區數,默認值為核數 * 200
--conf spark.dynamicAllocation.maxExecutors=250 \ # 設置動態分配的最大 Executor 數量
--conf spark.dynamicAllocation.executorIdleTimeout=120s \ # 設置 Executor 空閑時間,超過該時間后將被回收
--conf spark.dynamicAllocation.initialExecutors=200 \ # 設置動態分配的初始 Executor 數量
--conf spark.dynamicAllocation.minExecutors=200 \ # 設置動態分配的最小 Executor 數量
--conf spark.executor.cores=3 \ # 設置每個 Executor 使用的 CPU 核數
--conf spark.executor.memory=512m \ # 設置每個 Executor 的內存大小
--conf spark.executor.memoryOverhead=1g \ # 設置 Executor 的內存 overhead
--conf spark.blacklist.enabled=true \ # 啟用 Executor 黑名單功能,避免因 Executor 運行異常導致的作業失敗
--conf spark.yarn.nodemanager.vmem-check-enabled=false \ # 禁用虛擬內存檢查,避免因虛擬內存檢查導致的作業失敗
--conf spark.yarn.nodemanager.pmem-check-enabled=false \ # 禁用物理內存檢查,避免因物理內存檢查導致的作業失敗
--conf spark.speculation.quantile=0.5 \ # 設置任務推測執行的百分比
--conf spark.speculation.multiplier=1.4 \ # 設置任務推測執行的倍數
--conf spark.yarn.dist.files=hdfs://projects/log4j2.properties#log4j2.propertie \ # 將日志配置文件log4j2.properties添加到Spark應用程序的classpath
--conf "spark.driver.extraJavaOptions=-Dlog4j.configuration=file:log4j2.propertie" \ # 配置Spark驅動程序(Driver)的日志級別等參數,將log4j2.properties文件作為驅動程序(Driver)的日志配置文件
--conf "spark.executor.extraJavaOptions=-Dlog4j.configuration=file:log4j2.propertie" \ # 配置Spark Executor的日志級別等參數,將log4j2.properties文件作為Executor的日志配置文件
原文鏈接:https://blog.csdn.net/Mint6/article/details/130598762
- 上一篇:沒有了
- 下一篇:沒有了
相關推薦
- 2022-10-22 C#中的屬性解析(get、set、value)_C#教程
- 2022-05-26 Android?Flutter實現3D動畫效果示例詳解_Android
- 2022-04-27 jQuery實現移動端懸浮拖動效果_jquery
- 2022-10-08 C#中的timer與線程使用_C#教程
- 2022-09-30 C++?多態虛函數的底層原理深入理解_C 語言
- 2022-03-21 C語言動態內存管理介紹_C 語言
- 2022-08-13 服務器上Redis主從復制和哨兵機制的配置
- 2022-05-25 Spring Security 中的權限注解很神奇嗎?
- 欄目分類
-
- 最近更新
-
- window11 系統安裝 yarn
- 超詳細win安裝深度學習環境2025年最新版(
- Linux 中運行的top命令 怎么退出?
- MySQL 中decimal 的用法? 存儲小
- get 、set 、toString 方法的使
- @Resource和 @Autowired注解
- Java基礎操作-- 運算符,流程控制 Flo
- 1. Int 和Integer 的區別,Jav
- spring @retryable不生效的一種
- Spring Security之認證信息的處理
- Spring Security之認證過濾器
- Spring Security概述快速入門
- Spring Security之配置體系
- 【SpringBoot】SpringCache
- Spring Security之基于方法配置權
- redisson分布式鎖中waittime的設
- maven:解決release錯誤:Artif
- restTemplate使用總結
- Spring Security之安全異常處理
- MybatisPlus優雅實現加密?
- Spring ioc容器與Bean的生命周期。
- 【探索SpringCloud】服務發現-Nac
- Spring Security之基于HttpR
- Redis 底層數據結構-簡單動態字符串(SD
- arthas操作spring被代理目標對象命令
- Spring中的單例模式應用詳解
- 聊聊消息隊列,發送消息的4種方式
- bootspring第三方資源配置管理
- GIT同步修改后的遠程分支