11、Flink配置flink-conf.yaml详细说明(HA配置、checkpoint、web、安全、zookeeper、historyserver、workers、zoo.cfg)
作者:mmseoamin日期:2024-04-27

Flink 系列文章

一、Flink 专栏

Flink

专栏系统介绍某一知识点,并辅以具体的示例进行说明。

  • 1、Flink 部署系列

    本部分介绍Flink的部署、配置相关基础内容。

  • 2、Flink基础系列

    本部分介绍Flink 的基础部分,比如术语、架构、编程模型、编程指南、基本的datastream api用法、四大基石等内容。

  • 3、Flik Table API和SQL基础系列

    本部分介绍Flink Table Api和SQL的基本用法,比如Table API和SQL创建库、表用法、查询、窗口函数、catalog等等内容。

  • 4、Flik Table API和SQL提高与应用系列

    本部分是table api 和sql的应用部分,和实际的生产应用联系更为密切,以及有一定开发难度的内容。

  • 5、Flink 监控系列

    本部分和实际的运维、监控工作相关。

    二、Flink 示例专栏

    Flink 示例专栏是

    Flink 专栏的辅助说明,一般不会介绍知识点的信息,更多的是提供一个一个可以具体使用的示例。本专栏不再分目录,通过链接即可看出介绍的内容。

    两专栏的所有文章入口点击:Flink

    系列文章汇总索引


    文章目录
    • Flink 系列文章
    • 一、目录结构说明
    • 二、基础配置
    • 三、高可用性配置
    • 四、容错和检查点 配置
    • 五、web 前端配置
    • 六、高级配置
    • 七、Flink 集群安全配置
    • 八、Zookeeper 安全配置
    • 九、HistoryServer
    • 十、查看下另外两个配置 workers / master
    • * 1、workers
      
      • 2、masters
      • 十一、zoo.cfg
      • 十二、日志配置
      • 十三、sql-client-defaults.yaml

        本文简单的介绍了flink的配置文件内容及配置项说明。

        一、目录结构说明

        安装完成后的目录结构如下:

        11、Flink配置flink-conf.yaml详细说明(HA配置、checkpoint、web、安全、zookeeper、historyserver、workers、zoo.cfg),在这里插入图片描述,第1张

        conf文件夹下的文件目录

        11、Flink配置flink-conf.yaml详细说明(HA配置、checkpoint、web、安全、zookeeper、historyserver、workers、zoo.cfg),在这里插入图片描述,第2张

        安装目录下主要有 flink-conf.yaml 配置、日志的配置文件、zk 配置、Flink SQL Client 配置。

        二、基础配置

        # jobManager 的IP地址
        jobmanager.rpc.address: localhost
        # JobManager 的端口号
        jobmanager.rpc.port: 6123
        # JobManager JVM heap 内存大小
        jobmanager.heap.size: 1024m
        # TaskManager JVM heap 内存大小
        taskmanager.heap.size: 1024m
        # 每个 TaskManager 提供的任务 slots 数量大小
        taskmanager.numberOfTaskSlots: 1
        # 程序默认并行计算的个数
        parallelism.default: 1
        # 文件系统来源
        # fs.default-scheme
        

        三、高可用性配置

        # 可以选择 'NONE' 或者 'zookeeper'.
        # high-availability: zookeeper
        # 文件系统路径,让 Flink 在高可用性设置中持久保存元数据
        # high-availability.storageDir: hdfs:///flink/ha/
        # zookeeper 集群中仲裁者的机器 ip 和 port 端口号
        # high-availability.zookeeper.quorum: localhost:2181
        # 默认是 open,如果 zookeeper security 启用了该值会更改成 creator
        # high-availability.zookeeper.client.acl: open
        

        四、容错和检查点 配置

        # 用于存储和检查点状态
        # state.backend: filesystem
        # 存储检查点的数据文件和元数据的默认目录
        # state.checkpoints.dir: hdfs://namenode-host:port/flink-checkpoints
        # savepoints 的默认目标目录(可选)
        # state.savepoints.dir: hdfs://namenode-host:port/flink-checkpoints
        # 用于启用/禁用增量 checkpoints 的标志
        # state.backend.incremental: false
        

        五、web 前端配置

        # 基于 Web 的运行时监视器侦听的地址.
        #jobmanager.web.address: 0.0.0.0
        #  Web 的运行时监视器端口
        rest.port: 8081
        # 是否从基于 Web 的 jobmanager 启用作业提交
        # jobmanager.web.submit.enable: false
        

        六、高级配置

        # io.tmp.dirs: /tmp
        # 是否应在 TaskManager 启动时预先分配 TaskManager 管理的内存
        # taskmanager.memory.preallocate: false
        # 类加载解析顺序,是先检查用户代码 jar(“child-first”)还是应用程序类路径(“parent-first”)。 默认设置指示首先从用户代码 jar 加载类
        # classloader.resolve-order: child-first
        # 用于网络缓冲区的 JVM 内存的分数。 这决定了 TaskManager 可以同时拥有多少流数据交换通道以及通道缓冲的程度。 如果作业被拒绝或者您收到系统没有足够缓冲区的警告,请增加此值或下面的最小/最大值。 另请注意,“taskmanager.network.memory.min”和“taskmanager.network.memory.max”可能会覆盖此分数
        # taskmanager.network.memory.fraction: 0.1
        # taskmanager.network.memory.min: 67108864
        # taskmanager.network.memory.max: 1073741824
        

        七、Flink 集群安全配置

        # 指示是否从 Kerberos ticket 缓存中读取
        # security.kerberos.login.use-ticket-cache: true
        # 包含用户凭据的 Kerberos 密钥表文件的绝对路径
        # security.kerberos.login.keytab: /path/to/kerberos/keytab
        # 与 keytab 关联的 Kerberos 主体名称
        # security.kerberos.login.principal: flink-user
        # 以逗号分隔的登录上下文列表,用于提供 Kerberos 凭据(例如,`Client,KafkaClient`使用凭证进行 ZooKeeper 身份验证和 Kafka 身份验证)
        # security.kerberos.login.contexts: Client,KafkaClient
        

        八、Zookeeper 安全配置

        # 覆盖以下配置以提供自定义 ZK 服务名称
        # zookeeper.sasl.service-name: zookeeper
        # 该配置必须匹配 "security.kerberos.login.contexts" 中的列表(含有一个)
        # zookeeper.sasl.login-context-name: Client
        

        九、HistoryServer

        # 你可以通过 bin/historyserver.sh (start|stop) 命令启动和关闭 HistoryServer
        # 将已完成的作业上传到的目录
        # jobmanager.archive.fs.dir: hdfs:///completed-jobs/
        # 基于 Web 的 HistoryServer 的地址
        # historyserver.web.address: 0.0.0.0
        # 基于 Web 的 HistoryServer 的端口号
        # historyserver.web.port: 8082
        # 以逗号分隔的目录列表,用于监视已完成的作业
        # historyserver.archive.fs.dir: hdfs:///completed-jobs/
        # 刷新受监控目录的时间间隔(以毫秒为单位)
        # historyserver.archive.fs.refresh-interval: 10000
        

        十、查看下另外两个配置 workers / master

        1、workers

        里面是每个 worker 节点的 IP/Hostname,每一个 worker 节点之后都会运行一个 TaskManager,一个一行。

        2、masters

        host:port
        

        十一、zoo.cfg

        # 每个 tick 的毫秒数
        tickTime=2000
        # 初始同步阶段可以采用的 tick 数
        initLimit=10
        # 在发送请求和获取确认之间可以传递的 tick 数
        syncLimit=5
        # 存储快照的目录
        # dataDir=/tmp/zookeeper
        # 客户端将连接的端口
        clientPort=2181
        # ZooKeeper quorum peers
        server.1=localhost:2888:3888
        # server.2=host:peer-port:leader-port
        

        十二、日志配置

        log4j-cli.properties
        log4j-console.properties
        log4j-yarn-session.properties
        log4j.properties
        logback-console.xml
        logback-yarn.xml
        logback.xml
        

        十三、sql-client-defaults.yaml

        execution:
          # 'batch' or 'streaming' execution
          type: streaming
          # allow 'event-time' or only 'processing-time' in sources
          time-characteristic: event-time
          # interval in ms for emitting periodic watermarks
          periodic-watermarks-interval: 200
          # 'changelog' or 'table' presentation of results
          result-mode: changelog
          # parallelism of the program
          parallelism: 1
          # maximum parallelism
          max-parallelism: 128
          # minimum idle state retention in ms
          min-idle-state-retention: 0
          # maximum idle state retention in ms
          max-idle-state-retention: 0
        deployment:
          # general cluster communication timeout in ms
          response-timeout: 5000
          # (optional) address from cluster to gateway
          gateway-address: ""
          # (optional) port from cluster to gateway
          gateway-port: 0
        

        以上,简单的介绍了flink的配置文件内容及配置项说明。

        学习网络安全技术的方法无非三种:

        第一种是报网络安全专业,现在叫网络空间安全专业,主要专业课程:程序设计、计算机组成原理原理、数据结构、操作系统原理、数据库系统、 计算机网络、人工智能、自然语言处理、社会计算、网络安全法律法规、网络安全、内容安全、数字取证、机器学习,多媒体技术,信息检索、舆情分析等。

        第二种是自学,就是在网上找资源、找教程,或者是想办法认识一-些大佬,抱紧大腿,不过这种方法很耗时间,而且学习没有规划,可能很长一段时间感觉自己没有进步,容易劝退。

        如果你对网络安全入门感兴趣,那么你需要的话可以点击这里👉网络安全重磅福利:入门&进阶全套282G学习资源包免费分享!

        第三种就是去找培训。

        11、Flink配置flink-conf.yaml详细说明(HA配置、checkpoint、web、安全、zookeeper、historyserver、workers、zoo.cfg),image.png,第3张

        接下来,我会教你零基础入门快速入门上手网络安全。

        网络安全入门到底是先学编程还是先学计算机基础?这是一个争议比较大的问题,有的人会建议先学编程,而有的人会建议先学计算机基础,其实这都是要学的。而且这些对学习网络安全来说非常重要。但是对于完全零基础的人来说又或者急于转行的人来说,学习编程或者计算机基础对他们来说都有一定的难度,并且花费时间太长。

        第一阶段:基础准备 4周~6周

        这个阶段是所有准备进入安全行业必学的部分,俗话说:基础不劳,地动山摇

        11、Flink配置flink-conf.yaml详细说明(HA配置、checkpoint、web、安全、zookeeper、historyserver、workers、zoo.cfg),image.png,第4张

        第二阶段:web渗透

        学习基础 时间:1周 ~ 2周:

        ① 了解基本概念:(SQL注入、XSS、上传、CSRF、一句话木马、等)为之后的WEB渗透测试打下基础。

        ② 查看一些论坛的一些Web渗透,学一学案例的思路,每一个站点都不一样,所以思路是主要的。

        ③ 学会提问的艺术,如果遇到不懂得要善于提问。

        11、Flink配置flink-conf.yaml详细说明(HA配置、checkpoint、web、安全、zookeeper、historyserver、workers、zoo.cfg),image.png,第5张

        配置渗透环境 时间:3周 ~ 4周:

        ① 了解渗透测试常用的工具,例如(AWVS、SQLMAP、NMAP、BURP、中国菜刀等)。

        ② 下载这些工具无后门版本并且安装到计算机上。

        ③ 了解这些工具的使用场景,懂得基本的使用,推荐在Google上查找。

        渗透实战操作 时间:约6周:

        ① 在网上搜索渗透实战案例,深入了解SQL注入、文件上传、解析漏洞等在实战中的使用。

        ② 自己搭建漏洞环境测试,推荐DWVA,SQLi-labs,Upload-labs,bWAPP。

        ③ 懂得渗透测试的阶段,每一个阶段需要做那些动作:例如PTES渗透测试执行标准。

        ④ 深入研究手工SQL注入,寻找绕过waf的方法,制作自己的脚本。

        ⑤ 研究文件上传的原理,如何进行截断、双重后缀欺骗(IIS、PHP)、解析漏洞利用(IIS、Nignix、Apache)等,参照:上传攻击框架。

        ⑥ 了解XSS形成原理和种类,在DWVA中进行实践,使用一个含有XSS漏洞的cms,安装安全狗等进行测试。

        ⑦ 了解一句话木马,并尝试编写过狗一句话。

        ⑧ 研究在Windows和Linux下的提升权限,Google关键词:提权

        11、Flink配置flink-conf.yaml详细说明(HA配置、checkpoint、web、安全、zookeeper、historyserver、workers、zoo.cfg),image.png,第6张

        以上就是入门阶段

        第三阶段:进阶

        已经入门并且找到工作之后又该怎么进阶?详情看下图

        11、Flink配置flink-conf.yaml详细说明(HA配置、checkpoint、web、安全、zookeeper、historyserver、workers、zoo.cfg),image.png,第7张

        给新手小白的入门建议:

        新手入门学习最好还是从视频入手进行学习,视频的浅显易懂相比起晦涩的文字而言更容易吸收,这里我给大家准备了一套网络安全从入门到精通的视频学习资料包免费领取哦!

        如果你对网络安全入门感兴趣,那么你需要的话可以点击这里👉网络安全重磅福利:入门&进阶全套282G学习资源包免费分享!

        11、Flink配置flink-conf.yaml详细说明(HA配置、checkpoint、web、安全、zookeeper、historyserver、workers、zoo.cfg),第8张

        11、Flink配置flink-conf.yaml详细说明(HA配置、checkpoint、web、安全、zookeeper、historyserver、workers、zoo.cfg),第9张