Hudi写MOR表性能问题分析

in Flink,Hudi read (1104)

Flink版本:1.14 Hudi版本:0.8.0 背景 测试发现当使用MOR(Merge On Read)表的时候写入速度很慢 问题原因 对环境和代码进行分析,发现有2个问题 测试环境使用的是虚拟机,IO速度很慢 Hudi代码有问题 下面对代码问题进行分析 问题分析 ...

Continue reading

流处理应用程序通常是有状态的,“记住”已处理事件中的信息,并使用它来影响进一步的事件处理。在Flink中,记住的信息,即状态,被本地存储在配置的状态后端中。为了防止发生故障时丢失数据,状态后端会定期将其内容的快照持久化到预先配置的持久存储中。RocksDB状态后端(即Roc...

Continue reading

Flink Rolling File Sink

in Hadoop,Flink read (794)

Bucketing File Sink 创建一个默认的bucketing sink,sink到一个由时间作为切分的滚动的文件 DataStream<String> input = ...; //只需要一个文件存储的路径 input.addSink(new Buc...

Continue reading

Matrix42

Record and Share!