Flink Rolling File Sink

in Hadoop,Flink read (1312)

Bucketing File Sink 创建一个默认的bucketing sink,sink到一个由时间作为切分的滚动的文件 DataStream<String> input = ...; //只需要一个文件存储的路径 input.addSink(new Buc...

Continue reading

Hadoop 底层通信(八)

in Hadoop read (751)

IPC和RPC IPC:进程间通信 RPC:remote procedure call,远程过程调用 Socket:套接字编程 Socket:客户端套接字 ServerSocket:服务器端 nio:异步通信 Channel Selector hadoop底层通信,使用Go...

Continue reading

hadoop常见问题

in Hadoop,大数据 read (810)

1. mkdir: Permission denied 原因:使用hadoop fs -mdkir /xxx/xxx创建文件路径时,出现权限问题 1.使用hdfs这个用户登录 sudo -uhdfs hadoop fs -mdkir /xxx/xxxx 2.通过hdfs用户...

Continue reading

Hadoop Yarn框架底层事件(七)

in Hadoop read (770)

Yarn框架底层事件分发原理 hadoop yarn调度框架 调度mr作业 基于事件 job 对应application applicatio基于状态机模型,后台web页面Applications下面的每个标签对应一种状态,有 new new saving subm...

Continue reading

Hadoop MapReduce工作原理(六)

in Hadoop read (931)

环境准备 进入符号链接的真实目录 cd -P link start x启动图形界面 /etc/default/grub sudo update-grub cat /etc/issue 查看linux版本 重启 下载hdt,解压放到插件目录 添加Hadoop Location...

Continue reading

Hadoop MapReduce(五)

in Hadoop read (865)

初识MapReduce 输入给map的时候每条数据加上行号构成key,value对,经过map的处理转换为另一种k,v对,然后shuffle,使reduce更容易处理 编写Mapper类 import java.io.IOException; import org.ap...

Continue reading

Hadoop Hadoop架构分析(四)

in Hadoop read (938)

节点架构 单节点体系 集群架构 节点(进程)之间的距离:到达共同节点距离之和 副本存放策略 V1 同一个机架放2分,另一份放到其他机架(当前节点为存储节点) V2 在一个机架上放1分,另外2分放到其他机架,防止断点数据丢失(当前节点为存储节点) 如...

Continue reading

Matrix42

Record and Share!