Hadoop简介 Apache开源软件,Doug Cutting(Luncene) 计算框架 分布式 可靠 可伸缩 搜索引擎 海量数据存储 Hadoop发展史 2002年Apache Nutch 抓取网页,数十亿存储瓶颈 2003年 GFS论文 ...
Continue reading大数据生态系统 Java-大数据的基石 Hadoop生态圈 Hive Hive依赖HDFS进行存储,表是逻辑表 Hive的SQL翻译成MR执行 Hive可以将结构化数据映射成一张单表 OLAP,重在分析和统计 不支持低延迟操作 不提供row...
Continue readingTrace跟踪参数 -verbose:gc -XX:+printGC 可以打印GC的简要信息 [GC 4790K->374K(15872K), 0.0001606 secs] [GC 4790K->374K(15872K), 0.0001474 secs] [G...
Continue readingJVM启动流程 使用java或javaw启动,后面跟一个包含main方法的启动类 在当前路径寻找配置文件jvm.cfg 根据配置寻找JVM.dll 初始化JVM获得JNIEnv接口,JNIEnv接口包括一些和jvm交互的操作,比如查找一个类 找到mai...
Continue readingJVM概念 JVM是Java Virtual Machine的简称.意为Java虚拟机 虚拟机 指通过软件模拟的具有完整硬件系统功能的,运行在一个完全隔离环境中的完整计算机系统 有哪些虚拟机 VMWare Visual Box JVM VMW...
Continue reading影响排序算法性能的几个要素 时间性能 辅助空间 算法的复杂性 冒泡排序 冒泡排序的基本思想 两两相邻记录的关键字,如果反序则交换,直4到没有反序的记录为止 Code void BubbleSort(int k[],int n) { int i,j,t...
Continue reading多路查找树(multi-way search tree) 多路查找树的特点是其每一个节点的孩子数可以多余两个,且每一个节点处可以存储多个元素 所有元素之间存在某种特定的排序关系 存储 当在磁盘的很多文件中查找一个文件时,会把磁盘中的内容加载到内存中,加载几千...
Continue reading平衡二叉树的实现代码如下 #include <stdio.h> #include <stdlib.h> #define TRUE 1 #define FALSE 0 // 定义平衡二叉树的结点结构 typedef struct BiTNode ...
Continue reading