十道海量数据处理面试题

in 笔试面试 read (1156)

1、海量日志数据,提取出某日访问百度次数最多的那个IP IP的数目还是有限的,最多2^32个,所以可以考虑使用hash将IP直接存入内存,然后进行统计。 再详细介绍下此方案:首先是这一天,并且是访问百度的日志中的IP取出来,逐个写入到一个大文件中。注意到IP是32位的,最多...

Continue reading

学习资料

in JVM,Java,数据结构与算法 read (929)

常见数据结构与算法整理总结(上) 常见数据结构与算法整理总结(下) Java - 集合框架完全解析 关于Java集合的小抄 Java - 虚拟机学习笔记1 自动内存管理机制 Java - 虚拟机学习笔记2 类加载机制 Java - 网络编程完全总结 Java - 数据库学习...

Continue reading

递归效率比较低,能用循环尽量用循环 Sierpinski三角形就是递归实现的 斐波那契数列的递归实现 如果兔子在出生两个月后就有繁殖能力,一堆兔子每个月能生出一对小兔子来.假设所有兔子都不会死去,那么一年后可以繁殖多少兔子呢? 月数-兔子个数 所经过的月数 ...

Continue reading

以从小到大排序举例: 设数组长度为 N 过程:从第1个位置开始到最后,找到最小的数据放到第1个位置,然后再从第二个位置开始找到最小的数据放到第2个位置,以此类推直到找到第N-1个数就完成了排序 java代码: public class SelectionSort { ...

Continue reading

以从小到大排序举例: 设数组长度为N 1.从前到后依次比较相邻的数据,如果前面的数据大于后面的数据,就将两个数据进行交换 2.这样对数组的第0个数据到N-1个数据进行一次遍历后,最大的一个数据就"沉"到数组第N-1个位置 java代码: public c...

Continue reading

数据结构没有官方统一定义,可以理解为计算机中存储,组织数据的方式.例1.如何在书架上摆放图书? 其实这个问题很不科学,因为不知道数据的规模,数据如何组织与数据的规模有关系,不一样规模的问题处理起来的难度不一样.结论:解决问题方法的效率,跟数据的组织方式有关.例2.写程序实...

Continue reading

错排公式

in 数据结构与算法 read (1136)

定义:n 个元素排成一列,若每个元素所处位置的序号都与它的编号不同,则称这个排列为 n 个不同元素的一个错排. 理解:首先把第1个元素放到第k位一共有(n-1)种选择,第k位的元素有两种选择.第一种是把第k位的元素放到第1位,则剩下的元素一共有D(n-2)种排法,第2种是把...

Continue reading

Matrix42

Record and Share!