- 数据结构与算法 16
- 机器学习 9
- LeetCode 9
- 操作系统 2
- 计算机网络 3
- Markdown 1
- style 1
- HBase 13
- 分布式 2
- Kafka 1
- Linux 1
- Spark 14
- 设计模式 1
- Java 14
- Hive 8
- HDFS 2
- Hadoop 7
- 数据库 3
- Scala 7
数据结构与算法
- 深度优先搜索和广度优先搜索
- 查找算法总结
- 最小的 k 个数
- 数据结构——平衡二叉搜索树
- 数据结构——堆结构
- 数据结构——哈希表
- 数据结构——二叉树
- 数据结构——二叉查找树
- 数据结构——B树及其变体结构
- 排序算法总结
- 快速选择算法
- 左边和右边的最大差值
- 字符串匹配——KMP算法
- 二叉树的遍历
- Morris Traversal遍历二叉树
- LRU算法
机器学习
LeetCode
- leetcode——链表类问题
- leetcode——树类问题
- leetcode——子集生成问题
- leetcode——图类问题
- leetcode——回溯法总结
- leetcode——动态规划类问题
- leetcode——全排列生成问题
- leetcode——位运算总结
- leetcode——二分查找类问题
操作系统
计算机网络
Markdown
style
HBase
- HFile结构
- HBase读写流程
- HBase的LSM树结构
- HBase热点问题以及解决方案
- HBase文件合并
- HBase总结
- HBase基础架构
- HBase基本操作
- HBase删除和修改操作
- HBase优化
- HBase中Region的切分
- HBase中Memstore简介
- HBase中BlockCache简介
分布式
Kafka
Linux
Spark
- Spark SQL中Dataframe join操作含null值的列
- Spark资源调度
- Spark读取数据
- Spark算子
- Spark数据倾斜调优
- Spark基本概念解析
- Spark内存管理
- Spark作业执行流程
- Spark优化
- Spark中cache、persist、checkpoint
- Spark Shuffle
- Spark SQL——Data Sources(数据源)
- Spark 2.0 新特性
- RDD、DataFrame和DataSet区别
设计模式
Java
- Java静态代码块、构造代码块、构造函数以及Java类初始化顺序
- Java容器
- Java多线程之Executor框架
- Java多线程
- Java基础
- Java垃圾回收机制
- Java内存模型
- Java内存区域
- Java中的锁——Lock
- Java中synchronized的实现原理及优化
- Java中HashMap源码分析
- Java中ConcurrentHashMap源码分析
- Java中Comparable和Comparator比较
- HotSpot中的对象
Hive
HDFS
Hadoop
- Python模拟MapReduce实现
- Hadoop调度器
- Hadoop数据倾斜调优
- Hadoop基础架构变化
- Hadoop中Shuffle过程
- Hadoop中MapReduce执行流程详解
- Hadoop中Block和Split的区别