以下均已编写,需要的话请查看我发布的历史博客。
一、基础软件安装
1.[Linux 环境下 JDK 安装
2. Linux 环境下 Python 安装
3.虚拟机静态 IP 及多 IP 配置
二、Hadoop
1.Hadoop 单机环境搭建
2.Hadoop 集群环境搭建
3.基于 Zookeeper 搭建
三、Spark
- Spark 开发环境搭建
- 基于 Zookeeper 搭建 Spark 高可用集群
四、Flink
- Flink Standalone 集群部署
五、Storm
- Storm 单机环境搭建
- Storm 集群环境搭建
六、HBase
- HBase 单机环境搭建
- HBase 集群环境搭建
七、Flume
- Linux 环境下 Flume 的安装部署
八、Azkaban
- Azkaban3.x 编译及部署
九、Hive
- Linux 环境下 Hive 的安装部署
十、Zookeeper
- Zookeeper 单机环境和集群环境搭建
十一、Kafka
- 基于 Zookeeper 搭建 Kafka 高可用集群
版本说明
由于 Apache Hadoop 原有安装包之间兼容性比较差,所以如无特殊需求,本仓库一律选择 CDH (Cloudera’s Distribution, including Apache Hadoop) 版本的安装包。它基于稳定版本的 Apache Hadoop 构建,并做了兼容性测试,是目前生产环境中使用最为广泛的版本。
最新的 CDH 5 的下载地址为:http://archive.cloudera.com/cdh5/cdh/5/ 。这个页面很大且加载速度比较慢,需要耐心等待页面加载完成。上半部分是文档链接,后半部分才是安装包。同一个 CDH 版本的不同框架间都做了集成测试,可以保证没有任何 JAR 包冲突。安装包包名通常如下所示,这里 CDH 版本都是 ,前面是各个软件自己的版本 ,未避免出现不必要的 JAR 包冲突,请务必保持 CDH 的版本一致。
声明:本站部分文章及图片源自用户投稿,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!