Article
[整理] Hadoop入门
# 1. 环境准备
工欲善事其必先利其器。不要吝啬硬件上投入,找一个适合自己的环境!
- Windows
- 快速打开程序
- Cygwin:Windows本地编译需要,执行命令比 cmd 更方便
- Windows + Linux双系统
- Linux
# 2. 安装部署hadoop/spark
# 编译安装
# 功能优化
# 维护
# 旧版本安装
- Windows下部署/配置/调试hadoop2
Windows配置hadoop伪分布式环境(续)不再推荐cygwin下部署Hadoop。- 快速搭建第二个hadoop分布式集群环境
Ant实现hadoop插件Run-on-Hadoop
# 3. 进阶
# 配置深入理解
# 问题定位
# 读码
- Hadoop2 Balancer磁盘空间平衡
- Hadoop Distcp
# 其他
# 4. Hadoop平台
- zookeeper
- hive
- kafka
- alluxio(tachyon)
# 5. 监控与自动化部署
# 监控
- top
nagioscactiGanglia更简单- ganglia
# 自动化
- git:
- expect-批量实现SSH无密钥登录
- puppet
- puppet4.4.1入门安装
- puppet入门之域名证书
- puppetdb安装配置
- puppet-ui
- puppetboard安装
- puppetexplorer设置
- foreman
- RPM打包
- puppet基本使用以及配置集群
- mcollective
- Hiera
…
–END
Related
Related posts
-
杀鸡焉用牛刀:DuckDB 正取代部分 Spark 场景
2026-02-16
-
基于对象存储的 Spark 数据读写实战:从末尾追加到任意更新
2025-10-28
-
认真的博客
2021-12-08
-
视频自动翻译
2018-08-25