基于docker构建Hadoop集群 适配M1芯片Mac及X86机型

目录

  • hadoop-docker
    • 本文源码地址
    • 什么是[docker](https://www.docker.com/)
    • docker与VMware的比较
    • 进入正题
      • X86架构
      • ARM64架构
    • 文件说明

hadoop-docker

本项目主要是通过docker搭建Hadoop分布式集群
主要适配MacOS M1芯片、arm64架构 以及 x86_64架构

本文源码地址

Github传送门
Gitee传送门
欢迎Star!!!

hadoop-docker-aarch64 => 适配MacOS M1芯片 以及 arm64架构

hadoop-docker-x86_64 => 适配x86架构

什么是docker

基于docker构建Hadoop集群 适配M1芯片Mac及X86机型_第1张图片
Docker的思想来自于集装箱,集装箱解决了什么问题?在一艘大船上,可以把货物规整的摆放起来。并且各种各样的货物被集装箱标准化了,集装箱和集装箱之间不会互相影响。那么我就不需要专门运送水果的船和专门运送化学品的船了。只要这些货物在集装箱里封装的好好的,那我就可以用一艘大船把他们都运走。

docker就是类似的理念。现在都流行云计算了,云计算就好比大货轮。docker就是集装箱。

  1. 不同的应用程序可能会有不同的应用环境,比如.net开发的网站和php开发的网站依赖的软件就不一样,如果把他们依赖的软件都安装在一个服务器上就要调试很久,而且很麻烦,还会造成一些冲突。比如IIS和Apache访问端口冲突。这个时候你就要隔离.net开发的网站和php开发的网站。常规来讲,我们可以在服务器上创建不同的虚拟机在不同的虚拟机上放置不同的应用,但是虚拟机开销比较高。docker可以实现虚拟机隔离应用环境的功能,并且开销比虚拟机小,小就意味着省钱了。
  2. 你开发软件的时候用的是Ubuntu,但是运维管理的都是centos,运维在把你的软件从开发环境转移到生产环境的时候就会遇到一些Ubuntu转centos的问题,比如:有个特殊版本的数据库,只有Ubuntu支持,centos不支持,在转移的过程当中运维就得想办法解决这样的问题。这时候要是有docker你就可以把开发环境直接封装转移给运维,运维直接部署你给他的docker就可以了。而且部署速度快。
  3. 在服务器负载方面,如果你单独开一个虚拟机,那么虚拟机会占用空闲内存的,docker部署的话,这些内存就会利用起来。

docker与VMware的比较

docker可以完成虚拟机可以完成的所有功能,并且VM所有虚拟机在创建的时候会虚拟独立的系统内核,而docker所有的虚拟机共用主机的系统内核,节约了虚拟环境系统部署的资源,将更好的性能提供给了应用,所以docker占用资源小,比虚拟机开启更快,更方便。

进入正题

X86架构

docker push puppets/hadoop:1.0

./start-container.sh # 创建容器(默认3个,hadoop-master、hadoop-slave1、hadoop-slave2)

ARM64架构

docker push puppets/hadoop_arm64:1.0

./start-container.sh # 创建容器(默认3个,hadoop-master、hadoop-slave1、hadoop-slave2)

文件说明

start-docker-hadoop.sh启动容器并进入hadoop-master主机节点

stop-docker-hadoop.sh停止运行容器

你可能感兴趣的