`

Hadoop环境搭建(Linux + Eclipse开发)问题总结----伪分布模式

 
阅读更多

最近老大让看hadoop的,尝试着将环境搭起来,真是不搭不知道,一搭下一跳啊,几乎步步都出错啊。网上不少人的回答也是灰常的坑人啊比(如最典型的就是命令的大小写问题,如hadoop命令是小写的,很多人写出Hadoop,所以大家在遇到Command not found这类错误时,先看看是不是大小写的问题),总之过程很痛苦,好在终于搭建起来了。

我不打算重述搭建的步骤,在别的文章我也简单的介绍下,这样步骤在网络上有太多了,只是记录下自己搭建遇到的问题,备忘。

 

本人几乎没有在Linux环境下编过程,对于Linux也不熟悉,所以会有很多地方不对,后续慢慢更正。

环境:RedHat6(企业版)

Hadoop版本:1.04

Eclipse:3.4

模式:hadoop有三种模式,本地模式、伪分布模式、分布模式。由于只是用于学习,(条件也不允许搭建分布模式),只搭建了伪分布模式下的环境。

 

今天暂时把问题mark下,后续补上。

1:hadoop版本选择问题

2:ssh免密码登陆问题

3:Windows 与Linux 互ping

4:hadoop服务启动问题(start-all.sh)

5:Eclipse连接Hadoop问题(防火墙)

先mark到这吧,Linux相关的知识急需恶补~~~

 

问题1:版本选择问题

       第一次打环境的时候用的是hadoop 0.22.0版本,后来发现这个版本少了部分jar包(不知道为何?)于是又去Apache官网上下了1.04版本,官网上介绍的时候,也提到了此版本是稳定版本。

 

问题2:SSH免密码登陆问题

      对于这个问题,我至今也没搞定,我在同事的机器上试验了,没有问题,可是自己的机器死活还是要密码,也上网查了一些资料,大致的步骤如下,

 

root@localhost hadoop]# ssh-keygen -t rsa   一直按enter,就会按默认的选项将生成的密钥对保存在.ssh/id_rsa文件中
Generating public/private dsa key pair.
Your identification has been saved in /root/.ssh/id_dsa.
Your public key has been saved in /root/.ssh/id_dsa.pub.
The key fingerprint is:
74:79:98:eb:fa:e0:53:aa:e3:1b:e4:a4:16:7a:6b:31 root@localhost

执行以下命令
[root@localhost hadoop]# cp id_rsa.pub authorized_keys

然后执行ssh localhost,可以实现用ssh连接并且不需要密码连接

如果还是需要密码,那就是权限问题,将权限设置如下:

 

chmod 700 /.ssh/(对应自己安装的ssh路径)
chmod 600 /.ssh/authorized_keys
 一般情况下,如上操作就可以实现本机的ssh免密码登陆了(还是不行,我也不知道了,因为我自己至今还是要密码,郁闷中)
 我写ssh的目的不是为了说如何设置SSH免密码登陆,而是为了说明这一步在单机模式或者伪分布模式下并不是非得必要的,因为这里没有大量集群,即使连接的时候需要密码,也只要输入几次(我在伪分布模式下只需要输入3次即可)。很多人说这个必须要需设置免密码,个人觉得这话有点误导人,至少误导了我,我在ssh设置上花了大概一天的时候,还没搞定。其实如果只是出于学习Hadoop 的需要,如果在这一步上卡壳了,那就先别管他了吧,后续自己看看能不能再解决。(当然,如果能成功的设置的ssh免密码登陆那是最好的了)

    问题3:Windows 与Linux 互ping

    如果你跟我一样,习惯在Windows下进行开发,想在Windows-Eclipse下开发程序,那么这一步是必须的,至少要保证在Windows下ping通Linux。我也不敢细说这部分内容,怕误导了人,下面这个步骤是我在网上找到的,暂时这么用的,但是我不能保证合理性

转自:http://blog.163.com/shixw_2000/blog/static/183884421201211492215617/

 

首先,介绍如何在VMWARE中设置LINUX的网络。一般网络选项有Bridged, NAT, host-only几种。本次以我实现的host-only为样本来做详细说明,如下图:

关于win7与虚拟机LINUX互通ping的网络设置 - shixw_2000 - 春风沉醉的凝望
 在选择host-only模式之后,打开VMWARE的网络属性编辑窗口,就可以看到VMnet1网卡已经可见。
此处VMnet1可以设置Subnet的IP为192.168.0.0, mask为255.255.255.0。
关于DHCP选项,此处可以不管,因为我在LINUX虚拟机上是用yast来配置静态的ip,如:192.168.0.222(注意:这个静态IP地址必须与Subnet上设置的IP地址在同一网段),如图:
关于win7与虚拟机LINUX互通ping的网络设置 - shixw_2000 - 春风沉醉的凝望
 
关于选项中的NAT设置,我是严格按照网络上的建议,设置Gateway IP Address为192.168.0.1(实际上,我也尝试过使用192.168.0.*的任一IP,只要不与主机及linux虚拟机的ip冲突,都没问题)。如下图
关于win7与虚拟机LINUX互通ping的网络设置 - shixw_2000 - 春风沉醉的凝望
 

 基本上做完上述VMWARE虚拟机的配置,LINUX侧的基于host-only模式的网络配置就可以了。

然后再配置WINDOW本机上新增的网络接口卡VMnet1。此处也只需设置其ip地址为192.168.0.2(必须与之前Subnet ip在同一网段)。如下图:

关于win7与虚拟机LINUX互通ping的网络设置 - shixw_2000 - 春风沉醉的凝望

 至此,WINDOWS本机与LINUX虚拟机之间的网络设置就完成了。

当然,仅是如上的设置,可能还不能保证就可以实现WINDOWS与LINUX的ping互通问题。这其中就涉及到双方的防火墙问题了。

1、WINDOS侧存在防火墙。如果你发现WINDOWS可以ping通LINUX,而LINUX不能ping通WINDOWS,则应该是你WINDOWS本机上防火墙策略导致的问题。我本次也是被这个问题折磨了好长一段时间,直到关闭了WINDOSW本机的防火墙,终于就实现ping互通了。关闭本机WINDOWS防火墙的关闭方法如下:

开始 -> 控制面板 -> 系统和安全 -> Windows防火墙 -> 打开或关闭Windows防火墙 -> 关闭Windows防火墙

关于win7与虚拟机LINUX互通ping的网络设置 - shixw_2000 - 春风沉醉的凝望
2、LINUX侧存在防火墙。此时可能出现LINUX能ping通WINDOWS,但是windows却不能ping通LINUX。
检查LINUX是否有防火墙的方法是:
iptables -L 命令查看当前LINUX系统的策略。
 
我这里不需要各种防火墙策略,因此直接简单设置防火墙规则如下:
iptables -F   //清空当前防火墙规则
iptables -X   //删除系统配置的所有防火墙规则
iptables -P INPUT ACCEPT
iptables -P OUTPUT ACCEPT
iptables -P FORWARD ACCEPT
只要配置成开机自动执行上述命令,则启动后LINUX系统当前的防火墙策略就如下:
关于win7与虚拟机LINUX互通ping的网络设置 - shixw_2000 - 春风沉醉的凝望
 这样,就解除了LINUX的防火墙设置。
现在,就可以实现WINDOWS <-> LINUX系统之间的IP互通了。在LINUX上开启ssh服务,samba服务,都可以从WINDOWS上正常登陆了。

 

4:hadoop服务启动问题(start-all.sh)

   在hadoop1.0后,已经不建议使用start-all.s和stop-all.sh命令了,而是用start-dfs.sh start-mapred.sh 和stop-dfs.sh stop-mpared.sh这两组命令来实现服务的启动和关闭。

提示:在hadoop第一次启动之前,需要格式化namenode。(只有安装好环境第一次使用才进行此操作,如果后续又格式化了,那么会出现datanode于namenode命名空间不一致的错误,解决的方法也很简单,只需要手动的修改其中的任何一个使其一致就可以了,如何修改,也请看网上吧,很多的)

 

5:Eclipse连接Hadoop问题(防火墙)

      使用Eclipse(Windows环境下)连接到Linux时,本人遇到了两个问题,导致连不上,一个是由于Linux的防火墙设置导致的,我参照第三步的防火墙设置可以解决问题,但是显然不太好,有更好的处理方式,就用更好的吧。第二个问题是由于权限不够,这个问题,在我另一篇hadoop搭建篇有详细的介绍。再次就不累述了~

 

分享到:
评论

相关推荐

    Hadoop开发环境搭建Win8+Eclipse+Linux.pdf

    Hadoop开发环境搭建Win8+Eclipse+Linux.pdf

    Linux环境下Hadoop搭建与Eclipse配置

    hadoop安装、配置经验。对搭建hadoop平台很有帮助

    centos6.3 + hadoop1.04 + eclipse 3.3 整合示例

    linux下hadoop搭建与eclipse开发环境配置,包括hadoop中的 master、slaves工作过程处理

    hadoop eclipse 安装 环境搭建(成功搭建!)

    hadoop eclipse 环境安装,eclipse是运行在linux系统中的,里面包含了我调通的大数据调试环境,以及所涉及的安装软件,经过本人亲自调试,并成功运行!希望你们不要像我这样浪费很多时间去搭建。不懂的地方可以问我

    Hadoop在Linux系统上的搭建

    其中包含jdk文件,Hadoop,eclipse等,Hadoop的搭建有比较详细的过程,可以参考,要是要用更新的版本,可以去官网下载

    Hadoop-2.8.5全面资料

    包含hadoopbin_for_hadoop2.8.5.zip文件,hadoop-eclipse-plugin-2.8.5.jar文件,hadoop-2.8.5.tar.gz文件,jdk-8u181-linux-x64.tar.gz文件,以及Hadoop伪分布式搭建所需配置文件

    hadoop2.4.1(linux和window)及安装配置教程.7z

    此资源包含了hadoop2.4.1版本,并且有linux环境下的hadoop集群搭建说明以及eclipse下配置hadoop的插件,linux和window下都使用hadoop2.4.1只不过是lib下的native中资源库不一样(本资源都是64位)

    hadoop集群搭建所需软件(linux下的文件.zip)

    apache-hive-2.1.1-bin.tar(1).gz、eclipse-jee-indigo-SR2-linux-gtk.tar.gz、hadoop-2.7.5.tar.gz、hbase-1.2.4-bin.tar.gz、jdk-8u111-linux-x64.tar.gz、kafka_2.11-0.10.0.0.tgz、mysql-5.6.21.tar.gz、...

    Hadoop2.6.0eclipse插件及winutils.exe及hadoop.dll打包

    hadoop 2.6.0版本去官网就可以,这里把windows搭建环境需要的hadoop2.6.0 eclipse插件,winutils.exe,hadoop.dll打成资源包。linux只要插件就可以了,windows(测试的win10),需要另外两个文件放置在hadoop/bin及...

    hadoop在Eclipse上的所需的插件 winutils.exe等

    hadoop在linux上搭建好的集群,如果用Eclipsse编辑的java作业要在集群上运行,需要打包丢进linux集群上,在windows上的eclipse上添加这个插件,就可以直接在eclipse上运行作业很方便。

    Hadoop技术内幕:深入解析MapReduce架构设计与实现原理

    阅读源代码前的准备1.1 准备源代码学习环境1.1.1 基础软件下载1.1.2 如何准备Windows环境1.1.3 如何准备Linux环境1.2 获取Hadoop源代码1.3 搭建Hadoop源代码阅读环境1.3.1 创建Hadoop工程1.3.2 Hadoop源代码...

    实验项目 MapReduce 编程

    2. 在 Hadoop 集群主节点上搭建 MapReduce 开发环境 Eclipse。 3. 查看 Hadoop 自带的 MR-App 单词计数源代码 WordCount.java,在 Eclipse 项目 MapReduceExample 下建立新包 com.xijing.mapreduce,模仿内置的 ...

    大数据实验报告对应我的第二篇博客

    一、大数据平台的搭建 3 1. 架构设计 6 2 服务器集群的搭建 7 (1)安装Linux操作系统、 14 (2)安装大数据处理框架Hadoop 20 3 工具软件安装 21 (1)安装关系型数据库MySQL 26 (2)安装列族数据库HBase 27 (3)...

    下载及相关内容.txt

    Java基础(含Eclipse开发工具) 大数据环境搭建 HDFS分布式文件系统 MapReduce分布式计算框架 YARN资源调度框架 Zookeeper分布式协调服务 python编程与爬虫 Flume实时采集系统 其它赠送资源: 【1】架构师笔记 【2...

    (南阳理工)大数据实验报告02.docx

    一、大数据平台的搭建(目录内容) 3 1. 架构设计 6 2 服务器集群的搭建 7 (1)安装Linux操作系统(目录内容)、 14 (2)安装大数据处理框架Hadoop(目录内容) 20 3 工具软件安装(目录内容) 21 (1)安装关系型...

Global site tag (gtag.js) - Google Analytics