Hadoop HDFS操作

2018-01-07 16:19 更新

启动HDFS

首先,您必须格式化配置的HDFS文件系统,打开namenode(HDFS服务器),然后执行以下命令。

$ hadoop namenode -format 

格式化HDFS后,启动分布式文件系统。以下命令将启动namenode以及数据节点作为集群。

$ start-dfs.sh 

在HDFS中列出文件

在服务器中加载信息后,我们可以在一个目录中找到文件列表,文件的状态,使用'ls'。下面给出了ls的语法,您可以将其传递到目录或文件名作为参数。

$ $HADOOP_HOME/bin/hadoop fs -ls <args>

将数据插入HDFS

假设我们在本地系统中的称为file.txt的文件中有数据,应该保存在hdfs文件系统中。按照以下步骤在Hadoop文件系统中插入所需的文件。

第1步

您必须创建一个输入目录。

$ $HADOOP_HOME/bin/hadoop fs -mkdir /user/input 

第2步

使用put命令将数据文件从本地系统传输并存储到Hadoop文件系统。

$ $HADOOP_HOME/bin/hadoop fs -put /home/file.txt /user/input 

第3步

您可以使用ls命令验证文件。

$ $HADOOP_HOME/bin/hadoop fs -ls /user/input 

从HDFS检索数据

假设我们在HDFS中有一个名为outfile的文件。下面给出的是从Hadoop文件系统中检索所需文件的简单示例。

第1步

最初,使用cat命令查看HDFS中的数据。

$ $HADOOP_HOME/bin/hadoop fs -cat /user/output/outfile 

第2步

使用get命令将文件从HDFS获取到本地文件系统。

$ $HADOOP_HOME/bin/hadoop fs -get /user/output/ /home/hadoop_tp/ 

关闭HDFS

您可以使用以下命令关闭HDFS。

$ stop-dfs.sh 
以上内容是否对您有帮助:
在线笔记
App下载
App下载

扫描二维码

下载编程狮App

公众号
微信公众号

编程狮公众号