Hadoop集群搭建及Python操作( 二 )


最后使用Hadoop Streaming接口进行操作:
$ hadoop jar $HADOOP_HOME/share/hadoop/tools/lib/hadoop-streaming-2.7.3.jar \
-input input.txt \
-output output \
-mapper map.py \
-reducer reduce.py
该命令将input.txt作为输入,output作为输出,使用map.py和reduce.py进行MapReduce操作 。
三、

猜你喜欢