1. 介绍

首先假设你已经安装好了hadoop。

从maven仓库下载符合自己版本的测试jar,并且放到服务器上

2. 使用teragen生成数据

hadoop jar hadoop-*-examples.jar teragen 参数1 参数2

teragen的参数解释:

参数1:表示要产生的数据的行数。Teragen每行数据的大小是100B。

要产生1T的数据,需要的行数=102410241024*1024/100=10995116277行

参数2 : 产生的数据放置的文件夹地址

默认的teragen的启动的map数比较少,只有2个,如果要指定map数......