Skip to content

houzhizhen/hadoop-utils

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

22 Commits
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

hadoop-utils

Various hadoop utils

1. MkDirs

hadoop jar ./fs-test-1.8.10.jar com.baidu.fs.raw.RawFs mkdirs /user/hive

2. PutAndListAndInterrupt

hadoop jar ./fs-test-1.8.10.jar basePath threadNum subdirNum fileNum iterationTimes

示例

hadoop jar ./fs-test-1.8.10.jar com.baidu.fs.parallel.PutAndListAndInterrupt hdfs://master-4b115ab:8020/base 100 1 100 100

参数说明

basePath:路径根地址
threadNum:线程数量,每个线程会创建一个 ${basePath}/thread_${threadId} 目录作为子线程的根目录。
subdirNum:每个线程子目录的数量
fileNum:每个子目录下文件的数量。
iterationTimes:读取的迭代次数

3. PutAndList

多线程 put 和 list

hadoop jar ./fs-test-1.8.10.jar com.baidu.fs.parallel.PutAndList basePath threadNum subdirNum fileNum iterationTimes

示例

hadoop jar ./fs-test-1.8.10.jar com.baidu.fs.parallel.PutAndList bos://bmr-rd-wh/houzhizhen/test 1 2000 1 1

参数说明

basePath:路径根地址
threadNum:线程数量,每个线程会创建一个 ${basePath}/thread_${threadId} 目录作为子线程的根目录。
subdirNum:每个线程子目录的数量
fileNum:每个子目录下文件的数量。
iterationTimes:读取的迭代次数

3. MakeDirs

hadoop jar ./fs-test-1.8.10.jar com.baidu.fs.test.LongTimeDirTest basePath subdirNum

示例

hadoop jar ./fs-test-1.8.10.jar com.baidu.fs.test.LongTimeDirTest bos://bmr-rd-wh/houzhizhen/test  2000 

参数说明

basePath:路径根地址
subdirNum:根地址下子目录的数量

4. TestGetApplicationReport

可以有两个参数,第一个参数是 clusterTimestamp, 类型为 long。 第2个参数是 applicationId, 类型为 int。默认 clusterTimestamp=1, applicationId=2.

hadoop jar yarn-1.8.10.jar com.baidu.resourcemanager.TestGetApplicationReport

4. Bos Conflict Test

使用 Bos filesystem 作为 resourcemanager 的 store 的时候,抛出异常。 path remainCount loopCount.

hadoop jar ./fs-test-1.8.10.jar com.baidu.fs.test.BosConflictTest path remainCount loopCount

About

Various hadoop utils

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published