IteratorX: simplest iterator for IO

1. Reader: JdbcReader, FileReader

Readers can iteratively read data into json objects, including JdbcReader and FileReader.

1.1. JdbcReader: read jdbc table rows into json objects

Read each jdbc Table Row into JSONObject iteratively.

We provide jdbc driver for Mysql, Postgresql, Sqlite and Derby. You may download drivers for Oracle, Sqlserver, DB2, Hive and others by yourself.

	// create jdbc reader
	final JdbcReader jdbcReader = new JdbcReader(
			new JdbcDataSourceBuilder().setUrl("jdbc:postgresql://10.23.112.2:3333/dbname")
					.setUser("username").setPassword("password").build());
	
	// fetch by iterable
	for (final JSONObject item : jdbcReader.read("select * from tablename")) {
		System.err.println(item);
	}
	
	// fetch all into one collection
	final Collection<JSONObject> items = jdbcReader.readAll("select * from tablename where type = ?", param);
	for (final JSONObject item : items) {
		System.err.println(item);
	}

1.2. FileReader: read file content lines into json objects

Read each file content line into JSONObject iteratively.

	// create file reader
	final FileReader fileReader = new FileReader();

	// fetch by iterable
	for (final JSONObject item : fileReader.read(new File("data.json"), "utf-8")) {
		System.err.println(item);
	}

	// fetch all into one collection
	final Collection<JSONObject> items = fileReader.readAll(new File("data.json"), "utf-8");
	for (final JSONObject item : items) {
		System.err.println(item);
	}

2. Writer: JdbcWriter, FileWriter

Writers can iteratively write data from json objects, including JdbcWriter and FileWriter.

2.1. JdbcWriter: write jdbc table rows from json objects

2.2. FileWriter: write file content lines from json objects

3. Parallels: Threads, Flink, RxJava

As we always need to process data in parallel, we support many parallels engines: Threads(ThreadPool), Flink and RxJava.

NOTICE: all parallels engines support not only JSONObject but other Parametized types, just try it.

3.1. Threads: using ThreadPool to process data in parallel

Fixed-size thread pool are used to process data in multi-threads, the default thread size is the 3 times of available processors.

	// process each item parallelly using thread pool
	Threads.from(jdbcReader.read("select * from tablename")).forEach(item -> {
		System.err.println(item);
	});
	
	// process batch data parallelly
	Threads.from(jdbcReader.read("select * from tablename")).forBatch(items -> {
		for (final JSONObject item : items) {
			System.err.println(item);
		}
	});

3.2. Flink: using Flink to process data in parallel

Flink can run in both standalone local mode and remote cluster mode, this is fantastic to debug and execute. We prefer using Flink engine to process big data in parallel. The default parallelism is the 3 times of available processors.

	// process each item parallelly using Flink engine
	Flink.from(jdbcReader.read("select * from tablename")).forEach(item -> {
		System.err.println(item);
	});
	
	// process batch data parallelly
	Flink.from(jdbcReader.read("select * from tablename")).forBatch(items -> {
		for (final JSONObject item : items) {
			System.err.println(item);
		}
	});
	
	// use DataSet directly to enable all Flink power
	Flink.from(jdbcReader.read("select * from tablename")).dataSet().distinct().count();

3.3. RxJava: using RxJava to process data in parallel

We also support RxJava engine, the default parallelism is the 3 times of available processors.

Known issues: the RxJava will not quit automatically when processing data finished, we will try to fix this bug.

	// process each item parallely using RxJava engine
	RxJava.from(jdbcReader.read("select * from tablename")).forEach(item -> {
		System.err.println(item);
	});
	
	// process batch data parallely
	RxJava.from(jdbcReader.read("select * from tablename")).forBatch(items -> {
		for (final JSONObject item : items) {
			System.err.println(item);
		}
	});
	
	// use Observable directly
	RxJava.from(jdbcReader.read("select * from tablename")).observable().distinct().count();

4. Release Notes

v1.0.0

Add JdbcReader.

v1.0.1

Provide jdbc driver for Mysql, Postgresql, Hive, Sqlite and Derby.

v1.0.2

Add Parallels as Threads, Flink, RxJava.

Remove jdbc driver for Hive.

v1.0.3

Set default parallelism as 3 times of available processors.

Fix bugs.

v1.0.4

Add FileReader

v1.0.5

Add JdbcWriter

Name		Name	Last commit message	Last commit date
Latest commit History 52 Commits
src/io/iteratorx		src/io/iteratorx
.classpath		.classpath
.gitignore		.gitignore
.project		.project
LICENSE		LICENSE
README.md		README.md
pom.xml		pom.xml

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

IteratorX: simplest iterator for IO

1. Reader: JdbcReader, FileReader

1.1. JdbcReader: read jdbc table rows into json objects

1.2. FileReader: read file content lines into json objects

2. Writer: JdbcWriter, FileWriter

2.1. JdbcWriter: write jdbc table rows from json objects

2.2. FileWriter: write file content lines from json objects

3. Parallels: Threads, Flink, RxJava

3.1. Threads: using ThreadPool to process data in parallel

3.2. Flink: using Flink to process data in parallel

3.3. RxJava: using RxJava to process data in parallel

4. Release Notes

v1.0.0

v1.0.1

v1.0.2

v1.0.3

v1.0.4

v1.0.5

About

Releases

Packages

Languages

License

Diffblue-benchmarks/iteratorx

Folders and files

Latest commit

History

Repository files navigation

IteratorX: simplest iterator for IO

1. Reader: JdbcReader, FileReader

1.1. JdbcReader: read jdbc table rows into json objects

1.2. FileReader: read file content lines into json objects

2. Writer: JdbcWriter, FileWriter

2.1. JdbcWriter: write jdbc table rows from json objects

2.2. FileWriter: write file content lines from json objects

3. Parallels: Threads, Flink, RxJava

3.1. Threads: using ThreadPool to process data in parallel

3.2. Flink: using Flink to process data in parallel

3.3. RxJava: using RxJava to process data in parallel

4. Release Notes

v1.0.0

v1.0.1

v1.0.2

v1.0.3

v1.0.4

v1.0.5

About

Resources

License

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages