oneproxy-spark-rdd

A Spark JDBC RDD for OneProxy to Share the Data Distribution Information. OneProxy can shard data into multiple MySQL instances, so Spark can connect to OneProxy as a distributed data source, just like Hadoop/HBase

In OneProxy (version 5.8.6 or later) we can run "EXPLAIN2 sql" to get the data partitions involved from OneProxy, and then build the Spark RDD partitions relatively for faster parallize process.

For xample

mysql> explain2 select * from my_range where id = 100;
+----------------------------------------------------+
| SQLLIST                                            |
+----------------------------------------------------+
| select * from my_range_0_a my_range where id = 100 |
| select * from my_range_0_b my_range where id = 100 |
| select * from my_range_0_c my_range where id = 100 |
| select * from my_range_0_d my_range where id = 100 |
+----------------------------------------------------+
4 rows in set (0.00 sec)

mysql> explain2 select * from my_range where col2 = 100;
+------------------------------------------------------+
| SQLLIST                                              |
+------------------------------------------------------+
| select * from my_range_0_a my_range where col2 = 100 |
| select * from my_range_1_a my_range where col2 = 100 |
| select * from my_range_2_a my_range where col2 = 100 |
| select * from my_range_3_a my_range where col2 = 100 |
+------------------------------------------------------+
4 rows in set (0.00 sec)

The uploaded file is not verified now, it's just a craft version

#contact [email protected]

Name		Name	Last commit message	Last commit date
Latest commit History 8 Commits
ONEPROXYOptions.scala		ONEPROXYOptions.scala
ONEPROXYRDD.scala		ONEPROXYRDD.scala
ONEPROXYRelation.scala		ONEPROXYRelation.scala
OneProxyRDD.scala		OneProxyRDD.scala
OneProxyRelationProvider.scala		OneProxyRelationProvider.scala
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

oneproxy-spark-rdd

About

Releases

Packages

Languages

onexsoft/oneproxy-spark-rdd

Folders and files

Latest commit

History

Repository files navigation

oneproxy-spark-rdd

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages