Spark_MR_design_patterns

Implementation of MapReduce patterns in Spark Pyspark

Summarization pattern

Filter pattern

Data organization pattern

Join pattern

Dataset: cs stackexcange dataset

Reference: MapReduce Design Patterns, Building Effective Algorithms and Analytics for Hadoop and Other Systems By Donald Miner, Adam Shook

Name		Name	Last commit message	Last commit date
Latest commit History 6 Commits
README.md		README.md
bloomfilter.py		bloomfilter.py
min_max_count_pattern.py		min_max_count_pattern.py
sample.txt		sample.txt

Provide feedback