Website Parser

This code is written for parsing the search results page of a website, https://index.hu/ (a Hungarian news portal). It can separate URLs related to a search keyword, and can extract relevant information, such as author name, title, content and publishing date.

An ElasticSearch connector is also included, using high-level client.

Kibana example figures:

Name		Name	Last commit message	Last commit date
Latest commit History 11 Commits
articles		articles
src		src
.gitignore		.gitignore
README.md		README.md
build.gradle		build.gradle
settings.gradle		settings.gradle

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Website Parser

About

Releases

Packages

Languages

szabinah90/Website-parser

Folders and files

Latest commit

History

Repository files navigation

Website Parser

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages