Work in Progress: Identify People's Names in Text
You initialize a PersonExtractor with a path to a CSV of names with each column a language. You can create a csv through Wikinames.
from person_extractor import PersonExtractor
text = "Але дістатися на роботу працівникам цих бізнесів, якщо у них немає власного автомобіля або грошей на таксі чи корпоративну розвозку, стане справжньою проблемою, прогнозує політолог Микола Давидюк."
extractor = PersonExtractor(data="names.csv")
people = extractor.extract(text)
extract returns a list of objects:
[
{
'start': 336,
'end': 343,
'text': 'Давидюк',
'spellings': {
'en': 'Davidyuk',
'uk': 'Давидюк'
}
}
]
To test the package run:
python -m unittest person_extractor.test
Post an issue at https://github.com/Mak4Lab/person-extractor/issues or email the package authors at [email protected] and [email protected]