Ce dataset regroupe 150 000 tweets scrapés grâce à l'API Twython. Ils sont labelisés selon la règle suivante :
1: Le tweet propage la fraude dans les transports français sur le réseau social (typiquement le signalement d'un controleur à un endroit)
2: Le tweet encourage à la fraude dans les transports français.
0: Le tweet est neutre concernant le sujet de la fraude.
Le séparateur du csv est le caractère "~". L'id des tweets est leur index.