Hackathon CORIA-TALN 2018 - Fake ou pas Fake ? - 14 et 15 mai 2018

Fake ou pas Fake ?
Hackathon CORIA-TALN 2018

(hackathon en recherche d’information et traitement automatique des langues)

TL;DR

Tâches : détection et visualisation de fausses informations sur les réseaux
Site web : http://hackatal.github.io/2018
Dates : 14 et 15 mai 2018
Lieu : IRISA, Rennes
Inscription (gratuite mais obligatoire) : https://goo.gl/forms/soTeFTikjWol8bj13 !

Description

Dans le cadre de la conférence CORIA-TALN-RJC 2018 est organisé un hackathon, 3ème édition côté CORIA (Hack Days) et TALN (HackaTAL). L’évènement porte sur des problématiques en RI et en TAL. L’objectif est de réunir les communautés scientifiques, et au delà, autour de défis à relever, pour modéliser, prototyper, coder, expérimenter, développer, tester, évaluer, échanger, etc. - par équipes, dans une ambiance décontractée :) !

Les tâches proposées portent cette année sur la détection et le traitement d’informations manifestement fausses, un sujet de préoccupation pour les médias et citoyens. Ces problématiques, nouvelles pour la société de l’information, soulèvent de nombreuses questions et nous essaierons de voir si des traitements RI et TAL peuvent y répondre, pour mieux comprendre les phénomènes en jeu et y réagir, plus rapidement et de manière plus adéquate, à l’aide d’algorithmes du domaine.

L’événement est ouvert à tous (informaticiens, linguistes, journalistes), ne nécessite aucune préparation particulière et ne requiert pas de compétences spécifiques aux tâches que nous proposons... tout le monde est bienvenu !

Tâches

1. Détection : repérer et catégoriser les fausses informations

Objectifs

Parmi les informations disponibles en ligne certaines sont manifestement fausses et il n’est pas évident de faire la part des choses, autant pour les médias, entreprises ou laboratoires (notamment à cause des volumes de données à traiter), que pour les citoyens : quels indices caractérisent les fausses informations ? L’objectif de cette tâche est de voir si des algorithmes TAL et RI sont capables de détecter et catégoriser finement ces fausses informations.

Sous-tâches

- parmi un ensemble de textes, déterminer automatiquement lesquels sont des faux (contrefactuels, détournés, trompeurs, parodiques),
- catégoriser les fausses informations parmi un ensemble de catégories prédéfinies (sites propagandistes, conspirationnistes, pseudo-science, satires),
- caractériser les faux d’un point de vue linguistique : quels modes d’expression, quelles tournures sont utilisées pour propager de fausses informations.

2. Visualisation : agrégation des fausses nouvelles pour une vision synthétique

Objectifs

Le traitement des fausses nouvelles soulève d’autres questions lorsque l’on tient compte des liens (informationnels, thématiques, linguistiques) entre ces dernières, ou au sein des médias et des réseaux sociaux. Certaines reprennent des fausses nouvelles déjà connues, les complètent ou les modifient. Il est aussi intéressant d’étudier les mécanismes de leur propagation sur des réseaux (statiques) ou sur les relations temporelles (dynamiques).

Sous-tâches

- regrouper les fausses nouvelles de manière non-supervisée ou peu supervisée,
- déterminer la structure d’un réseau de fausses nouvelles, pour identifier des liens orientés selon l’axe temporel et l’axe thématique,
- détecter des communautés (sites ou individus) qui propagent des fausses nouvelles.

Planning prévisionnel

Lundi 14 mai :
- 13h-14h : accueil et café
- 14h-15h : présentation du hackathon
- 15h-18h : développements en équipes
- 18h-19h : présentations invitées
- 19h-20h : cocktail dinatoire
- 20h-... : développements en équipes

Mardi 15 mai :
- 09h-10h : accueil et café
- 10h-12h : développements en équipes
- 12h-14h : déjeuner et café
- 14h-17h : développements en équipes
- 17h-19h : présentation des résultats
- 19h-21h : conclusion et cocktail

Organisation pratique

BYOD (amenez votre ordinateur)
Pas de critères pour participer, le hackathon est ouvert à tous !
Aucune préparation requise des participants en amont de l’évènement
Logiciels et données en ligne : https://github.com/HackaTAL/2018

Organisateurs
Kevin Deturck (Viseo / ERTIM)
Nicolas Dugué (LIUM)
Loïc Grobol (LaTTiCe)
Gael Guibon (LSIS, Caléa)
Charles Huyghues-Despointes (Bertin)
Damien Nouvel (ERTIM)
Benjamin Piwowarski (LIP6)
Ramon Ruti (Storyzi)
Raphaël Troncy (Eurecom)
Julien Velcin (ERIC)