mercredi 4 juillet 2012

SRSR : prototype d’identification de sources sur les médias sociaux

A lire sur:  http://www.demainlaveille.fr/2012/07/03/srsr-prototype-didentification-de-sources-sur-les-medias-sociaux/?utm_source=feedburner&utm_medium=email&utm_campaign=Feed%3A+DemainLaVeille+%28Demain+la+veille%29

 
Trouver la ou les sources fiables lors d’évènements à grande envergure sur les médias sociaux constitue un vrai défi pour les professionnels des médias ou encore de la veille. Surtout avec les contraintes de temps qui sont de plus en plus importantes. Partant de ce constat, des chercheurs se sont penché sur le problème et développé un prototype d’une application au nom de code SRSR : Seriously Rapid Source Review.
Développer des filtres intelligents, intégrer de l’apprentissage automatique, assurer une couverture et une capacité de collecte de haut niveau présentent de véritables challenges pour l’équipe. Développé conjointement avec plusieurs journalistes, SRSR proposera des fonctionnalités clefs comme la qualification des sources (au sens de producteur de l’information première) à partir de leur localisation géographique, leur réseau de contacts, exclure les caisses de résonance générées par les RT (retweet), identifier les témoignages clefs à partir d’une base sémantique dédiée (quelques 700 termes liés à la perception, au sentiment, à la vision, etc…).

Mais la fonctionnalité clef qui permet à l’outil de se démarquer de la concurrence, c’est le classement à la volée et le profiling des sources : journalistes, blogueurs, personnes ordinaires, etc. Pour l’instant, le prototype est testé sur des corpus de données pré-collectées, et non sur des flux récupérés en temps réel.
L’interface certes basique, évoluera certainement dans les prochains mois, et surtout l’éprouver pour différents types d’évènements : politiques, commerciaux, sportifs, etc.

Aucun commentaire:

Enregistrer un commentaire