La description des données est accessible dans la section « Données » de l’appel à participation. Pour plus d’information, consultez également la FAQ ou adressez votre question à deft2016@univ-nantes.fr.
Corpus d’entraînement et de développement (train et dev)
L’ensemble des notices d’entraînement et de développement, ainsi que leurs thesaurii, sont téléchargeables au lien suivant :
deft2016-notices-thesaurii-train-dev.zip
Corpus d’évaluation (notices-test) et références (references-test)
L’ensemble des notices de test, sans les références (mots-clés à trouver), sont téléchargeables au lien suivant :
L’ensemble des références (mots-clés à trouver) des notices de test sont téléchargeables au lien :
Script d’évaluation
Nous mettons également à disposition le script que nous utilisons pour l’évaluation des méthodes soumises à DEFT2016. Ce script necessite nltk pour le stemmer en français.
Ces ressources (notices et thesaurii) sont la propriété de l’INIST-CNRS et sont diffusées avec la licence CC-by 4.0.