Parcours Humanités numériques

de l’Ecole normale supérieure

Programme 2018-2019

Cette formation est composée de 3 modules et d’une série d’ateliers pratiques. Validation : 12 ECTS.

Responsable pédagogique : Béatrice Joyeux-Prunel.

Les 3 modules ont lieu dans la salle de travail de la Bibliothèque des Lettres, de 10h à 17h. Inscriptions : beatrice.joyeux-prunel/@/ens.fr

Un parcours conçu par la Mission Humanités numériques de l’ENS (Béatrice Joyeux-Prunel, DHTA/IHMC ; Thierry Poibeau, LATTICE ; Emmanuelle Sordet, directrice des Bibliothèques ; Agnès Tricoche, Labex TranferS ; Richard Walter, ITEM)

Module 1
1, 2, 3 et 4 octobre 2018 

Les bases des Humanités numériques

Ce module est conçu comme une introduction aux Humanités numériques et à la collection/gestion des données de la recherche. 

1er octobre 2018  – Jour 1 : Collecter et organiser ses données

Matinée :  Introduction aux Humanités numériques (salle Dussane, accès libre)
  • 10h-10h30 : accueil et introduction générale – Béatrice Joyeux-Prunel : une petite histoire des Humanités numériques ;
  • 10h30-11h30 : conférence introductive: Anne-Marie Turcan  : Le projet  Biblissima ;
  • 11h30-12h30 : Agnès Tricoche (TransferS) et Marie-Laure Massot (CAPHÉS) : Les Humanités numériques à l’ENS. Un panorama.
Après-midi, 14h-17h : Les bases de la gestion de données numériques pour la recherche  (salle de travail de la Bibliothèque)
  • Après-midi animée par Richard Walter (ITEM), en collaboration avec des acteurs de l’ENS (Charlotte Dessaint, Agnès Tricoche, Marie-Laure Massot).
    • Les grandes étapes d’un projet numérique : objectifs, organisation et méthodologie de gestion de projets
    • Notions de base pour gérer ses données : collecte et constitution de corpus (données natives et données récupérées), numérisation, encodage, diffusion, exploitation et archivage de données ;
    • Introduction aux formats numériques (textes, images, etc.)
    • Introduction aux familles d’outils (bases de données, sites web, bibliothèques numériques, etc.)

2 octobre 2018 – Jour 2 : Traiter des données (salle de travail de la Bibliothèque)

Matinée : Dublin Core, XML et TEI.
  • Présentation avec exercices pratiques des principes de métadonnées (Dublin Core) et de l’encodage (XML et TEI), par Richard Walter et Jeremy Pedrazzi (ITEM).
Après-midi : Linguistique de corpus
  • Comment utiliser des ressources textuelles pour confirmer ses hypothèses ? avec Thierry Poibeau et Clément Plancq (LATTICE) :

3 octobre 2018  – Jour 3 : Visualiser et analyser les données (salle de travail de la Bibliothèque). De la stylométrie et du traitement automatique de la langue vers la visualisation cartographique et en réseaux.

Avec Simon Gabay et Giovanni Pietro Vitali.

La modélisation est devenue l’un des principaux enjeux des humanités numériques ces dernières années, et des chercheurs de plus en plus nombreux considèrent que le workflow (ou « chaîne de traitement ») est une étape décisive pour un projet. En d’autres termes : comment articuler les solutions numériques existantes pour résoudre un problème scientifique donné ? quels logiciels ? quels langages ? dans quel ordre ? dans quel but ?

Cette journée sera l’occasion de revenir sur ce problème, en l’utilisant comme entrée pour explorer plusieurs champs des humanités numériques : la stylométrie, l’analyse de réseaux, etc. Nous nous intéresserons donc au traitement des données, mais surtout à la question de leur visualisation à l’aide des outils utilisés par les spécialistes des humanités numériques.

Les logiciels et applications suivantes doivent donc être préalablement installés :

Programme prévisionnel:

  • 9h30 -10h30 : D’un documents TEI à TXM10h30-11h30 : Textometrie contre Stylometrie ? Introduction à Stylo
  • 11h30-12h30 : Visualisation des données de Stylo à Gephi
  • 12h30-13h30 : De Gephi à Carto
  • Déjeuner
  • 14h30-15h30 : Exercices – Textometrie & Stylometrie
  • 15h30-17h : Exercices – Gephi & Carto

4 octobre 2018, Digit-Hum, cartographie numériques

Projet en tutorat
(janvier-mai 2019)

Le parcours se poursuit par la réalisation par l’étudiant d’un projet numérique, accompagné par un ou plusieurs tuteurs de l’ENS.

Une première matinée sera consacrée au choix d’un projet de réalisation de données numériques, à choisir parmi les projets gérés par les animateurs du parcours.

Des permanences seront assurées les lundis matins par Richard Walter et Béatrice Joyeux-Prunel et un atelier collectif sera assuré un lundi par mois, dans lequel chaque étudiant viendra travailler ses données tout en participant aux discussions collectives sur des points qui auront émergé lors du travail.

Projets possibles :

  • Choisir texte ou lettre à éditer, annoter, transcrire et encoder parmi les projets EMAN (correspondances ou notes de cours)
  • Choisir un catalogue illustré à transcrire, interpréter et cartographier en lien avec la base Artl@s (www.artlas.ens.fr) – apprentissage : transcription, cartographie, gestion d’images, histoire transnationale, histoire de l’art.
  • Faire une collection nouvelle de documents : métadonnées, transcription avec choix des balises, annotation à différents niveaux, présentation de la collection de documents.

Il s’agira de produire des données en ligne; ce travail sera signé du nom de l’étudiant.

Pauses méridiennes informatiques (PaMi)

La pause méridienne informatique est un atelier d’une heure (13h-14h, 2 lundis par mois) dans lequel sera donnée une (in)formation de base sur des outils ou des pratiques numériques. 

Chaque atelier est introduit par un exposé présentant les bases, le vocabulaire, les ressources ; cet exposé est suivi de mises en pratiques techniques. L’objectif est de favoriser l’appropriation d’outils et de techniques mais également de l’édition numérique, de la gestion de projets et des outils du web, ou même de l’informatique en général. Aucune compétence informatique n’est requise a priori.

Les tutoriels, les comptes rendus et le glossaire seront disponibles sur un espace collaboratif accessible aux participants.

Programme :

Lundi 15 octobre 2018 : Hygiène numérique – Matériel et précautions, récupération de données, support de conservation…

5 novembre  2018 : Sous le capot d’un ordinateur – À la découverte de l’intérieur d’un ordinateur…

19 novembre  2018: Outils de nettoyage & Outils de récupération – Optimisation de l’ordinateur et sauvetage de fichiers

3 décembre  2018 : Le fonctionnement du web – Comment une page internet arrive sur mon écran…

17 décembre  2018 : La numérisation – Les principes de base de la numérisation, OCR, Unicode…

Les PaMi suivant sont décidés en fonction des besoins des participants.

Participation obligatoire à au moins 1 jeudi de la Bibliothèque

Séances conseillées : Zotéro et gestion bibliographique ; HAL.

Module 2
14,15 et 16 janvier 2019
Edition et exploitation des données

Ateliers pratiques

Ce module veut présenter les protocoles d’édition et d’exploitation des données, en particulier pour l’analyse et la visualisation.

Jour 1 –  14 janvier 2019 : édition numérique avec Omeka

Matinée : Présentation du logiciel Omeka

Après-midi : Atelier « Bac à sable » sur Omeka

  • Journée animée par Richard Walter (ITEM) et Anne Garcia-Fernandez (Litt&Art). Elle sera particulièrement utile pour le projet de tutorat.
    • OMEKA est un logiciel de gestion de bibliothèque numérique mis à disposition sous licence libre. Il est au croisement de différents besoins : système de gestion de contenus (CMS), gestion de collections et gestion d’archives numériques. Il est basé sur une communauté de développeurs et d’utilisateurs venant de l’informatique, des bibliothèques, des musées et des sciences humaines. Il est ainsi de plus en plus utilisé dans le monde académique et de la culture, pour la mise en ligne des corpus, des fonds documentaires ou des collections de publications de toute natue. L’objectif de la journée est de comprendre les tenants et aboutissants de ce logiciel, ses avantages et ses limites et enfin, à travers un espace « bac à sable », de savoir mettre en ligne des contenus avec OMEKA.

Jour 2  – 15 janvier 2019: Analyse statistique

Avec Léa Saint-Raymond, Collège de France / université Paris Ouest Nanterre.

  • Matinée : analyse statistique simple (avec Excel) et complexe (avec R). Introduction à l’économétrie (logiciel STATA) et à l’analyse de réseaux (logiciel Gephi).
  • Après-midi : mise en pratique de ces outils, à partir d’un jeu de données ou de celui de l’étudiant : comment visualiser, interpréter et critiquer ces interprétations.

Jour 3 – 16 janvier 2019 : visualisation spatiale

Cartographier avec QGIS – Béatrice Joyeux-Prunel (ENS)

  • QGIS est un logiciel de Système d’information géographique (SIG) gratuit, qui permet de cartographier assez simplement des données massives. La journée a pour objectif d’enseigner les bases de ce logiciel, dans une perspective historique (diachronie) et transnationale. Les étudiants seront invités à travailler sur les données de leurs propres projets, ou à partir de données moissonnables en ligne.
  • Lien de téléchargement : https://www.qgis.org/fr/site/forusers/download.html

Module 3

15-16 avril et 27 mai 2019
Savoir terminer un projet numérique

Journée 1 – 15 avril 2019 : Faire vivre ses données 

Matinée : Inscrire un projet numérique dans le temps
  • Matinée animée par Richard Walter (ITEM) et Alexis Darbon (IHMC)
    • Comment faire évoluer son projet ? Comment le diffuser ? Comment le valoriser ? Comment le pérenniser ?
    • Pour apporter des éléments de réponses à ces trois questions, il sera proposé une mise en situation des étudiants sur leur propre projet : des solutions seront élaborées et comparées à l’état de l’art de la publication numérique.
Après-midi  : Inscrire un projet dans le droit 
  • Après-midi animée par Emilie Masson (CIL, CNRS)
    • Après un exposé présentant les bases du droit d’auteur et des problématiques liées aux utilisations des données numériques, des cas concrets seront évoqués en partant des données manipulées dans le cadre du projet de tutorat.
  • Conférence : Utilisation des données de la recherche, Open access et données ouvertes, par Florence Weber (Centre Maurice Halbwachs, ENS).

Jour 2  – 16 avril 2019 : atelier collectif pour finir son projet

  • Journée animée par Béatrice Joyeux-Prunel (ENS) et Richard Walter (ITEM)
    • Cette journée est conçue comme un espace de travail concret sur les données des projets de tutorat. Chaque étudiant amène ses documents, il les travaille et les publie. Des moments seront prévus pour que chaque étudiant présente son travail à d’autres participants. En cas de difficulté, une discussion pourra s’entamer avec l’ensemble du groupe.
    • En fin de journée, l’intégration des résultats dans la structure informatique finale devra avoir été effectuée. Un rapport de stage sous forme de billet de carnet de recherche devra aussi avoir été finalisé et soumis aux responsables de la formation.

Jour 3 – 27 mai 2019 : Présentation et publication des projets

  • Conférence inaugurale : Le projet ENCRE par Alexandre Guilbaut et Irène Passeron.
  • Journée animée par Béatrice Joyeux-Prunel (ENS) & Richard Walter (ITEM)
    • Cette journée est conçue comme l’étape finale de restitution, de validation et de publication des résultats. Les formateurs et les experts sollicités durant la formation seront présents pour discuter et affiner la qualité des résultats.
  • Premier atelier : chaque étudiant présentera son projet en 15 minutes ; un retour sera fait avec les points à améliorer.
  • Deuxième atelier : séance de travail pour les correctifs éventuels. L’équipe de la formation validera les billets à publier.
  • Troisième atelier : publication des projets sur les sites de destination et des billets sur un carnet de recherche.
  • Bilan par l’équipe de formation : savoir fêter une publication !
  • L’organisation des deux dernières journées insiste volontairement sur la dimension collective des projets numériques et la nécessaire mutualisation des compétences et des résultats.