12Dec 2019-13Dec 2019
09:30 - 17:30

Université de Bâle (UNIBAS)

Events

Distant Reading – Tools and Methods

Distant Reading, ein Verfahren, das durch die Digitalisierung in den Geisteswissenschaften entstanden ist, hat sich als einer der produktivsten Ansätze für literarische Texte erwiesen. Karten, Grafiken und Bäume, so Moretti (2005) in seinem Buch „Graphs, Maps, Trees: Abstract Models for a Literary History“ ermöglichen die innovative Relektüre berühmter Werke ebenso die Beschäftigung mit in Vergessenheit geratenen Texten. Neue Muster werden sichtbar, Hypothesen können erstmals systematisch auf grösseren Korpora überprüft werden. Jedoch wird beim Distant Reading oftmals die wichtige Ebene der ursprünglichen Datenerfassung vernachlässigt: Woher kommen die Daten? Wie werden sie gewonnen? Welche Implikationen haben hier bestimmte Entscheidungen?


Présentation

La lecture distante (distant reading), portée par le développement du numérique dans les sciences humaines, s’est imposée comme une des approches les plus prolifiques des textes littéraires. Les cartes, les graphiques et les arbres, pour reprendre les mots de Moretti, nous permettent en effet de relire les œuvres les plus célèbres d’une manière inédite, ou de nous pencher sur des textes jusqu’alors oubliés. Ces études nouvelles ne reviennent cependant que trop peu sur l’acquisition des données à observer : d’où viennent-elles ? Comment sont-elles construites ?
La présente école se propose de revenir sur l’étape cruciale de l’acquisition des données, en détaillant leur chaîne de production. Nous commencerons par l’OCR (optical character recognition, reconnaissance optique de caractère), qui permet de transformer un jeu d’image en un texte exploitable, puis l’encodage en XML-TEI, qui transforme le texte en base de données exploitable, et enfin l’analyse avec R, qui permet d’exploiter et de visualiser les données produites.


Fortement tournée vers la pratique, cette école voudrait jeter les bases d’un premier corpus suisse multilingue (français, italien et allemand). Sa construction au cours de l’école sera l’occasion de discuter de ces enjeux.
Ce cours s’inscrit dans le cadre d’un travail collectif mené au sein du projet européen COST Distant reading  pour lequel les deux organisateurs et l'organisatrice sont les représentants suisses.

Programme

Jour 1
9h30-10h
Accueil des participants
10h-10h30
Introduction à la lecture distante
10h30-11h
Introduction à l’OCR
11h-12h30
TP : entraîner et utiliser un OCR
12h30-14h
Repas
14h-15h30
Introduction à la construction de corpus : balancement du corpus + TP
16h-17h30
Introduction à la construction de corpus : encoder son corpus + TP
18h-19h
Keynote (?), C. Oldbrecht (Berlin), Les Défis du multilinguisme en littérature

Jour 2
9h00-12h30
Encodage de corpus (avancé) + TP
12h30-14h
Repas
14h-16h00
Encodage de corpus + TP
16h30-17h30
Analyse des résultats


InscriptionLes doctorant-e-s des universités de Bâle, Berne, Fribourg, Genève, Neuchâtel et Lausanne ainsi que de l'EPFL peuvent s'inscrire à ce cours. Les chercheurs et chercheuses post-doc peuvent faire une demande.

L'inscription se fait par envoi d'un email à yannick.rochat@unil.ch et à alexandre.camus@unil.ch.

La participation à cet événement est gratuite pour les doctorant-e-s. Les éventuels frais de déplacement et d'hébergement sont pris en charge par le programme doctoral.

Informations pratiques Intitulé du cours Distant Reading – Tools and Methods Enseignants Simon Gabay, Berenike Herrmann, Simone Rebora

Date 12 et 13 décembre 2019
Lieu Université de Bâle (UNIBAS)
Horaire 9h-17h30


Export event as iCal