/ Doktorat

INFO: Launch von CATMA 6 - Open Source Web-Applikation

"major release" einer frei nutzbaren Open Source Web-Applikation für Textannotation und -Analyse

Wir freuen uns den Launch von CATMA 6 bekanntzugeben - einem "major release" unserer frei nutzbaren Open Source Web-Applikation für Textannotation und -Analyse. Mehr Informationen zum Release finden Sie unter https://catma.de

 

CATMA  wird aktuell weltweilt von über 12.000 Forschern und in über 100 Forschungsprojekten genutzt; Gegenstand sind dabei Texte und Korpora in vielen verschiedenen Sprachen (einschließlich rechts-links geschriebener). Die Entwicklung und Bereitstellung von CATMA wurde dabei seit 2008 von diversen Institutionen und Sponsoren im Rahmen von Projektförderungen unterstützt, darunter DFG, BMBF, Google Inc., Alexander-von-Humboldt Stiftung und die Universität Hamburg.

CATMA 6 besitzt neben einem komplett neu gestalteten User Interface (basierend auf dem 'Material Design'-Theme von Google) eine Reihe von Merkmalen, die es konzeptionell von allen anderen Annotationstools unterscheiden:

  1. 'Undogmatisches' Annotations-Konzept: CATMA unterstützt sowohl deklarative (Taxonomie-getriebene) wie explorative, "bottom up" verfahrende hermeneutische Annotationspraktiken.  CATMA verwendet dazu sog. external stand-off markup. Damit können strukturierte wie unstrukturierte Annotationsverfahren, überlappende und diskontinuierliche Textstrukturen, Meta-Annotationen und qualitative ‘fuzzy’ Attributionen sowie eine unbegrenzte Tiefe an Annotationsvarianten verarbeitet werden.  
  2. Kollaborations-Funktion: die Arbeit in CATMA 6 ist grundsätzlich projektzentriert. Damit kann die Arbeit an Texten, Korpora, Annotationen und Annotationschemata auf einfache Weise auch kollaborativ in Teams organisiert werden.
  3. Hermeneutisches Workflow-Modell: in CATMA sind Annotation, Analyse und Visualisierung als funktionale Module nahtlos integriert. Dies ermöglicht es, die explorativen und oftmals iterativen bzw. zyklischen Verfahrensmodi der traditionellen geisteswissenschaftlichen Forschung zu emulieren und zu unterstützen.
  4. Technologie: die neue CATMA 6 Backend-Systemarchitektur verknüpft eine Graphdatenbank zur Verarbeitung von Texten und den ihnen zugeordneten, in JSON codierten Standoff-Annotationen mit einer Gitlab-Instanz, die das Versions-Management und die Nutzerverwaltung übernimmt. Unsere beiden CATMA-Server werden im Rechenzentrum der Universität Hamburg gehostet; Bereitstellung und Nutzung des Systems erfolgen im Einklang mit europäischen Datenschutzbestimmungen. 

Die Entwicklung von CATMA (Computer Assisted Text Markup and Analysis) begann 2008 mit dem Ziel, das bereits in den 1980er Jahren von Ian Lancashire und John Bradley entwickelte Desktoptool TACT (Textual Analysis Computing Tools) zu reimplementieren. Elf Jahre später mag die Funktionalität der Webapplikation CATMA 6 die des berühmten Vorläufers zwar um ein Vielfaches überschreiten - unsere intellektuelle Motivation ist indes unverändert geblieben. Denn nach wie vor gilt, dass "text markup is currently the best tool at our disposal for ensuring that the hermeneutic circle continues to turn (...)", wie Lou Burnard 1998 in seinem Artikel "On the hermeneutic implications of text encoding" formuliert hat (siehe http://users.ox.ac.uk/~lou/wip/herman.htm).