|         |         |         |    

Methodik

Die auf der Plattform ›Welscher Gast digital‹ angewandte Methodik lässt sich in vier Bereiche aufteilen: Digitalisate, philologische Textarbeit, Bildannotation und Analytik. Wesentlich ist dabei die aufeinander abgestimmte Entwicklung und die Verknüpfung dieser Bereiche.
Vgl. auch Methoden und Ziele des ›Thomasin-Projekts‹.

Digitalisate

Virtuelle Bibliothek

Im Rahmen des Projekts wird eine virtuelle Bibliothek digitaler Bilder zu allen erhaltenen Handschriften des ›Welschen Gastes‹ aufgebaut. Dank der Kooperation zahlreicher Partnerinstitutionen werden hochwertige Digitalisate barrierefrei online gestellt. Es ist unsere Überzeugung, dass die Ergebnisse eines öffentlich finanzierten Forschungs- und Editionsprojekts für die wissenschaftliche und breitere Öffentlichkeit ohne unnötige Hürden zugänglich sein sollten. Deshalb sind wir bemüht, im Einklang mit den Nutzungsbedingungen unserer Projektpartner die Digitalisate in einer Form anzubieten, die durch hinreichende Bildauflösung ein bequemes Arbeiten mit den veröffentlichten Materialien erlaubt und die das Herunterladen und Ausdrucken der Bilder für Studien- und Forschungszwecke ermöglicht. Jede Handschriftenseite ist zu Zitations- und Verlinkungszwecken mit permanenten Zitierlinks versehen.

Zusatzmodule

Bereits jetzt bietet der Handschriftenviewer darüber hinaus die Verknüpfung einer Bildseite mit einer dazugehörigen Transkription sowie die Einbettung der ggf. in der Heidelberger Bilddatenbank heidICON verfügbaren Bildbeschreibungen und ergänzenden Bildmaterials. Um dem Benutzer den Zugang zur Materialität der historischen texttragenden Artefakte zu erleichtern, ist die Entwicklung mehrerer Erweiterungsmodule für den Handschriftenviewer vorgesehen: Zum Einen soll durch die Integration eines sich flexibel verändernden Maßstabs die reale Größe der digitalisierten Objekte unmittelbar sichtbar gemacht werden, zum Anderen sollen die in der TEI-Kodierung der Handschriften festgehaltenen Lagenstrukturen der Codizes visualisiert werden. Außerdem werden Bildannotationen (graphische Auszeichnungen von Layoutelementen und Illustrationen) direkt im Handschriftenviewer zugänglich gemacht.

Philologische Textarbeit

Transkriptionen

Am Anfang der Plattform ›Welscher Gast digital‹ stand das Vorhaben einer neuen Textausgabe, die auch dem für den ›Welschen Gast‹ wesentlichen Illustrationszyklus gerecht würde. Früh wurde beschlossen, die notwendige Kollationsarbeit (Textvergleiche zwischen verschiedenen Handschriften als Grundlage für die Textherstellung) auf Volltranskriptionen aller Handschriften zu gründen, um ›ein für alle Mal‹ die tatsächlich überlieferten Texte zu dokumentieren und den neu zu erstellenden edierten Text umfassend überprüfbar zu machen. Diese Transkriptionen werden bereits vor der Veröffentlichung des kritischen hergestellten neuen Textes nach und nach in Verbindung mit den Digitalisaten veröffentlicht.

Bei der Transkription werden in Abhängigkeit von der Schrift der jeweiligen Handschrift unterschiedliche Buchstabenformen unterschieden (z.B. rundes und gerades d, i mit oder ohne Punkt), graphische Hervorhebungen notiert (u.a. Initialen und Rubrizierungen), Abkürzungen in ursprünglicher und aufgelöster Schreibweise vermerkt sowie Lücken und Beschädigungen beschrieben. Des weiteren gilt ein besonderes Augenmerk der Kodierung von Änderungen, insbesondere Selbstkorrekturen der Schreiber wie Einfügungen, Tilgungen, Ersatz und Umstellungen. Diese erlauben manchmal Rückschlüsse auf die Beschaffenheit einer verlorenen Vorlage, geben aber auch Einblick in die Praxis des Abschreibens und in deren prozessualen Charakter.

Text Encoding Initiative

Technisch erfolgt die Transkriptions- und Editionsarbeit im XML-Format nach den Richtlinien der Text Encoding Initiative (TEI). Für die konkrete Ausgestaltung der Kodierung wurden projektspezifische Vorgaben festgelegt, die kontinuierlich weiterentwickelt werden. Die aktuelle Version unseres TEI-Handbuchs kann hier im PDF-Format heruntergeladen werden:
Welscher Gast digital: TEI-Handbuch (Version 0.6)

Philologische Erschließung

Die transkribierten Texte werden unter philologischer Aufsicht tokenisiert (in wortäquivalente Segmente und Interpunktionszeichen aufgespalten). Anschließend erfolgt eine Lemmatisierung (Zuordnung zu Grundformen) entsprechend der Lemmaliste des neuen Mittelhochdeutschen Wörterbuchs. Dank dieser Referenzierung und einer Konkordanz mit den älteren mittelhochdeutschen Wörterbüchern wird eine Verknüpfung der Wortformen unserer Edition zum Trierer Wörterbuchnetz möglich. Für die eigentliche Lemmatisierungsarbeit wurde ein spezielles webbasiertes Tool entwickelt (Programmierung: Frank Grieshaber, Teilprojekt INF des Sonderforschungsbereichs 933 ›Materiale Textkulturen‹), das den Philologen durch die Wortformen navigiert, die Suche in der Lemmaliste übernimmt, Einträge in den Wörterbüchern anzeigt, einmal lemmatisierte Formen künftig erkennt und die Lemma-Referenzen automatisch zu den Wortformen in den basalen XML-Dateien einträgt. Die Lemmatisierung geht vom Text der Rückert-Ausgabe aus, da deren normalisierte Wortformen am ehesten den Wörterbuch-Lemmata entsprechen. Bei festgestellter Äquivalenz werden die Lemma-Angaben anschließend in die handschriftlichen Texte übertragen. Eine Verlinkung des Volltextes mit digitalen Wörterbüchern wird demnächst für die Rückert-Ausgabe realisiert.

Bildschirmfoto aus der Arbeit mit dem Lemmatisierungstool. Die im unteren Bereich eingeblendete Webseite stammt aus dem Trierer ›Wörterbuchnetz‹. Bildschirmfoto aus der Arbeit mit dem Lemmatisierungstool. Die im unteren Bereich eingeblendete Webseite stammt aus dem Trierer ›Wörterbuchnetz‹.

Reime

Zu den klassischen philologischen Aufgaben im Vorfeld einer Textausgabe mittelhochdeutscher Dichtung gehört die Erstellung eines Reimwörterbuchs. Wir markieren Reime direkt im kodierten Text, womit nicht nur deren visuelle Hervorhebung in der digitalen Edition möglich wird, sondern auch für analytische Abfragen und statistische Untersuchungen der Weg geebnet wird. Für die Reimmarkierung im Rückert-Text wurde ein Algorithmus entwickelt, der nur noch geringfügiger philologischer Korrektur bedurfte. Die Annotation der Reime in den Handschriftentranskriptionen erfolgt hingegen wegen der beträchtlichen Schreibvarianz, die die automatisierte Erkennung von Silben erschwert, manuell.

Visualisierung

Für die Visualisierung der Transkriptionen in Verbindung mit Digitalisaten wird eine Reihe von Darstellungsoptionen entwickelt. Aktuell sind folgende Einstellungen möglich: Anzeige von Vers- oder Zeilennummerierung, unterschiedliche Behandlung von Abkürzungen, Differenzierung oder Vereinheitlichung von Buchstabenformen, flexible Darstellung von Schreiberänderungen, wahlweise Einblendung der Originalinterpunktion, optionale Anzeige editorischer Eingriffe. Außerdem sind eine unterschiedliche Darstellung von Textspalten sowie die Hervorhebung von Reimen (wo bereits markiert) und die Absetzung von Verspaaren möglich. Bei diverse Elementen erscheint beim Anklicken ein Infofenster mit weiteren Angaben, etwa die Zeilenhöhe bei Initialen. Beim Vorhandensein von Illustrationen wird dies durch Balken am Textrand angezeigt, die mit Links zur Detailanzeige der Illustrationen versehen sind. Alternativ zur graphisch formatierten Darstellung hat der Benutzer die Möglichkeit, sich den TEI-Code (jeweils pro Seite) anzeigen zu lassen. Geplant ist die Bereitstellung von TEI- und PDF-Dateien zum Download, auch für ganze Handschriften und für synoptische Ansichten. Die aktuellen projektspezifischen Richtlinien für die Visualisierung der Transkriptionen können hier im PDF-Format heruntergeladen werden:
Welscher Gast digital: TEI-Visualisierung (Version 0.4)

Textherstellung

Der neue kritisch hergestellte Editionstext wird auf der ältesten Handschrift A (Cod. Pal. germ. 389) basieren. Sowohl bestimmte Indizien in dieser Handschrift als auch die Parallelüberlieferung im Grimm-Fragment und im Gothaer Codex Memb. I 120 weisen darauf hin, dass sich Thomasin einer Sprachform bediente, die dem sog. normalisierten Mittelhochdeutsch relativ nahe steht. So spricht etwa Vieles dafür, dass das lange mittelhochdeutsche î für Thomasin noch nicht zu ei diphthongiert war (vgl. mhd. zît, nhd. Zeit). Solchen Befunden entsprechend wird die Sprache der Leithandschrift dem normalisierten Mittelhochdeutsch behutsam angenähert, mit disambiguierten Vokallängen versehen und um eine moderne Interpunktion ergänzt. Durch die durchgängige Verlinkung mit Handschriftentranskriptionen (angestrebt ist eine Synchronisierung auf Wortebene) wird dem Benutzer stets ein unkomplizierter Vergleich mit der historischen Überlieferung geboten, auch in Form von dynamischen Variantenapparaten, bei denen jeweilige Entsprechungen in (anderen) Handschriften direkt am mutmaßlichen Stemma angezeigt werden.

Der neue Lesetext wird dauerhaft im Open Access digital zugänglich gemacht und voraussichtlich auch in Buchform veröffentlicht. Ein Textstellenkommentar ist für eine spätere Projektphase angedacht.

Bildannotation

Bildzyklus

Der über 120 Bildmotive umfassende und in 15 Handschriften (teilweise fragmentarisch) erhaltene Bildzyklus ist ein untrennbarer Bestandteil des ›Welschen Gastes‹. Während in früheren Forschungspublikationen und Ausgaben dieser Bildzyklus (wenn überhaupt) jeweils nur zu einem kleinen Teil direkt veröffentlicht und sonst nur beschreibend zugänglich gemacht wurde, ist die frei verfügbare Internetpublikation aller Bilder eines der Ziele des vorliegenden Projekts.

Systematisierung

Um dem Benutzer eine langwierige Suche einander zugehöriger Bildmotive in verschiedenen Handschriften zu ersparen, haben wir in den Digitalisaten die Illustrationen über ein Koordinatensystem markiert und sie jeweils abstrakt gedachten übergeordneten ›Motiven‹ zugeordnet. So können für ein beliebiges Motiv die zugehörigen konkreten Darstellungen aus allen einschlägigen Handschriftendigitalisaten als Bildausschnitte zusammengestellt werden.

Auch wenn der Bildzyklus des ›Welschen Gastes‹ im Laufe der Überlieferung in seinen wesentlichen Zügen erstaunlich konstant bleibt, gibt es dennoch eine beträchtliche Varianz im Detail. Bereits Friedrich Wilhelm von Kries hat in seiner Ausgabe jedes Bildmotiv für Vergleichszwecke in seine Bestandteile, insbesondere Figuren und Texte, zerlegt. Diesem Prinzip folgend, legen wir nach einer eingehenden Untersuchung aller Illustrationen für jedes übergeordnete Bildmotiv abstrakt gedachte ›Komponenten‹ an, denen wiederum über Koordinaten markierte konkrete Bestandteile einzelner Illustrationen zugeordnet werden können. In den Übersichten einzelner Motivdarstellungen können somit einander zugehörige Bildelemente gemeinsam hervorgehoben und leicht miteinander verglichen werden. Eine hohe Priorität kommt auch der Erschließung der in den Illustrationen enthaltenen Texte (Beischriften, Spruchbänder, Inschriften) zu. Deren Transkriptionen werden in der zugrundeliegenden Datenbank mit ihren Positionen in den Digitalisaten verknüpft und können beim Anklicken der entsprechenden Form im Digitalisat angezeigt werden.

Graphische Annotation

Für die Erfassung der Illustrationen wurde vom Teilprojekt INF des Sonderforschungsbereichs 933 ›Materiale Textkulturen‹ auf Basis der offenen JavaScript-Bibliothek OpenLayers ein graphischer Formeneditor entwickelt, der die graphische Markierung von beliebigen Polygonen in den Digitalisaten ermöglicht und den Bearbeiter bei der Zuordnung und Beschreibung markierter Bildformen durch maßgeschneiderte Eingabemasken in einem effizienten Workflow unterstützt. Wir nutzen diesen Formeneditor außerdem für die Erfassung von Layoutelementen, deren Daten für analytische Zwecke fruchtbar gemacht und später auch für die graphische Verknüpfung zwischen Digitalisat und Texttranskription eingesetzt werden sollen.

Akteure

Zwecks der Systematisierung der in den Bildern vorkommenden Figuren und um deren komplexe Interaktionen sichtbar zu machen, ordnen wir konkrete Bildfiguren abstrakt gedachten Personen zu, die wir als ›Akteure‹ bezeichnen (z.B. für einzelne dargestellte Personifikationen oder Berufe). Dadurch können – ähnlich wie bei Motiven – wiederum Übersichten von zugehörigen Bildausschnitten für jeden beliebigen Akteur erstellt und konkrete Darstellungen abstrakt gedachter Figuren vergleichend angezeigt werden. Geplant ist eine Anbindung dieser projektspezifischen Systematik an kontrollierte Vokabulare (GND) und eine Erweiterung der Erfassung um dinghafte Bildobjekte und Gesten. Dank der kunsthistorischen Komponente des ›Thomasin-Projekts‹ soll in der zweiten Projektphase (ab 2015) der Bildzyklus eingehend untersucht und damit Vorarbeiten für einen umfassenden kunsthistorischen Kommentar geleistet werden.

Bildschirmfoto aus der Arbeit mit dem Formeneditor.Bildschirmfoto aus der Arbeit mit dem Formeneditor.

Analytik

Schreibanalysen

Die Bemühung um größtmögliche Vorlagentreue bei der Transkription (besonders durch die Differenzierung unterschiedlicher Buchstabenformen) ist nicht nur unserem Respekt gegenüber den historischen Artefakten geschuldet, sondern dient auch editionsbegleitenden Untersuchungen zu mittelalterlicher Schreibpraxis. Dank der im Laufe der Editionsarbeit entstehenden und immer umfangreicher werdenden Datenbasis werden aussagekräftige Statistiken möglich. Durch N-Gramm-Abfragen können beispielsweise Schreibertendenzen bei der Verwendung bestimmter Buchstabenkombinationen ermittelt werden. Da die mittelalterlichen Handschriften des ›Welschen Gastes‹ einen Zeitraum von etwa zweieinhalb Jahrhunderten abdecken, sind diachrone Vergleiche machbar, die vom Hochmittelalter bis an die Zeit der Buchdruckerfindung heranreichen und deshalb auch für die Frühdruckforschung fruchtbar gemacht werden könnten. Dank der geplanten Lemmatisierung handschriftlicher Texte können statistische Abfragen zu Schreibtendenzen künftig auch lemmaorientiert durchgeführt werden. Dieser materialitätsphilologische Ansatz der Semantisierung des Geschriebenen gehört zum Forschungsprogramm des Sonderforschungsbereichs 933 ›Materiale Textkulturen‹.

Layoutanalysen

In einem ähnlichen Forschungskontext steht auch die editorische Erschließung des Handschriftenlayouts. Im selben Formeneditor, den wir für die Annotation von Illustrationen verwenden, haben wir Eingabemasken für die Kategorisierung von Layoutelementen eingebaut (z.B. Textspalte, Initiale, Marginalie, Seitenüberschrift etc.) und markieren diese Elemente während der Transkription. So können bereits jetzt z.B. Größenrelationen einzelner Kategorien von Layoutelementen zueinander berechnet werden, je nach Forschungsinteresse etwa für eine Einzelseite, für eine ganze Handschrift oder im Vergleich mehrerer Handschriften miteinander. Eine Visualisierung solcher Analysen als Ergänzungsmodul zum Handschriftenviewer ist geplant.

Phylogenetische Stemmatologie

Die in der Editionswissenschaft durch die sog. ›New Philology‹ eingeleitete Hinwendung zum texttragenden Artefakt und dessen Einzigartigkeit wird in letzter Zeit in einigen Projekten von einer erneuten Beschäftigung mit der Erforschung von Verwandtschaftsverhältnissen zwischen Handschriften flankiert, wobei computergestützte Methoden aus der Biogenetik angewandt werden (›New Phylogeny‹). Es wurde erwiesen, dass beim Abschreiben von Texten ähnliche Varianzphänomene vorkommen wie bei der Fortpflanzung von lebenden Organismen und dass die philologische Stemmatologie von der biologischen Vererbungslehre methodisch profitieren kann (aber auch umgekehrt). Der ›Welsche Gast‹ eignet sich hervorragend als Modellfall für die Integration phylogenetischer Methodik in die praktische Editionsarbeit. Das ›Thomasin-Projekt‹ hat für ausgewählte Textpassagen aufgrund vollständiger Transkriptionen sämtlicher Handschriften und einer manuellen Varianzbewertung phylogentische Sonden durchgeführt, deren Ergebnisse durchaus mit den in der früheren Forschung vorgeschlagenen Stemmata vergleichbar sind, mit einem entscheidenenden Vorteil: Durch die transparente Datenbasis und die statistische Untersuchungsmethode können für mutmaßliche Überlieferungsverzweigungen Wahrscheinlichkeitswerte ermittelt werden, die den Philologen bei der Varianzbewertung zwecks Text- und Apparatherstellung objektiv unterstützen. Es ist geplant, phylogenetisch ermittelte Stemmata in Form eines dynamischen Variantenapparats als Zusatzmodul für die Textausgabe zu entwickeln. Außerdem soll die so erprobte Methodik auch auf die Analyse der Illustrationen angewandt werden, indem anhand der Varianz von Bildelementen Überlieferungskonstellationen des Bildbestands erforscht und visualisiert werden.

 

 

Nutzungsbedingungen | Partner | Impressum / Datenschutz | IT & Design

 

Logo

Sonderforschungsbereich 933 – Materielle TextkulturenUniversitätsbibliothek HeidelbergUniversität Heidelberg