31
2
Der Aufbau des Systems M. A. A. T.
2. 1 M.A.A. T. als System der integrierten Texterschließung
Die Texterschließung des Systems M. A. A. T. bezieht sich in ihrem
gegenwärtig angestrebten Umfang im wesentlichen auf folgende drei
Ebenen der Sprache:
— die lexikalische;
— die morphologische;
— die syntaktische.
Zur Lage der Texterschließung auf diesen Ebenen siehe [30], 43 - 47.
Es ist möglich, andere Bereiche einzubeziehen, so etwa die Phonologie,
die Wortbildung, die Stilistik oder auch die Orthographie. Aus Gründen
der Ökonomie empfiehlt es sich indes, diese Teilbereiche — vielleicht
abgesehen von der Orthographie — mit anderen Verfahren als denen des
Systems M.A.A. T. anzugehen. Während nämlich auf der lexikalischen,
morphologischen und syntaktischen — auch auf der orthographischen —
Ebene der fortlaufende Text in ziemlich konstanter Dichte Informationen
enthält, lassen sich zum Beispiel die Elemente der Wortbildung oder die
Identität der Phoneme nur stellenweise bestimmen. Andererseits sind
die Algorithmen zur Gewinnung der Information teilweise schwer zu
formulieren. In der Stilistik liegt dies an der Vielzahl der zu berück-
sichtigenden Aspekte. In der Phonologie und Wortbildung ist der Befund
des Textes für sich genommen nur selten schlüssig; man muß daher zusätz-
lich auf andere Hilfsmittel zurückgreifen, zum Beispiel auf die Verhält-
nisse in semito-hamitischen Sprachen, in anderen Sprachstufen des
Kemischen, insbesondere des Koptischen, oder auf die sporadische Über-
lieferung in anderen Sehriftsystemen, insbesondere in Keilschrift und in
griechischer Schrift.
Aus diesen beiden Gründen empfiehlt sich in solchen Fällen die Methode
des Exzerpierens. Die Exzerpte können, wenn sie konsequent angelegt
sind, ebenfalls maschinell ausgewertet werden. Dafür hätte man dann ein
anderes Verarbeitungssystem zu entwerfen; es könnte sich jedoch zahl-
reiche schon für das System M.A.A. T. ausgearbeitete Konventionen zu
Nutze machen. Beispielsweise würde es sich lohnen, die nicht-griechischen
Wörter des Koptischen mit allen ihren dialektischen Varianten aufzunehmen
und experimentell daraus Strukturen des Altägyptischen zu rekonstruieren
(Lautverhältnisse, Formenbildung, Wortbildungstypen); man kann es sich
dadurch ersparen, für jede Spezialuntersuchung die koptischen Wörter-
bücher noch einmal zu exzerpieren. Im Falle der Phonologie und der
2
Der Aufbau des Systems M. A. A. T.
2. 1 M.A.A. T. als System der integrierten Texterschließung
Die Texterschließung des Systems M. A. A. T. bezieht sich in ihrem
gegenwärtig angestrebten Umfang im wesentlichen auf folgende drei
Ebenen der Sprache:
— die lexikalische;
— die morphologische;
— die syntaktische.
Zur Lage der Texterschließung auf diesen Ebenen siehe [30], 43 - 47.
Es ist möglich, andere Bereiche einzubeziehen, so etwa die Phonologie,
die Wortbildung, die Stilistik oder auch die Orthographie. Aus Gründen
der Ökonomie empfiehlt es sich indes, diese Teilbereiche — vielleicht
abgesehen von der Orthographie — mit anderen Verfahren als denen des
Systems M.A.A. T. anzugehen. Während nämlich auf der lexikalischen,
morphologischen und syntaktischen — auch auf der orthographischen —
Ebene der fortlaufende Text in ziemlich konstanter Dichte Informationen
enthält, lassen sich zum Beispiel die Elemente der Wortbildung oder die
Identität der Phoneme nur stellenweise bestimmen. Andererseits sind
die Algorithmen zur Gewinnung der Information teilweise schwer zu
formulieren. In der Stilistik liegt dies an der Vielzahl der zu berück-
sichtigenden Aspekte. In der Phonologie und Wortbildung ist der Befund
des Textes für sich genommen nur selten schlüssig; man muß daher zusätz-
lich auf andere Hilfsmittel zurückgreifen, zum Beispiel auf die Verhält-
nisse in semito-hamitischen Sprachen, in anderen Sprachstufen des
Kemischen, insbesondere des Koptischen, oder auf die sporadische Über-
lieferung in anderen Sehriftsystemen, insbesondere in Keilschrift und in
griechischer Schrift.
Aus diesen beiden Gründen empfiehlt sich in solchen Fällen die Methode
des Exzerpierens. Die Exzerpte können, wenn sie konsequent angelegt
sind, ebenfalls maschinell ausgewertet werden. Dafür hätte man dann ein
anderes Verarbeitungssystem zu entwerfen; es könnte sich jedoch zahl-
reiche schon für das System M.A.A. T. ausgearbeitete Konventionen zu
Nutze machen. Beispielsweise würde es sich lohnen, die nicht-griechischen
Wörter des Koptischen mit allen ihren dialektischen Varianten aufzunehmen
und experimentell daraus Strukturen des Altägyptischen zu rekonstruieren
(Lautverhältnisse, Formenbildung, Wortbildungstypen); man kann es sich
dadurch ersparen, für jede Spezialuntersuchung die koptischen Wörter-
bücher noch einmal zu exzerpieren. Im Falle der Phonologie und der