Digitales Korpus

Die Grundlage der historischen Wortforschung war bisher die einzelne, vorrangig durch Fleiß und Zufall ermittelte Fundstelle. Als zusätzliche Hilfsmittel dienten die großen Wörterbücher des Deutschen. Jetzt bietet die Computertechnologie die revolutionär zu nennende Möglichkeit, elektronisch lesbare Texte jederzeit vollständig nach bestimmten Wörtern durchsuchen zu lassen, so daß die durch herkömmliche Lektüre an einzelnen Stellen gewonnenen Bedeutungen sogleich an einem elektronischen Vergleichskorpus überprüft und gewichtet werden können.

Es wurden deshalb im Rahmen des »Projekts Klassikerwortschatz« einschlägige E-Texte (elektronisch erfaßte Texte) gesichtet und gesammelt, um so eine abfragbare Datenbasis zu erhalten, die weit über das vom Wörterbuch vollständig erfaßte Textkorpus hinausgehen wird. Damit die zur Zeit elektronisch verfügbaren Texte wissenschaftlich nutzbar (d.h. vorrangig zitierbar bzw. auf gedruckte Ausgaben beziehbar) werden konnten, waren folgende Arbeitsschritte nötig: 

  1. Die philologisch begründete Bestimmung der für das Wörterbuch maßgeblichen Textversion (z. B. die Entscheidung zwischen Erstausgabe und Ausgabe letzter Hand): Hierfür wurde die Überlieferungs- und Editionsgeschichte der Korpustexte nachvollzogen und die in deren Verlauf entstandenen Textfassungen nach der philologischen Verläßlichkeit des Textes und seiner Verfügbarkeit für den heutigen Leser gewichtet.

  2. Die Auswahl einer digitalen Fassung dieser Version (E-Text) aus elektronischen Textarchiven bei gleichzeitiger Bestimmung einer entsprechenden gedruckten Referenzausgabe. Ziel war es, den philologisch "besten" Text zu bestimmen, der jedem Leser (also nicht nur dem spezialisierten Wissenschaftler) leicht zugänglich ist. Die Wahl fiel damit oft auf die Ausgaben des Verlags Philipp Reclam jun.

  3. Die Prüfung der E-Texte hinsichtlich ihrer Qualität im Vergleich mit den gedruckten Referenzausgaben, so daß diese die gleiche Textsicherheit bieten. So wurde die Rückbindung des E-Text-Archivs an die gedruckten Ausgaben gewährleistet.

  4. Aus dem gleichen Grund wurden die E-Texte mit Informationen zur Textdarbietung in der gedruckten Ausgabe (suprasegmentale Merkmale wie Seitenumbrüche, Verszählungen, Hervorhebungen, Kapiteleinteilungen usw.) in einem systemunabhängigen Format (SGML-kompatibel) ausgezeichnet. Das so erstellte digitale "Freiburger Klassikerkorpus" bildete als Textdatenbank die Arbeitsgrundlage für das eigens entwickelte lexikographische Redaktionssystem.


Ein Projekt wie das hier vorgestellte kann sich also nicht mehr allein auf das Medium Buch als Arbeits- und Verbreitungsgrundlage stützen, sondern es muß sowohl die Möglichkeiten der elektronischen Erfassung und Verarbeitung von Texten als auch die Kommunikationswege der neuen Medien (www, E-Mail) fruchtbar nutzen. Unser Ziel ist deshalb nicht allein ein Wörterbuch, sondern die Internetschnittstelle des Projektes, an der Sie sich gerade befinden, soll ein integraler Bestandteil des Forschungsunternehmens »Klassikerwortschatz« werden. Alle Inhalte, die das gedruckte »Klassikerwörterbuch« einmal enthalten wird, sollen medienspezifisch (z.B. durch eine Datenbank) aufbereitet und über das Internet abgefragt werden können.

Die vielleicht wichtigste Rolle kommt dem Internet bei der Kommunikation zwischen den Machern und den Nutzern des »Klassikerwörterbuches« zu. Nutzen Sie unser Angebot und schreiben Sie uns ihre Erwartungen und Anregungen zu unserem Projekt. Auch können Sie auf verschiedene Weise zum Gelingen des Projektes beitragen.