Mitteleuropäische Kulturtradition: Möglichkeiten ihrer digitalen Erschließung im Internet

HDHS (Heidelberger Hypertext-Server)

1. Allgemeine Angaben

Antrag auf Gewährung einer Sachbeihilfe
Neuantrag
 

1.1 Antragsteller

Hauptantragsteller: Dr. Heino Speer
Forschungsstellenleiter Deutsches Rechtswörterbuch 
Forschungsstelle der Heidelberger Akademie der Wissenschaften 
Karlstr. 4 
D-69117 Heidelberg 
Tel.: 06221-543270 
Fax: 06221-543355 
E-Mail: heino.speer@urz.uni-heidelberg.de
Leitseite DRW: http://www.rzuser.uni-heidelberg.de/~cd2/drw/
  
Mitantragsteller: Prof. Dr. Oskar Reichmann
Germanistisches Seminar
Universität Heidelberg
Hauptstr. 207-209
D-69117 Heidelberg
Tel.: 06221-543236
E-Mail: oskar.reichmann@urz.uni-heidelberg.de
  

Universitätsbibliothek Heidelberg
Ansprechpartner:
Dr. Eberhard Pietzsch
Leiter der Abteilung Informationstechnik
Plöck 107-109
D-69117 Heidelberg
Tel.: 06221-542796
Fax: 06221-542623
E-Mail: pietzsch@ub.uni-heidelberg.de

1.2 Thema

Heidelberger Hypertextserver zur Informationserschließung mitteleuropäischer Kulturtradition über digitale Wörterbücher und ihre digitalen Ressourcen

1.3 Kennwort

Heidelberger Hypertextserver HDHS

1.4 Förderungsbereich

Informations-Infrastrukturen für netzbasierte Forschungskooperation und digitale Publikation

1.5 Voraussichtliche Gesamtdauer

Es handelt sich um ein Langzeitprojekt von internationaler und interdisziplinärer Relevanz, das von seiner Anlage zeitlich nicht begrenzt werden kann.

1.6 Antragszeitraum

24 Monate

1.7 Termine

Gewünschter Beginn der Förderung: 3 Monate nach Bewilligung

1.8 Zusammenfassung

Es soll eine Institution geschaffen werden, die historische Wörterbücher im Internet mit ihren digitalen Ressourcen, in erster Linie Quellentexte (maschinenlesbare Textkorpora und elektronische Faksimiles), aber auch weitere Ressourcen zur Wörterbuchbasis (z.B. Illustrationen zu Gegenständen, historische Karten, Grammatiken, Sachlexika usw.) vernetzt. Bei den Wörterbüchern handelt es sich zunächst aus pragmatisch-arbeitsökonomischen Gründen um das Deutsche Rechtswörterbuch (DRW) und das Frühneuhochdeutsche Wörterbuch (FWB). Die Vernetzung der Wörterbuchtexte mit digitalen Ressourcen erhöht den Informationsgehalt der Wörterbücher und leistet zugleich eine Sacherschließung dieser Ressourcen über die Lemmata, Bedeutungserklärungen und Belegtexte der Wörterbücher, die bisher nur mit hohem zusätzlichem Aufwand erreicht werden konnte. Eine weitere Sacherschließung erfolgt anhand der Klassifizierung der Wörterbuchquellen nach Raum, Zeit und Textsorte. Damit wird ein gegliederter Zugriff auf digitale Quellen möglich, ohne diese nochmals eigens bearbeiten zu müssen. Das Projekt  ist  konzeptionell auf die Begründung einer dauerhaften Einrichtung angelegt, die Vernetzungen mit weiteren digitalen Wörterbüchern und Ressourcen ausbaut, verwaltet und eventuell die  Funktion einer Clearingstelle für Digitalisierungen übernehmen kann.

2. Ausgangslage, eigene Vorarbeiten

2.1 Ausgangslage

Alles Relevante, was Menschen an Sachgütern, an gesellschaftlichen Einrichtungen, an Erkenntnissen, Ideologien und sozialen Handlungen vollbringen, findet seinen Niederschlag im Wortschatz der Sprache dieser Menschen. Wortschätze sind insofern gleichzeitig Darstellungsmittel von Vorgegebenem wie auch Systeme der Fixierung des kollektiven Wissens und der kollektiven Normen einer Sprachgesellschaft sowie sprachliche Handlungsinstrumente. Aus der Forscherperspektive betrachtet ist der Gesamtwortschatz die vornehmste Quelle zur sprach- und literaturgeschichtlichen, theologischen, philosophischen, überhaupt historischen Erschließung aller Kulturbereiche einer Gesellschaft.
Für historische Stufen einer Gesellschaft, deren Geschichte weitaus überwiegend in sprachlichen Quellen überliefert ist, ist die Lexikographie (in Verbindung mit anderen Teildisziplinen der Sprachwissenschaft) sogar der einzige Zugang zu ihrer Erschließung: Vor jeder geschichtswissenschaftlichen, theologischen, literaturgeschichtlichen oder sonstigen historischen Aussage über irgendein Werk der Vergangenheit oder eine historische Epoche steht das Faktum, dass solche Aussagen nur möglich sind auf der Grundlage des lexikalischen Verständnisses des Quellentextes und des in dessen Wortschatz niedergeschlagenen Weltbildes der Zeit, des Autors, seiner Gruppe. Lexikographie ist zweifellos die fundamentalste aller Disziplinen der historischen Grundlagenforschung. Dementsprechend hat es im gesamten europäischen Raum seit dem Beginn wissenschaftlicher Beschäftigung mit der eigenen Vergangenheit (im 16./17. Jahrhundert) eine vielseitige, intensive, zum Teil von der Gesellschaft hoch dotierte historische Lexikographie gegeben; es wird sie in dem Maße weiterhin geben, wie sich die heutigen Gesellschaften aus der eigenen und aus der Geschichte anderer heraus verstehen [Hausmann 1989; Reichmann 1988].
Allgemeinsprachliche (FWB) oder zur Allgemeinsprache hin offene Wörterbücher (DRW) liefern insofern den denkbar breitesten Zugriff auf die kulturelle Tradition, als sie den gesamten Wortschatz, nicht einen fachlich eingegrenzten Spezialwortschatz darstellen. Dementsprechend basieren allgemeinsprachliche Wörterbücher auf Quellenkorpora, die das Korpus eines jeden z. B. theologischen, sozial- und wirtschaftsgeschichtlichen und philosophischen Fachwörterbuches oder Fachlexikons an Breite übertreffen. Die Quellenkorpora solcher Wörterbücher bieten damit einen geradezu idealen Zugriff auf die Gesamtheit der Tradition. Dieser Zugriff erfolgt im Wörterbuch konkret über die Belegzitate. Diese Zitate aus historischen Quellen sind ihrerseits nur unzureichend an die Quellen zurückgebunden. Die Rückbindung erfolgt in der Regel über die Quellensigle, die dazugehörige Titelaufnahme und eine Bibliothek, die gerade diese Quelle in ihrem Bestand hält. Sowohl der Lexikograph als auch der Wörterbuchbenutzer können den Weg vom Belegzitat zur Quelle nur über die klassische Literaturversorgung der Fachbibliotheken gehen. Es fehlt gänzlich die Anbindung von maschinenlesbaren Texten und insbesondere von Faksimiles an die digital vorliegenden Wörterbuchzitate.
Umgekehrt sind auch digital vorliegende Quellen in der Regel nicht an die Belegzitate und die damit verbundenen semantischen Informationen in den Wörterbüchern rückgebunden.
Darüber hinaus gibt es zur Zeit keine Übersicht über diejenigen historischen Quellen, die im Internet oder aber in abgeschlossenen elektronischen Textkorpora maschinenlesbar vorliegen. Wörterbücher sind aber  mit ihrem hohen Quellenbestand (rd. 7.800 Quellen für das DRW, 550 Quellen für das FWB) die geeigneten Sammelstellen für derartige Informationen und stellen damit die ideale Grundlage für die Anbindung einer Clearingstelle dar.

2.2 Eigene Vorarbeiten

2.2.1. Vorarbeiten des Deutschen Rechtswörterbuchs

Das DRW beschreibt den Wortschatz der westgermanischen Rechtssprache im Hoch- und Niederdeutschen, Altenglischen, Altfriesischen, Mittelniederländischen und Frankolateinischen vom Anfang der schriftlichen Überlieferung im 5. Jh. bis in das 19. Jh. hinein. Bisher sind die Bände I - IX sowie die Hefte 1-6 zu Band X erschienen. Dies sind 15.360 Druckspalten mit 78.847 Wörterbuchartikeln zur Strecke Aachenfahrt bis Pflicht. Die Bände VII-IX wurden in einer lexikographischen Datenbank erstellt, liegen also in strukturierter Datenform vor [Speer 1995; Lemberg 2000]. Die Bände I-VI werden zur Zeit im Rahmen des DFG-Förderprogramms Retrospektive Digitalisierung von Bibliotheksbeständen [AZ.: IIIN2 55922 (1) Heidelberg AdW BIB43 Hdadw 01-01] durch die Eingabe in die Datenbank maschinenlesbar gemacht. Neben der Fortführung des Druckwerkes erscheint das DRW auch im Sinn des DFG-Förderprogramms in einer um die Mehrwerte des Mediums angereicherten Version im Internet [vgl. http://www.rzuser.uni-heidelberg.de/~cd2/drw/].
 Für das DRW liegt zur Zeit noch keine einheitliche und vollständige Quellendokumentation vor. Die insgesamt etwa 7.800 Quellensiglen werden in einem Quellenheft aus dem Jahr 1912 und vier Quellenergänzungsheften, deren letztes 1992 erschienen ist, beschrieben. Als Grundlage für die Vernetzung von lexikographischen und bibliographischen Informationen genügt der jetzige Zustand der Titelaufnahme allerdings in der überwiegenden Zahl der Fälle nicht mehr. Eine partielle Neuaufnahme wird neben der Autopsie der Originalquelle auch  zusätzliche Informationen erfassen müssen, wie etwa die Datierung der Quelle, eventuelle Neueditionen und ihre Verfügbarkeit sowie relevante Sekundärliteratur (wie sie beispielsweise im Verfasserlexikon des Mittelalters erfasst ist) [Vgl. hierzu Abbildung 1 in Anlage 2]. Für die lexikographische Arbeit an sich wären diese Zusatzinformationen in vielen Fällen verzichtbar, da ein Umlesen der Archivzettel auf jeweils neuere Editionen bei einem Wörterbuch mit einer einhundertjährigen Tradition nur bedingt machbar ist. Unter dem Aspekt der Informationsvernetzung allerdings stellt eine derartige Neuaufnahme eines bibliographischen Titels den Ansatzpunkt zu einer elektronisch realisierbaren Editionskonkordanz dar, da zwischen verschiedenen Editionen, die digital als Faksimile oder Volltextdatei vorliegen, relativ leicht eine Verlinkung hergestellt werden kann.
Im DRW ist auf Grund der Datenhaltung in dem Dokumentenverwaltungssystem FAUST eine hochgradig vernetzte interne Informationsstruktur aufgebaut worden, in der neben den lexikalisch-semantischen Vernetzungen der Wörterbuchartikel untereinander auch eine Vernetzung der Belegzitate vorgenommen wird. Diese Vernetzung erfolgt einerseits  mit den entsprechenden, lexikographisch kommentierten und mit Verweisen zur Sachliteratur ergänzten Titelaufnahmen [vgl. Abbildung 2], und andererseits, mit den bereits vorhandenen maschinenlesbaren Texteditionen bzw. Imagedateien, gerade von schwer zugänglichen Quellenwerken des 16. und 17. Jahrhunderts [vgl. Abbildungen 3 und 4].
Diese Vernetzung ist auch Bestandteil des Hypertextualisierungskonzeptes für das DRW im Internet [vgl. dazu Lemberg/Petzold/Speer 1998; Lemberg 1998], das darauf abzielt, die beiden Pole lexikographisch-historischer Arbeit, nämlich den Quellenbezug und die Ergebnispräsentation im Wörterbuchartikel miteinander zu verbinden. Dieser Bereich der Hypertextualisierung ist in der derzeitigen Online-Fassung noch nicht realisiert. Zur Veranschaulichung des informationellen Mehrwertes der Rückbindung eines Quellenzitates an seinen Quellentext sind  im Augenblick für den Buchstaben N 17 Quellenzitate der Bambergischen Halsgerichtsordnung von 1507 mit dem von der Mannheimer Universitätsbibliothek im Rahmen des MATEO-Programms ins Netz gestellten elektronischen Faksimile des Originaldrucks verlinkt [vgl. Abbildung 5].
Zur Zeit entsteht im Rahmen eines weiteren, von der DFG geförderten Projektes LPI [AZ.: SP 600/1-1] eine Dokument-Typ-Definition (DTD) auch für die Titelaufnahmen des Quellenbestandes, die mit den Richtlinien der Text Encoding Intitiative (vgl. http:/etext/virginia/edu/) konform ist. Diese Quellen-DTD kann die Grundlage für eine Quellendokumentation im Rahmen des hier beantragten Projektes bilden und damit eine soft- und hardwareunabhängige Datenhaltung in einer SGML-Notation gewährleisten.
Das DRW wird demnächst auch mit Hilfe einer Förderung durch die DFG im Rahmen der Retrodigitalisierung des Wörterbuchs und in Zusammenarbeit mit der Universitätsbibliothek Heidelberg über 60 seltenste Drucke des 16. und 17. Jahrhunderts aus dem Gebiet der Rechtswissenschaft ins Netz stellen, die dem hier beantragten Projekt unmittelbar zugute kommen.

2.2.2 Vorarbeiten des Frühneuhochdeutschen Wörterbuchs

Das Frühneuhochdeutsche ist diejenige historische Sprachstufe des Hochdeutschen, die nach dem Neuhochdeutschen von allen weiteren Stufen am reichhaltigsten belegt ist. Das FWB erfasst den Wortschatz vom 14. bis zum 17. Jh., dem Anspruch nach in allen Textsorten und allen Raumvarianten des gesteckten Zeitrahmens. Der Umfang des Wörterbuches soll 12 Bände zu jeweils rund 1000 Seiten umfassen. Herausgeber sind Ulrich Goebel und Oskar Reichmann.
Bisher sind erschienen: Bände 1; 2: vollständig; Band 3: 1. und 2. Lieferung, 3. Lieferung beim Verlag; Band 4: 1. Lieferung, 2. Lieferung beim Verlag; Band 8: 1. Lieferung. Die bisher erschienenen Bände und Lieferungen liegen mit Ausnahme von Lieferung 1 und Teilen der Lieferung 2 des ersten Bandes maschinenlesbar vor.
Die Quellenbasis des FWB wurde im Hinblick auf ihre räumliche, zeitliche und textsortenspezifische Ausgewogenheit erstellt und vom Herausgeber und Bearbeiter Oskar Reichmann unter theoretischen Gesichtspunkten der Korpuserstellung diskutiert sowie im Verzeichnis der Quellen, FWB Bd.1, 165-224 dokumentiert [vgl. Anlage 3]. Eine weitere theoretische Durchdringung und praktische Realisierung einer Textsortenklassifizierung für den Bereich des Frühneuhochdeutschen findet sich im Rahmen der Herausgabe des Frühneuhochdeutschen Lesebuchs [vgl. Reichmann / Wegera 1988; Reichmann 1996].

2.2.3 Vorarbeiten der Heidelberger Universitätsbibliothek

Der Volltextserver "HELIOS/Medienarchiv" der Universitätsbibliothek Heidelberg dient der Erfassung und Archivierung von frei zugänglichen Volltexten und anderen Medien sowie der Herstellung von deren dauerhafter Zitierfähigkeit. HELIOS/Medienarchiv ist unter der URL "http://archiv.ub.uni-heidelberg.de/" erreichbar; zwei Gruppen von Materialien können hier archiviert werden:
• Digitalisierte Historische Bestände,
• Hochschulpublikationen, insbesondere Prüfungsarbeiten, Vorlesungsmaterial, Aufsätze.
Die im Rahmen des vorgeschlagenen Projektes verwendeten Materialien (digitalisierte Quellen) fallen unter die erstgenannte Gruppe. Unabhängig von der Verwendung der digitalisierten Materialien im Rahmen des vorgeschlagenen HDHS sorgt die Universitätsbibliothek für den Nachweis der Materialien u.a. in
• allgemeinen Suchmaschinen im WWW,
• dem Karlsruher Virtuellen Volltextkatalog – KVVK,
• der Verbunddatenbank des Südwestdeutschen Bibliotheksverbund,
• dem lokalen Katalog der Universitätsbibliothek.
Die digitalisierten Quellen sollen in HELIOS/Medienarchiv mittels Strukturinformationen zusammengefügt werden. Zur buchähnlichen Präsentation der Quellen wird im Rahmen eines anderen Projektes ein SGML-basiertes Präsentationsmodell mit folgender Zielsetzung erarbeitet:
• Auch umfangreichere Bestände digitalisierten Materials sollen mit nur geringfügigem manuellem Aufwand aufgenommen werden können,
• Die physische Struktur der Materialien wird durch ihre Präsentation nachgebildet,
• Die Präsentation soll unabhängig vom digitalisierten Material modifizierbar sein,
• Die erforderliche Software und die SGML-Strukturbeschreibungen sollen frei verfügbar sein.
Dem Benutzer erscheinen die in HELIOS/Medienarchiv aufgenommenen Materialien als verlinkte, mit HTML-Wrappern zusammengeführte Images.

3. Ziele und Arbeitsprogramm

3.1 Ziele

Mit HDHS soll eine wörterbuchübergreifende Informationsplattform zur mitteleuropäischen Kulturtradition geschaffen werden. Die in HDHS integrierten Wörterbücher sind Erschließungswerkzeuge für digital vorliegende historische Quellen.
Die damit geschaffene Vernetzung der Wörterbuchtexte untereinander und mit maschinenlesbaren Texten, elektronischen Faksimiles und historischen Darstellungen soll einerseits den Informationsgehalt der Wörterbücher erhöhen und damit auch völlig neue Nutzungsmöglichkeiten, z.B. für begriffsgeschichtliche Fragestellungen schaffen. Andererseits soll sie eine Sacherschließung der digitalen Ressourcen, insbesondere von Faksimiles und bildlichen Darstellungen, über die Lemmata, Bedeutungserklärungen und Belegtexte der Wörterbücher leisten, die bei entsprechenden Digitalisierungsvorhaben bisher nur mit hohem zusätzlichem Aufwand erreicht werden konnte. Eine weitere Sacherschließung soll anhand der Klassifizierung der Wörterbuchquellen nach einem bestimmten Kriterienkatalog (Raum, Zeit, Textsorte) erfolgen. Damit wird ein zeitlich, räumlich oder sachlich gegliederter Zugriff auf digitale Quellentexte möglich, ohne diese nochmals eigens bearbeiten zu müssen.
Dies setzt voraus, dass ein Minimalabgleich der Zugriffsmöglichkeiten auf  Digitalisierungen in den unterschiedlichen Bibliotheken und vergleichbaren Institutionen vorgenommen wird (so dass beispielsweise gewährleistet ist, dass jede digitalisierte Seite über eine eindeutige URL adressiert werden kann). Zugleich kann damit als Nebeneffekt eine Art Clearingstelle für Digitalisate in dem sachlichen, zeitlichen und räumlichen Bereich dieser Wörterbücher entstehen, da ein erheblicher Teil der für Digitalisierungen in Frage kommenden historischen Quellen in irgendeiner Weise für Wörterbücher genutzt worden ist oder genutzt werden kann.

3.2 Arbeitsprogramm

3.2.1  Erschließung der Quellen

Für die Realisierung eines Heidelberger Hypertextservers und damit eines internetbasierten Informationssystems, das über die beiden Wörterbücher hinausführt und es sich zum Ziel setzt, die im Internet jetzt und zukünftig verfügbaren kulturhistorischen Ressourcen einzubinden, zu erschließen und für die historische Traditionsforschung zu fokussieren, müssen folgende Voraussetzungen erfüllt sein:

3.2.1.1 Quellenklassifizierungen

Wörterbuchtexte sind durch ihre Digitalisierung in einem Stadium angelangt, in dem sie unter informationswissenschaftlichen Gesichtspunkten aufbereitet werden müssen. Da es - zumindest für die bereits bearbeiteten Buchstabenbereiche - keine realisierbare Möglichkeit gibt, jeden einzelnen Belegtext inhaltlich oder sonstwie zu klassifizieren und damit eine gezielte Abfrage je nach Benutzerinteresse zu ermöglichen, muss ein anderer Weg gewählt werden, der über die oben kurz angesprochenen Klassifikationsarten der Quellen geht. Die bibliographische Erschließung der Kulturtradition als Voraussetzung hierfür sollte es ermöglichen,
• den Quellenbestand einzelner Projekte nach bestimmten korpusrelevanten Fragestellungen zu durchleuchten, z. B. Anzahl und Textsorte bairischer Quellen des 15. Jahrhunderts,
• die Quellenbasis verwandter Projekte miteinander zu vergleichen;
• sie sollte ferner ein sprach- oder kulturnationales Korpus bereitstellen, auf das neue Projekte zur Verkürzung der auch weiterhin notwendigen jeweils spezifischen Korpusbildung zurückgreifen können.
Die historischen Quellen des gänzlich oder partiell deutschsprachigen Teils Mitteleuropas im DRW und FWB werden ergänzt durch viele niederländische, altfriesische oder altenglische Quellen des DRW, die dessen sprachgeschichtlich am Westgermanischen orientierten Konzept zu verdanken sind. Als Beispiele seien hier genannt: Aus dem Mittelniederländischen Wörterbuch zitiert das DRW 1.967 Stellen, allein aus der willkürlich herausgegriffenen niederländischen Stadt Dordrecht sind es zusätzlich dazu 404 Belegtexte oder Fundstellen, etwa 2.500 altfriesische Belegtexte oder Fundstellen und etwa 1.500 altenglische Belegtexte und Fundstellen werden zitiert. Diese Zahlen sollen nicht nur die Quellenvielfalt der Wörterbücher dokumentieren, sondern auch die jetzt schon mögliche Zugriffsstruktur über aussagekräftige Quellensiglen. Für eine Sacherschließung der digital vorliegenden Quellen muss bei den Titelaufnahmen der Wörterbücher eine Textklassifizierung vorgenommen werden. Dies ist integraler Bestandteil des Projekts HDHS und eine notwendige Voraussetzung für die digitale Erschließung der Quellen zur mitteleuropäischen Kulturtradition. Der Arbeitsplan hierzu sieht folgendermaßen aus:
Jede erfasste Quelle wird (sofern dies nicht bereits aus der bibliographischen Beschreibung hervorgeht) mit einer überschaubaren Anzahl relevanter Kennzeichnungen versehen; dazu müssten gehören:

a) die Angabe des Entstehungsraumes der Quelle,
b) die Angabe der Entstehungszeit,
c) die Zuordnung zu einer sozialen Schicht bzw. zu einer Gruppe,
d) die Bestimmung der Textsorte der Quelle,
e) ein Hinweis auf die Form der Quelle: Vers oder Prosa,
f) ein Hinweis auf die Wirkungsgeschichte des Quellentextes,
g) eine Angabe zur Überlieferung der Quelle: Anzahl der Handschriften, Nachdrucke usw.
h) eine Charakterisierung des Textverfassers bzw. der Verfassergruppe hinsichtlich Stand, Beruf, Konfessionszugehörigkeit usw.
i) die Erfassung der zu diesem Werk im Internet oder anderen digitalen Medien vorliegenden weiteren Informationen jeglicher Art.

Die unter a) bis i) aufgeführten Quellenkennzeichnungen bedürfen jeweils einer eigenen Diskussion [Verwiesen wird hier auf die Artikel "Die Textsorten des ..." zu den jeweiligen Sprachstufen im Handbuch Sprachgeschichte von Hyldgaard-Jensen, Kästner/Schirck, Kästner/Schütz/Schwitalla, Sanders und Schwarz, jeweils 1985]. Diese sollte unter der Leitlinie stehen, möglichst objektive Angaben zu leisten; "Raum" ist demzufolge geographischer Raum, "Zeit" ist physikalische Zeit. Dies ermöglicht es, den Raum- und Zeitkoordinaten je nach Benutzerinteresse bestimmte Antworten zu entnehmen, etwa durch Landkarten sprachhistorischer Entwicklungsstadien oder der Territorialzugehörigkeit eines bestimmten Ortes zu einer bestimmten Zeit. Bei der Schichten- und Gruppenangabe, erst recht bei der Textsortenangabe werden die Verhältnisse diffiziler; für letztere wird man möglicherweise einen Intentionenkatalog erstellen und diesen als Klassifikationsrahmen benutzen müssen. Kennzeichnungen, die eigene, zeitaufwendige Untersuchungen voraussetzen, sollten im Interesse des zügigen Fortgangs der Arbeit offen bleiben. - Alle Informationen müssen so standardisiert werden, dass der Rezipient sie von möglichst wenigen Suchbegriffen her auffinden und mit jedem anderen Typ von Information verbinden kann.
Für die Nutzung bereits bestehender Daten und Korpora auf Seiten der Benutzer, bedeutet dies, dass technische Routinen geschaffen werden, mit deren Hilfe ein variables, benutzergesteuertes Abfragesystem die Klassifikationen der Quellen dazu nutzt, um Recherchen nicht als bloße Volltextrecherche durchführen zu müssen, sondern gezielt einen zeitlich, räumlich oder anders bestimmten Klassifikationsbereich durchsuchen zu können. Die hierzu erforderlichen datentechnischen Routinen sind in FAUST bereits grundsätzlich angelegt und müssen noch für die besonderen Anwendungsfälle realisiert werden. Dennoch sollen auch andere Möglichkeiten der Verwaltung und Nutzung von Hypertext (z. B. LPI und Hyperwave) geprüft und getestet werden, da es auf Dauer um ein leicht handhabbares und von der Verfügbarkeit von Einzelpersonen unabhängiges System gehen muß.
Die Zugriffsskizze ist in vorliegender Fassung sehr einfach gehalten. Die Gründe dafür sind: Wissenschaftliche und damit bibliographische Unternehmen müssen auf einer klaren persönlichen Motivation der Verantwortlichen beruhen; sie müssen ferner in ihrem Kern einfach konzipiert und vom Rezipienten mit einem Schlage erfassbar sein. Insofern stützen sich die Planenden auf die von ihnen geleiteten Wörterbuchunternehmen; Ausweitungen sind von dieser Basis her jederzeit möglich (der Leiter des DRW hat als Vertreter der Heidelberger Akademie der Wissenschaften in der „Arbeitsgruppe Elektronische Publikation" der Union der deutschen Akademien der Wissenschaften entsprechende Kontaktmöglichkeiten, die hierfür genutzt werden können).

3.2.1.2  Erstellung einer gemeinsamen Quellendokumentation

Die im SGML- Format erstellte und im Internet verfügbare Quellendokumentation zu beiden Wörterbüchern stellt den Kern einer potentiell alle deutschsprachigen historischen Wörterbücher umfassenden Bibliographie - wenn man die zusätzlichen Vernetzungen unter diesen Begriff einbeziehen will - dar. Dabei sollen auch extern vorliegende Titelaufnahmen wie die zu den digitalen mittelhochdeutschen Wörterbüchern genutzt und eingebunden werden; dies setzt enge Kontakte und Absprachen zwischen den verschiedenen Projekten voraus. Ein Quellenverbund mit der Neubearbeitung des Wörterbuchs von Jacob Grimm ist mit dem Leiter der Göttinger Arbeitsstelle, Herrn Professor Schlaefer, vorbesprochen worden.

3.2.1.3  Quellenvernetzung

Die Vernetzung der Quellen (Wörterbuchtexte und Textkorpora) mit digitalen Ressourcen ist zunächst an die jeweiligen Titelaufnahmen gebunden, wird dann aber auch über jede einzelne Fundstelle der Wörterbücher aus diesen Quellen hergestellt werden. Dabei kann es ein Weg sein, zu jeder digital vorliegenden Quelle eine besondere Wortliste anzubieten, über die ein alphabetischer Zugriff möglich ist. Denkbar ist aber auch eine Liste der Wortartikel, in denen Belege aus einer Quelle zitiert werden. Die Art des Zugriffs vom Wörterbuch auf digitale Quellen kann vielfältig ausgestaltet sein und wird sich letztlich an den Wünschen der Benutzer ebenso wie an den Wünschen der beteiligten Institutionen ausrichten. Daher sind abschließende Festlegungen zum gegenwärtigen Zeitpunkt wenig sinnvoll.

3.2.1.4 Clearingstelle

Die Vernetzungen müssen nicht nur einmal hergestellt, sondern angesichts der Veränderbarkeit des Netzes ständig gepflegt werden. Dies setzt einerseits voraus, dass einschlägige Netzadressen und Mailinglisten in regelmäßigen Abständen überprüft werden und intensive Kontakte zu potentiellen Anbietern digitaler Ressourcen geknüpft und gehalten werden. Andererseits aber kann und muss die Verfügbarkeit digitaler Ressourcen gezielt erweitert werden, wie dies beispielsweise in der Zusammenarbeit mit der Heidelberger Universitätsbibliothek geplant ist. Hier soll eine Digitalisierung von gedruckten Rechtsquellen erfolgen, deren Priorität sich an der Zitierhäufigkeit im DRW bemisst - eine scheinbar subjektive, aber dennoch in sich stimmige Auswahl, da die Exzerption im DRW und damit die Häufigkeit der Zitate von rechtshistorisch und lexikographisch erfahrenen Wissenschaftlern bestimmt wurde. Es ließe sich relativ leicht aus der Zitierhäufigkeit der Quellen in den Wörterbüchern allgemein eine Rangliste der Digitalisierungsvorhaben erstellen. Diese wäre nur vordergründig an dem natürlich auch vorhandenen Interesse der jeweiligen Wörterbücher an der digitalen Verfügbarkeit ihrer Quellen orientiert. Wichtiger ist die durch eine lange wissenschaftliche und lexikographische Tradition bewährte Gewichtung der Quellen, die sicherlich durch andere Komponenten ergänzt werden müsste (beispielsweise die Überlieferungs- und Rezeptionstradition des Sachsenspiegels mit seinen Übersetzungen in andere Sprachen). Daher könnte es Aufgabe des Projekts HDHS sein, Anregungen für eine Rangliste von Digitalisierungsvorhaben zu geben, die ja nicht immer im Bereich staatlicher Förderung angesiedelt sein müssen. Die vielfältigen privaten Initiativen zu bestimmten Digitalisierungen, die häufig von wissenschaftlichen Projekten ausgehen, dort aber dann auch verschlossen bleiben, könnten so gebündelt und Mehrfachdigitalisierungen vermieden werden. Der hier skizzierte Aufgabenbereich entspricht damit den Aufgaben einer bisher nicht vorhandenen Clearingstelle.

3.2.2 Knoten im Netz

Der wahre Nutzen der Digitalisierung von Wörterbüchern ergibt sich aus ihrer Bereitstellung im Internet. Hier können die Wörterbücher einmal untereinander vernetzt werden und zum anderen Knoten im Netz darstellen, in denen vielfach weiterleitende Informationen in hochgradig verdichteter Form angeboten werden. So würde beispielsweise von dem Beleg aus einer bestimmten Quelle ein Hyperlink einerseits zu einer wissenschaftlich überprüften Titelaufnahme führen, die wiederum einen Hyperlink zu biographischen Informationen über den Autor enthalten kann - ebenso wie Links zu vergleichbaren Texten des gleichen Autors oder anderer Autoren oder zu Texten mit vergleichbaren Inhalten -, oder aber der Hyperlink führt zu einem Faksimile der sonst nur in klimatisierten Räumen zugänglichen Druckausgabe oder sogar weiter zu einer als Faksimile vorliegenden Handschrift. All dies bedeutet nicht nur eine reine Erweiterung der Verlinkungsmöglichkeiten - von denen es im Web häufig auch zu viele gibt -, sondern vor allem eine „Demokratisierung von Wissen" [Kuhlen 1995], die alle Interpretationen dieser Quellen in hohem Grade überprüfbar werden lässt und überdies völlig neue Möglichkeiten für begriffsgeschichtliche Fragestellungen eröffnet. Dies soll, zunächst bezogen auf die beiden beteiligten Wörterbücher, in HDHS realisiert werden. Basis ist zunächst das maschinenlesbar vorliegende Artikelmaterial beider Wörterbücher sowie deren Quellenbibliographie und die von den Wörterbüchern bereits integrierten digitalen Ressourcen (Textarchiv, Faksimiles).
Eher im Hintergrund steht zunächst der  Anschluss an LPI, da dessen Nutzung erst Ende 2001 möglich wäre. HDHS setzt vielmehr auf den bereits vorhandenen Informationsstrukturen und deren Verwaltung in dem Dokumentenretrievalsystem FAUST auf. Dies hat sachliche Gründe; diese ergeben sich daraus, dass LPI auf die Digitalisierung und Vernetzung von Wörterbuchinhalten abzielt: Eine genuin linguistische Aufgabe, die sich auch in der Komponente eines lexikographischen Produktionsprozesses niederschlägt. HDHS dagegen hat die Rückbindung der Wörterbuchinhalte an ihre Quellen und über diese Rückbindung die informationstechnische Erschließung der Quellen zur Aufgabe. Außerdem hat der Verzicht auf die unmittelbare Anbindung des Projekts an LPI arbeitspragmatische Gründe: Das Rechtswörterbuch wird bis März 2001 bereits in der DRW-eigenen Dokumentationsstruktur von FAUST eingetragen sein - wenn auch noch nicht in allen Teilen abschließend korrigiert. Damit stehen etwa 80.000 Wortartikel von A bis P als Erschließungsinstrumente zur Verfügung, die zum Teil bereits mit digitalen Ressourcen vernetzt sind, zum Teil aber noch vernetzt werden müssen (z. B. bei Faksimiles, die erst ins Netz gestellt werden). Das bis auf die erste Lieferung maschinenlesbare FWB muß aus sequentiellen Textdateien geparst werden, damit die textinternen Markierungen in eine eindeutige Datenstruktur überführt werden können und damit der Import in eine Datenbank ermöglicht wird. Hierfür ist aus pragmatischen Gründen ebenfalls FAUST vorgesehen, obwohl jede andere Datenbank dies auch ermöglichen würde. Die Entscheidung für das vom DRW schon genutzte System erübrigt aber zum gegenwärtigen Zeitpunkt eine aufwendige und zeitraubende Einrichtung einer anderen Datenbank für diese Zwecke.

3.2.3 Realisierung über einen FAUST-Webserver

Die Softwarefirma Land, die FAUST herstellt, hat 1999 einen Internetserver für FAUST auf den Markt gebracht, der zwar keine Produktionskomponente enthält (wie dies bei LPI der Fall sein wird), aber alle Recherchemöglichkeiten von FAUST zur Verfügung stellt. Damit lassen sich alle bereits vorhandenen Informationsvernetzungen problemlos im Internet verfügbar machen (vgl. dazu das beiliegende Informationsblatt FAUST+LIDOS News Nr. 45 vom April 1999). Der Webserver soll aus Sicherheitsgründen über zwei getrennte Fileserver realisiert werden: einmal über einen Internetserver (vgl. unten 4.2 a) und dann über den eigentlichen FAUST-iServer (vgl. unten 4.2 b).

3.2.4 Nutzung von  Synergieeffekten

Dies hat zur Folge, dass das Projekt in einer über Jahre hinweg erprobten EDV-Umgebung realisiert werden kann und die Anfangsschwierigkeiten, die LPI noch zu bewältigen haben wird, kein Verzögerungsmoment darstellen werden. LPI - mit seiner auch auf dezentrale Wörterbuchproduktion gerichteten Funktionalität - bedarf zur Realisierung der Adaption einer Datenbank (vermutlich Oracle8i), mit der die in SGML modellierten Daten verwaltet werden können. Die Präsentation der in FAUST bereits vorliegenden Daten des DRW wie auch der Import der Daten des FWB in FAUST führt hingegen zu rasch vorliegenden Recherchemöglichkeiten im Internet. Zudem steht inzwischen eine mit der Programmierung von FAUST in FAUST-Basic vertraute Person zur Verfügung, die außerdem die Strukturen des DRW wie auch die des FWB so genau kennt, dass sie die Überführung des FWB in FAUST durchführen kann. Das nicht unkomplizierte Wörterbuchparsing für das FWB und partiell erforderliche Nachbearbeitungen des Datenbankimports würden einen Teil des Projekts darstellen. Insgesamt aber würde die Erschließung digitaler Quellen - insbesondere von Faksimiles - mit dezentraler Speicherung im Internet auf Grund des bereits vorhandenen Informationspools relativ schnell erfolgen und somit der Erschließungsgrad einschlägiger Titel des DFG-Förderprogramms „Verteilte Digitale Forschungsbibliothek" um ein Mehrfaches gesteigert werden.
Der Nutzung von FAUST zu derartigen Zwecken wird  häufig entgegengehalten, dass es sich hierbei um ein „proprietäres System" handele, bei dem man sich in eine nicht zu verantwortende Abhängigkeit von einer privatwirtschaftlich arbeitenden Firma begebe. Abgesehen von der über zehnjährigen guten und effektiven Zusammenarbeit des DRW mit der Firma Land und der weiten Verbreitung von FAUST im Bibliotheks- und Archivbereich und bei Großkunden der Wirtschaft muss dem ein grundsätzlicher Einwand entgegengehalten werden: Jedes einigermaßen vergleichbare Programm ist in irgendeiner Weise proprietär, solange es keine Schnittstelle zu einem hard- und softwareunabhängigen Standard besitzt. Diese Schnittstelle ist in FAUST aber insofern vorhanden, als jederzeit ein Datenexport in ASCII-Dateien möglich ist, wie er jetzt schon für die HTML-Dateien des DRW im Internet genutzt wird (vgl. http://www.rzuser.uni-heidelberg.de/~cd2/drw). Im Verlauf des Projektes soll in FAUST eine entsprechende Exportfunktion in SGML-Strukturen realisiert werden, die auf der Datenmodellierung für historische Wörterbücher innerhalb von LPI aufsetzt. Die Exportfunktion, die in FAUST so gestaltet werden kann, dass nur SGML-konforme Daten exportiert werden und nichtkonforme Daten als Problemfälle markiert werden, ermöglicht eine Publikation in anderen Medien und die Interoperabilität mit anderen Systemen. Ebenso wird weiterhin eine Druckfassung in TeX die kontinuierliche Publikation des gedruckten Werkes absichern. Nach Ablauf der ersten, zweijährigen Phase des Projekts kann die Zusammenführung mit LPI in KHS oder beispielsweise mit Hyperwave auf Grund einer dann realistisch zu beurteilenden Machbarkeits- und Effizienzuntersuchung ins Auge gefasst werden. Dabei können eventuelle konzeptuelle Veränderungen hinsichtlich der Annahme des Internetangebots und der damit möglicherweise verbundenen Performanceprobleme vorgenommen werden.
Eine weitere Nutzung von Synergieeffekten ergibt sich aus den unter Punkt 2.2. beschriebenen Vorarbeiten.

3.2.5  Wörterbuchpräsenz im Internet

Die hierfür erforderliche Präsenz der Wörterbücher im Netz wird vermutlich unterschiedlich geregelt werden müssen. Im Fall des DRW geschieht dies zumindest in einer Grundversion unentgeltlich, wie dies die Förderbedingung der DFG im Förderprogramm "Verteilte Digitale Forschungsbibliothek" war, im Rahmen des FWB ist noch eine Abklärung mit dem Verlag (z. B. Lizenzen für Bibliotheken oder Privatwissenschaftler usw.) erforderlich. Dabei ist der Verlag de Gruyter grundsätzlich offen für eine digitale Version des FWB, ist aber, wie andere Verlage auch, noch unsicher hinsichtlich der damit verbundenen rechtlichen und wirtschaftlichen Probleme. Es wird eine der Aufgaben der Arbeitsgruppe "Elektronische Publikationen" der Union der Akademien sein, für solche nicht mehr seltenen Fälle Lösungsvorschläge zu machen. Sicher ist jedenfalls, dass das Interesse des Herausgebers des FWB in dem Punkt mit dem Interesse des Verlages und der gesamten historischen Wissenschaften übereinstimmt, dass eine digitale Version eines Nachschlagewerkes die Druckversion nicht überflüssig machen darf. Daher wird hier auch das wirtschaftliche Interesse des Verlages in die Gestaltung der Internetnutzung des FWB einfließen müssen. Abrechnungsmöglichkeiten, wie sie hier diskutiert werden müssen, sind im FAUST-iServer bereits vorgesehen.

4. Beantragte Mittel

4.1 Personalbedarf

Beantragt wird eine Personalausstattung von 3,5 Mitarbeiterstellen nach BAT IIa und einem Mitarbeiter nach BAT Vb/IVb (Diplombibliothekar) sowie von 60 Monatsstunden für ungeprüfte wissenschaftliche Hilfskräfte, jeweils für 24 Monate.

a) 3 wissenschaftliche Mitarbeiterstellen BAT II a (Geisteswissenschaftler)
b) 1/2 wissenschaftliche Mitarbeiterstelle BAT II a (Promotionsstelle EDV/Computerlinguistik)
c) 1 Mitarbeiterstelle BAT Vb/IVb  (Diplombibliothekar)
d) 60 Stunden monatlich für ungeprüfte wissenschaftliche Hilfskräfte.

Die Aufgabenbereiche lassen sich folgendermaßen beschreiben:

a) Erfassung der Textklassifikatoren, Erarbeitung einer rechtshistorischen Textsortenklassifikation, Modifizierung der im Entwurf vorliegenden Klassifikationsschemata, Klassifikation der Quellen in der Datenbank, Modellierung der Informationsstruktur auf dem FAUST-iServer, Parsing der Textdateien des FWB, Erschließung neuer Recherchefunktionen in FAUST für den Internetbenutzer, Verknüpfung der Wörterbuchtexte mit externen digitalen Ressourcen, Projektmanagment, Öffentlichkeitsarbeit (Teilnahme an Tagungen, Kontakte zu öffentlichen Medien usw.). Die Bezeichnung "Geisteswissenschaftler" wurde gewählt, um deutlich zu machen, dass bei diesem interdisziplinären Projekt eine Offenheit gegenüber dem Bewerberangebot bewahrt werden muss.

b) Systembetreuung, Datenbankadministration, Pflege des Datenbestandes von der technischen Seite her, datentechnische Aktualisierung der Projektschnittstelle zu LPI und zu Projekten wie beispielsweise dem mittelhochdeutschen elektronischen Textarchiv oder dem Göttinger Akademiethesaurus. Die halbe Promotionsstelle ist deshalb so ausgewiesen, weil der Bedarf an Systembetreuung und vergleichbaren Dienstleistungen in einem solchen Projekt zwar einerseits die Kompetenzen der geisteswissenschaftlichen Mitarbeiter/innen des Projekts übersteigt, andererseits aber auch innerhalb der bei den Antragstellern vorhandenen Infrastruktur nicht zu leisten ist. Angesichts des bekannten Engpasses auf diesem Arbeitsmarktbereich erscheint es als eine Möglichkeit, eine hinreichend ausgebildete Person zu gewinnen, die dieses Projekt mit einer Promotion begleiten will.

c) Neuerfassung oder Überprüfung der Titelaufnahmen zu den Quellen des DRW und FWB nach RAK-WB und durch Autopsie. Bibliographische Erfassung der dazugehörigen Digitalisate.

d) Die Hilfskraftstunden werden innerhalb des Projekts für Zulieferarbeiten für den Arbeitsbereich a-c insbesondere bei der Literaturbeschaffung (z. B. Nachschlagen biographischer Daten in der ADB usw.) benötigt. Da die beschäftigten Personen an verschiedenen Orten arbeiten (UB Heidelberg, Germanistisches Seminar usw.), werden auch logistische Probleme zu lösen sein (Transport von Büchern usw.).

Erläuterung zum Zeitraum

Für die erste, auf  DRW und FWB bezogene Arbeitsphase ist ein Erprobungszeitraum von zwei Jahren anzusetzen. Auf der Basis der Kenntnis, wie viele Personen pro Jahr wie viele Quellen im angegebenen Sinne bearbeiten können, wird man in diesem Punkt die Ausweitung realisieren. Dabei muß Folgendes deutlich werden: Die Intention des Projektes ist nicht auf ein einmal für einen bestimmten Zeitraum bewilligtes und dann abgeschlossenes Projekt gerichtet, sondern auf die dauerhafte Einrichtung eines Vorhabens, das auch in ferner Zukunft die Verwaltung und Bereitstellung digitaler Ressourcen zur mitteleuropäischen Kulturtradition übernehmen und leisten kann. Dabei soll die Bewilligung des Projektantrags durch die DFG dazu dienen, in einer pragmatisch konzipierten und realisierten Eingangsphase die nötigen Erfahrungen zu sammeln und überzeugende Anfangsergebnisse zu erzielen, die eine Weiterförderung durch andere Geldgeber ermöglichen. Angesichts des Sprachraumes, den das DRW mit den Sprachen bzw. Sprachvarietäten Frankolatein, Altenglisch, Altfriesisch, Althochdeutsch, Mittelhochdeutsch, Mittelniederdeutsch, Mittelniederländisch und Neuhochdeutsch abdeckt und der sich auf das gesamte Mitteleuropa (ohne Beschränkung auf den Herrschaftsbereich des Heiligen Römischen Reiches Deutscher Nation) erstreckt, dürfte eine Förderung durch die Europäische Union in Frage kommen - und dies mit offenem Ende und offenen Grenzen.

4.2  Geräte

Die Geräteausstattung sollte folgende Komponenten enthalten:
 
a) 1 Fileserver als Internetserver 
b) 1 Fileserver als FAUST-iServer 
c) 2 Eizo F520 Monitore 
d) 5 Notebooks 

Es soll auf Grund guter Erfahrungen mit der Firma das Angebot der Firma CAT angenommen werden.
Alle Mitarbeiter/innen des Projekts müssen einen hohen Grad an Mobilität bei der Organisation ihrer Arbeit aufweisen. Dies erstreckt sich nicht nur auf räumlich verteilte Arbeitsplätze innerhalb der Institute der Antragsteller, sondern beinhaltet insbesondere die auch datentechnische Präsenz bei Reisen zu Bibliotheken, Archiven und Tagungen. Daher wurde von vernetzten Workstations abgesehen und auf funktional gleiche transportable Rechner abgestellt. Diese Geräte können auch nicht als Grundausstattung des Projekts angesehen werden. Da HDHS vom DRW, einer Forschungsstelle der Heidelberger Akademie der Wissenschaften, und dem FWB, einem Projekt des Herausgebers, sowie der Universitätsbibliothek Heidelberg betrieben werden soll, gibt es nahezu keine Infrastruktur auf dem Gebiet der Büroausstattung, der Geräte und solcher Kosten, wie beispielsweise für Telephonate, denn die vorhandene Infrastruktur ist anderen Projekten bzw. institutionalisierten Zielen zugeordnet und wird dort benötigt.
 
e) 1 Netzwerkdrucker HPLaserjet 4050N

4.3 Reisen

Die Reisekosten können zum gegenwärtigen Zeitpunkt nur geschätzt und pauschal beziffert werden. Das Projekt setzt eine hohe Präsenz der beteiligten Personen in Einrichtungen unterschiedlicher Art, die als Beiträger für Digitalisationen in Frage kommen, voraus. Gleichermassen hoch muss die Präsenz auf Fachtagungen sein, um Personen zu einer Kooperation mit HDHS bewegen zu können und um Erfahrungen anderer für das eigene Projekt nutzen und damit unter Umständen Umwege vermeiden zu können. Überdies wird HDHS nur dann eine zentrale Rolle bei der Vernetzung der mitteleuropäischen Kulturtradition einnehmen können, wenn es schon in der ersten Arbeitsphase von zwei Jahren einen hohen Bekanntheitsgrad erreicht.

4.4 Sonstige Kosten

5. Eigenleistungen

5.1 Zusammensetzung der Arbeitsgruppe

Außer den Antragstellern sollen Mitglieder der Arbeitsgruppe sein: Prof. Dr. Ulrike Haß-Zumkehr (IdS/Leksis), Ingrid Lemberg (DRW), Dr. Anja Lobenstein-Reichmann (IdS/FWB), Dr. Gisela Weber (stellvertretende Bibliotheksdirektorin UB Heidelberg). Zu einem späteren Zeitpunkt Prof. Dr. Kurt Gärtner (Trier) und Prof. Dr. Michael Schlaefer (Göttinger Akademie der Wissenschaften). Eine personelle Einbindung der Heidelberger Akademie der Wissenschaften über die Mitarbeiter des DRW hinaus wird mit dieser besprochen werden. Bei einer - im Projekt angelegten - Institutionalisierung wird ein Leitungs- oder Beratungsgremium aus Wissenschaftlern der einschlägigen Fachrichtungen eingerichtet werden müssen.

5.2 Zusammenarbeit mit anderen Institutionen

Eine Zusammenarbeit mit anderen Institutionen ist konzeptuell im Projekt vorgesehen und kann zum gegenwärtigen Zeitpunkt nur sehr punktuell und exemplarisch benannt werden. In Frage kommen hier zunächst einmal das Leksis-Projekt am Institut für Deutsche Sprache in Mannheim, die Staatsbibliothek zu Berlin mit ihren einschlägigen Digitalisierungsprojekten, die Universitätsbibliothek Bielefeld mit ihrer digitalen Bibliothek sowie die Universitätsbibliothek Mannheim mit ihrem MATEO-Projekt. Eine Erweiterung auf die digitalen mittelhochdeutschen Wörterbücher und das Deutsche Wörterbuch von Jacob Grimm bzw. auf dessen Neubearbeitung ist nicht nur denkbar, sondern durch persönliche Kontakte zu den hierfür verantwortlichen Wissenschaftlern initialisiert worden. Sie steht aus Gründen der Arbeitsökonomie zunächst noch im Hintergrund, soll aber erst nach einer Erprobungsphase des Projekts durch eine Anfrage an Herrn Professor Gärtner (Trier/Mittelhochdeutsche Wörterbücher) und an Herrn Professor Schlaefer (Göttingen/Neubearbeitung des DWB) wegen ihrer Mitarbeit in der Arbeitsgruppe zu HDHS realisiert werden.

5.3 Apparative Ausstattung

Eine apparative Ausstattung steht durch die Institutionen der Antragsteller ebensowenig zur Verfügung wie eine Grundausstattung an EDV-Geräten. Das Projekt baut allerdings auf den vorhandenen Informationsstrukturen der beteiligten Wörterbücher auf und kann die in den Wörterbüchern oder der Heidelberger Universitätsbibliothek vorhandenen Geräte auch sporadisch nutzen.

5.4 Laufende Mittel für Sachausgaben

Als Eigenleistungen der Antragsteller sind unterschiedliche Komponenten zu berücksichtigen. Das Projekt beginnt innerhalb einer elaborierten lexikographischen und auch informellen Infrastruktur und kann die damit vorhandenen Ressourcen nutzen. Sie müssen nicht erst aufgebaut werden Dazu gehört beispielsweise die durch das DRW erarbeitete Struktur der Wörterbuchdaten in FAUST als Ausgangspunkt für das FWB und die Informationsstruktur im Internet, die Informationsinhalte (das gesamte Wörterbuch). Im Bereich der Software gehört dazu die Bildarchivversion von FAUST3, zu der lediglich fünf weitere Lizenzen über die zehn Lizenzen des DRW hinaus erforderlich sind. Ebenso stellen die bereits vorhandenen digitalen Texte und die ca. 10.000 in FAUST bereits vorhandenen Faksimiles eine Eigenleistung des DRW dar.
Von seiten des FWB kann der Text aller bisher erschienenen Lieferungen (vier Bände) sowie die Klassifizierung seiner Korpusquellen beigesteuert werden.

6. Erklärungen

6.1

Ein Antrag auf Finanzierung dieses Vorhabens wurde bei keiner anderen Stelle eingereicht. Wenn ich einen solchen Antrag stelle, werde ich die Deutsche Forschungsgemeinschaft unverzüglich benachrichtigen.

7. Unterschriften

gez. Dr. Heino Speer (Deutsches Rechtswörterbuch)

gez. Prof. Dr. Oskar Reichmann (Frühneuhochdeutsches Wörterbuch)

gez. Dr. Hermann Josef Dörpinghaus (Universitätsbibliothek Heidelberg)

8. Verzeichnis der Anlagen

Verzeichnis ausgewählter Sekundärliteratur

Abbildungen zur Belegbearbeitung im DRW (Ergänzung zu Teil 2.2.1. des Antrags)

Diskussion der Zusammenstellung des Quellenkorpus des FWB und Auszug aus dem Quellenverzeichnis

Prospekt der Firma Land-Software (FAUST)

Angebote zu den EDV-Geräten


2002-01-07