By
Berlin-Brandenburgische Akademie der Wissenschaften
Das Deutsche Textarchiv stellt einen disziplinen- und gattungsübergreifenden Grundbestand deutschsprachiger Texte mit einem Schwerpunkt ab dem frühen 16. bis zum frühen 20. Jahrhundert bereit. Hauptziel des von der Deutschen Forschungsgemeinschaft (DFG) von 2007 bis 2016 geförderten Projekts war die Erstellung des sog. DTA-Kernkorpus. Dieses DTA-Kernkorpus umfasst etwa 1500 Titel aus dem Zeitraum von ca. 1600 bis 1900, die aufgrund ihrer herausragenden Bedeutung für die Entwicklung der deutschen Sprache bzw. der jeweiligen Genres und wissenschaftlichen Disziplinen ausgewählt wurden (weitere Informationen zur Textauswahl). Unter anderem aufgrund des sprachgeschichtlichen Fokus des DTA und um den historischen Sprachstand möglichst genau abzubilden, wurden dabei als Vorlage für die Digitalisierung in der Regel die historischen Erstausgaben ausgewählt (Auswahl der Exemplare für die Digitalisierung).
Über das DTA-Kernkorpus hinaus integriert das DTA eine Vielzahl weiterer Texte aus dem Zeitraum etwa von der Mitte des 15. bis etwa zur Mitte des 20. Jahrhunderts als DTA-Erweiterungen (DTAE), die aus kooperierenden Projekten und weiteren externen Quellen stammen.
Das elektronische Volltextkorpus des DTA ist über das Internet frei zugänglich und dank seiner Aufbereitung durch (computer-)linguistische Methoden schreibweisentolerant über den gesamten jeweils verfügbaren Bestand durchsuchbar. Sämtliche Texte stehen zum Download zur Verfügung.
Publisher
Hosting / Distributor
Zentrum Sprache der Berlin-Brandenburgischen Akademie der Wissenschaften
Frequency
Language
Country