Giuliano Merz

http://www.a-ch-d.eu
Ein Portal zur deutsche Sprache

BUNT IST DIE SPRACHE
Wörter & Wortformen

Aus einem Korpus[1] von genau 3 Millionen Sätzen, welche 50.190.175 Wortformen ergeben, wurden die 5000 häufigsten für die Zwecke dieser Sektion des Portals ermittelt.

Hier werden die Listen - in Tausender eingeteilt - zur Verfügung gestellt[2].

1 - 1000 1001 - 2000 2001 - 3000 3001 - 4000 4001 - 5000

 

[1] Der hier erwähnte und benutzte Sprachausschnitt ist Teil eines Korpus der Universität Leipzig, welches z.Zt. rund 1,5 Mrd. laufende  Wörter (entspricht ca. 100 Mio. Sätzen) umfaßt; S. http://wortschatz.uni-leipzig.de/. Dort wurden verschiedene Quellen digitalisiert; nachfolgend die wichtigsten Daten dazu:

 PRINTMEDIEN:

  • Arbeitsrechtliche Praxis

  • Berliner Zeitung

  • Bild

  • bild der wissenschaft

  • Brigitte

  • Computerzeitung

  • Der niedergelassene Chirurg

  • Die Zeit

  • FAZ

  • FREITAG

  • Financial Times Deutschland

  • Finanznachrichten

  • Frankfurter Rundschau

  • Hamburger Abendblatt

  • Junge Freiheit

  • Junge Welt

  • Leipziger Volkszeitung

  • Lübecker Nachrichten

  • Netzeitung

  • Neue Juristische Wochenschrift

  • Neues Deutschland

  • OTS-Newsticker

  • Rheinischer Merkur

  • Schweizer Wirtschaft

  • Schweriner Volkszeitung

  • Spektrum der Wissenschaft

  • Stuttgarter Zeitung

  • Süddeutsche Zeitung

  • Tagesspiegel

  • TAZ

 ONLINE-MEDIEN

  • ARD - Tagesschau

  • Das grosse Lexikon der Weltgeschichte

  • Kindlers Literaturlexikon

  • Lexikon des Films

  • literaturkritik.de

  • N-TV Online

  • Official Journal of the EU

  • Projekt Gutenberg

  • Spiegel Online

  • tagesspiegel.de

  • Telepolis

  • UB Media - Gesetze

  • ZDF Heute

 

 

 

 

 

 

Für alle gilt:
ZEITRAUM 1995-2006
(mit vereinzelten 'Belegen' aus 1993-1994)

[2] Hinweis: Wenn synsemantische Elemente (diese werden auch Funktionswort, grammatisches Wort, Strukturwort genannt; also Artikel, Konjunktion, Partikel, Präposition, Pronomen...) mit Großbuchstaben beginnen und so in der Auflistung stehen, heißt es, daß sie in den Texten am Anfang eines Satzes oder einer direkten Rede bzw. nach Doppelpunkt gestanden haben.