Vorlesung: VL (B.A.): Projekt Computerlinguistik / Digital Humanities: Build! Your! Own! Corpus! - Details

Vorlesung: VL (B.A.): Projekt Computerlinguistik / Digital Humanities: Build! Your! Own! Corpus! - Details

Sie sind nicht in Stud.IP angemeldet.

Allgemeine Informationen

Veranstaltungsname Vorlesung: VL (B.A.): Projekt Computerlinguistik / Digital Humanities: Build! Your! Own! Corpus!
Semester SS 2025
Aktuelle Anzahl der Teilnehmenden 3
Heimat-Einrichtung Angewandte Computerlinguistik
Veranstaltungstyp Vorlesung in der Kategorie Lehre
Nächster Termin Montag, 28.04.2025 15:45 - 17:15, Ort: (D, 2127a)
Veranstaltung findet in Präsenz statt / hat Präsenz-Bestandteile Ja
Hauptunterrichtssprache deutsch
Weitere Unterrichtssprache(n) englisch

Räume und Zeiten

(D, 2127a)
Montag: 15:45 - 17:15, wöchentlich (12x)

Modulzuordnungen

Kommentar/Beschreibung

Die Veranstaltung soll Studierende in die Lage versetzen, selbständig eigene, annotierte Korpora aufzubauen und auszuwerten. Korpora sind strukturierte und inhaltlich angereicherte Sammlungen textueller oder anderer sprachlicher Daten. Sie repräsentieren die wesentliche empirische Grundlage von Sprachwissenschaft, Computerlinguistik, digitalen Geisteswissenschaften und Sprachtechnologie, allerdings sind viele dieser Auswertungen zwangsläufig auf bereits existierende Korpora beschränkt.
Die Vorlesung “Build! Your! Own! Corpus!” vermittelt die theoretischen und technischen Grundlagen für den eigenständigen Aufbau von Korpora. Dies beinhaltet die Gewinnung von Primärdaten (Print oder Audio), ihre Digitalisierung durch Texterkennung (OCR) bzw. Spracherkennung (Text-to-Speech), ihre Aufbereitung als digitales Korpus, ihre linguistischen Annotation mit automatischen und manuellen Methoden, ihre Verfügbarmachung als digitale Datenbank und ihre quantitative und qualitative Auswertung.
In der begleitenden Übung werden die Studierenden angeleitet, in betreuten Kleingruppen selbständig jeweils ein Korpus oder Subkorpus zu erstellen, zu annotieren und bereitzustellen. Hierfür werden von den Lehrveranstaltern verschiedene Datengrundlagen bereitgestellt, um Studierenden unterschiedlicher Sprach- und Geisteswissenschaften zu ermöglichen, mit Daten ihrer jeweiligen Disziplin (ANIS, Germanistik, Anglistik, Germanistik, Romanistik, Mediävistik) zu arbeiten. Die Bearbeitung eigener Korpusdaten kann auf Wunsch ermöglicht werden.
Im Ergebnis werden die Studierenden dahingehend ertüchtigt, eigene Korpora auf selbst gewählter Datengrundlage zu entwickeln und auszuwerten, was beispielsweise zur Vorbereitung einer einschlägigen Abschluss- oder Qualifikationsarbeit genutzt werden oder diese vorbereiten kann.

Anmelderegeln

Diese Veranstaltung gehört zum Anmeldeset "Anmeldeset: ACoLi SoSe 2025".
Folgende Regeln gelten für die Anmeldung:
  • Die Anmeldung ist möglich von 10.03.2025, 00:00 bis 25.04.2025, 23:59.