27.06.2023

Korpusdaten - Konvertierung und Extraktion

Datum: 27.06.2023, 12-14 Uhr
Ort: online
Titel: Workshop "Korpusdaten - Konvertierung und Extraktion"
Organisator*innen: Team FernUniversität Hagen, Josef Ruppenhofer und Torsten Zesch
Inhalt:

Der Workshop richtet sich an alle, die sich für technische Aspekte der Korpusaufbereitung und -nutzung interessieren. Zentrale Gegenstände sind die Betrachtung verschiedener Daten- und Dateiformate (z.B. XML, JSON, PDF, Word oder Excel) hinsichtlich ihrer Eignung als Speicher- oder Verarbeitungsformate und der Umgang mit Zeichensätzen und -codes, darunter Unicode. In einem praktischen Teil haben die Teilnehmer:innen Gelegenheit, die Verwendung von regulären Ausdrücken zum Zweck der Informationsextraktion aus Plain text-Daten beziehungsweise zur Umformatierung solcher Daten einzuüben.