27.06.2023
Korpusdaten - Konvertierung und Extraktion
Datum: | 27.06.2023, 12-14 Uhr |
---|---|
Ort: | online |
Titel: | Workshop "Korpusdaten - Konvertierung und Extraktion" |
Organisator*innen: | Team FernUniversität Hagen, Josef Ruppenhofer und Torsten Zesch |
Inhalt:
Der Workshop richtet sich an alle, die sich für technische Aspekte der Korpusaufbereitung und -nutzung interessieren. Zentrale Gegenstände sind die Betrachtung verschiedener Daten- und Dateiformate (z.B. XML, JSON, PDF, Word oder Excel) hinsichtlich ihrer Eignung als Speicher- oder Verarbeitungsformate und der Umgang mit Zeichensätzen und -codes, darunter Unicode. In einem praktischen Teil haben die Teilnehmer:innen Gelegenheit, die Verwendung von regulären Ausdrücken zum Zweck der Informationsextraktion aus Plain text-Daten beziehungsweise zur Umformatierung solcher Daten einzuüben.