Abschnittsübersicht
-
Dozent: Adrian Pachzelt
Der Workshop gibt einen Einblick in die Python-basierte Auf- und Bereinigung von Texten, die einer automatischen Texterkennung (OCR) unterzogen worden sind und einer Nachbearbeitung bedürfen. Die Teilnehmer bekommen eine Grundlage für die Programmiersprache Python vermittelt und wie XML-Dateien (ABBYY-OCR-Format) bearbeitet werden können. Die vermittelten Fähigkeiten lassen sich anschließend leicht auf andere XML-Manipulationen übertragen.
Link: https://www.python.org/
Link: https://pynewbs.com/1a/