Abschnittsübersicht

  • Dozent: Adrian Pachzelt

    Der Workshop gibt einen Einblick in die Python-basierte Auf- und Bereinigung von Texten, die einer automatischen Texterkennung (OCR) unterzogen worden sind und einer Nachbearbeitung bedürfen. Die Teilnehmer bekommen eine Grundlage für die Programmiersprache Python vermittelt und wie XML-Dateien (ABBYY-OCR-Format) bearbeitet werden können. Die vermittelten Fähigkeiten lassen sich anschließend leicht auf andere XML-Manipulationen übertragen.

    Link: https://www.python.org/

    Link: https://pynewbs.com/1a/