Weekly outline
-
In dieses kollaborative Dokument können Themenvorschläge für die Hands-on-Sessions eingetragen werden.
Informationen zur Anmeldung und Kurszeiten unter: http://www.ub.uni-frankfurt.de/digitalhumanities
-
Dozentin: Agnes Brauer
Der Workshop führt in die Grundlagen der Textauszeichnung mit TEI ein, einer XML-basierten und sich mittlerweile als De-facto-Standard etablierten Auszeichnungssprache speziell für die Zwecke der Geisteswissenschaften. Nach einer knappen allgemeinen Einführung werden die Teilnehmer anhand einer kleinen Übung die Praxis der Textauszeichnung mit TEI kennenlernen und sich einen ersten Überblick über die Bedeutung und die verschiedenen Module dieser Sprache verschaffen.
Link: http://www.tei-c.org/ -
Dozentin: Agnes Brauer
-
Dozentin: Agnes Brauer
Der Workshop baut auf der Einführung in TEI/XML auf und vermittelt einen Einblick in die Abfragesprache XPath, die es erlaubt, gezielt Informationen aus XML-Dokumenten abzugreifen und für weitere Anwendungen (z.B. Transformationen mit XSLT) zur Verfügung zu stellen.
Links:
https://www.w3.org/TR/xpath-31/
https://www.w3schools.com/xml/xsl_functions.asp -
Dozentin: Agnes Brauer
Der Workshop führt in das Web Scraping mithilfe des einfach zu bedienenden Chrome-Plugins Scraper ein, das Daten und Informationen strukturiert aus dem Web extrahiert und für weitere Auswertungs-/Forschungszwecke in Tabellen aufbereitet.
Download-Link: https://chrome.google.com/webstore/detail/scraper/mbigbapnjcgaffohmbkdlecaccepngjd
Links zu Übungsdaten:
- https://www.geschichtsquellen.de/index.html
- http://sammlungen.ub.uni-frankfurt.de/schopenhauer/nav/index/all?max=100
- https://www.deutsche-digitale-bibliothek.de/searchresults?isThumbnailFiltered=true&query=b%C3%BCchner&viewType=list&rows=100&offset=0
- https://www.youtube.com/watch?v=XQgXKtPSzUI
-
Dozentin: Agnes Brauer
-
Dozent: Jakob Frohmann
Der Workshop stellt das Tool OpenRefine vor, mit dessen Hilfe (nicht nur) unordentliche Daten aufbereitet, bereinigt, in eine andere Form überführt oder umstrukturiert werden können. Das Arbeiten mit Daten aller Art, beispielweise aus einer umfangreichen (Excel-) Tabelle, kann dadurch sehr erleichtert werden. Außerdem bietet OpenRefine die Möglichkeit, die eigenen Datensätze online mit anderen Datenbanken automatisiert abzugleichen und anzureichern (z.B. mit Orts- oder Personendaten aus Wikidata), wodurch umständliche einzelne Abfragen vermieden werden können.Link: http://openrefine.org/ -
Bitte bringen Sie zur Hands-on Übung eigene Daten in Tabellenform mit, an denen Sie die Arbeit mit Open Refine ausprobieren können. Das kann alles sein: bibliografischen Daten zu Ihrer letzten Seminararbeit, "unordentliche" Adresslisten (keine Angst - bleibt auf Ihrem Computer!) oder Tabellen, die Sie zum Beispiel im Zuge der Auswertung von Quellentexten erstellt oder aus wissenschaftlichen Datenbanken heruntergeladen haben.
Oder kontaktieren Sie mich gerne, wenn Sie Ideen oder Wünsche haben, welche Daten wir gemeinsam als Beispiele benutzen könnten.
Blog-Tipps:
https://histhub.ch/cat/net/blog/openrefine/
http://blog.lobid.org/2018/08/27/openrefine.html
http://blog.lobid.org/2018/09/04/zdb.html
Dozent: Jakob Frohmann
-
Dozent: Adrian Pachzelt
Der Workshop gibt einen Einblick in die Python-basierte Auf- und Bereinigung von Texten, die einer automatischen Texterkennung (OCR) unterzogen worden sind und einer Nachbearbeitung bedürfen. Die Teilnehmer bekommen eine Grundlage für die Programmiersprache Python vermittelt und wie XML-Dateien (ABBYY-OCR-Format) bearbeitet werden können. Die vermittelten Fähigkeiten lassen sich anschließend leicht auf andere XML-Manipulationen übertragen.
Link: https://www.python.org/
Link: https://pynewbs.com/1a/
-
Dozent: Adrian Pachzelt
Bitte installieren Sie vor dem Kurs das Programm "Anaconda" (welches mit Python3.7 und Jupyter Notebook ausgeliefert wird) auf Ihrem Notebook (Downloadlink). Während der Installation wird Ihnen angeboten, dass Sie "Microsoft Visual Studio Code (VSCode)" installieren können. Diesen Schritt können Sie überspringen.