``` und Absätzen ``````
- ggf. Umwandlung von `````` zu `````` (auf Fall-für-Fall-Basis)
- Sammlung aller ``````-IDs in ``````
- Wikidata-IDs zu Autor*innen und Stücken
- mittlerweile 471 Stücke (Ergänzungen aus Wikisource, Gutenberg-DE, …)
--
## RusDraCor
- basierend auf verlässlichen Quellen wie lib.ru, rvb.ru, ilibrary.ru
- Konvertierung zu TEI-P5
- per Seitenzahlen Mapping auf die direkte Scanvorlage
- ``````, Wikidata
--
## ShakeDraCor
- abgeleitet von der [Shakespeare Folger Library](https://www.folgerdigitaltexts.org/)
- Beispiel: [*Hamlet*](https://dracor.org/shake/hamlet)
--
## In Planung
- IbsDraCor
- HolDraCor (aus der digitalen Edition [*Ludvig Holbergs skrifter*](http://holbergsskrifter.dk/holberg-public/view?docId=adm/HolbergsWritings.xml&sort=category))
- SweDraCor (von [*Dramawebben*](https://litteraturbanken.se/dramawebben))
- BashDraCor
- ItaDraCor (aus der Sammlung [*Letteratura teatrale nella Biblioteca italiana*](http://www.bibliotecaitaliana.it/))
- …?
---
# Kapitel 3.
## LiterAPIrwissenschaft ¹ ²
¹ API: Application Programming Interface (Anwendungsschnittstelle)
² Peter-Handke-Gesetz: [»Ein Wortspiel pro Text ist erlaubt.«](https://www.welt.de/119569452)
--
## DraCor Technology Stack
![Anzahl Figuren](images/dracor-drawio.svg)
Alle Repos sind Open Source: https://github.com/dracor-org
--
## DraCor-API (1/2)
- liefert Metadaten, maßgeschneiderte Auszüge sowie verschiedene Metriken
- Live-Dokumentation: https://dracor.org/documentation/api/
--
## DraCor-API (2/2)
- Liste erhältlicher Korpora und deren Inhalt (Liste aller Stücke)
- Metadaten und Netzwerkdaten zu allen Stücken als CSV oder GEXF
- Liste sprechender Figuren pro Stück (oft bedeutend umfangreicher als die *dramatis personae*!)
- Figuren pro Segment eines Stücks (dynamische Graphen!)
- gesprochener Text (gesamt/weibl./männl. oder pro Figur)
- Regieanweisungen
- SPARQL-Endpunkt
- …
--
## Beispiel
#### Anzahl von Figuren pro Stück in chronologischer Folge (1/2)
```R
library(data.table)
library(ggplot2)
library(httr)
resp <- GET("https://dracor.org/api/corpora/ger/metadata", accept("text/csv"))
metadata <- fread(content(resp, as = "text"), fill = T)
ggplot(metadata[], aes(x = yearNormalized, y = numOfSpeakers)) + geom_point()
```
Einfaches R-Script.
--
#### Anzahl von Figuren pro Stück in chronologischer Folge (2/2)
![Anzahl Figuren](images/num-of-speakers-gerdracor.png)
Ausgabe in RStudio.
---
# Kapitel 4.
## Programmable Corpora
--
## Zum Begriff
- Analogie zur IT-News-Plattform *ProgrammableWeb* (Slogan: »APIs, Mashups and the Web as Platform«)
- Korpora als vergleichbare Objekte, die selbst Funktionen anbieten und mit anderen Datenquellen verbunden sind (via LOD)
- FAIR-Prinzipien, bessere Reproduzierbarkeit
- Andockbarkeit auf allen Ebenen (TEI, API, R, Python, …)
- Überschneidungen mit [»sustainable editions«](https://twitter.com/ThWuebbena/status/1041639186326069248) (Thomas Stäcker)
- [RIDE](http://ride.i-d-e.de/data/charts-text-collections/) sammelt Metadaten zu besprochenen Editionen: »Are there technical interfaces which allow the reuse of the data of the text collection in other contexts?«
--
### Lessings *Emilia Galotti*
![Emilia Galotti (dynamic graph)](images/lessing-emilia-galotti-coloured.gif)
**Dynamischer Graph**, generiert mit dem [**ndtv**](https://cran.r-project.org/web/packages/ndtv/index.html)-Package. Die Daten kommen direkt aus der **DraCor-API**.
Script von Ivan Pozdniakov ([Sourcecode auf RPubs.com](https://rpubs.com/Pozdniakov/godunov)).
--
## Shiny App
![Shiny App](images/shiny-kaethchen.png)
https://shiny.dracor.org/ (von Ivan Pozdniakov).
--
## Boris Yarkho (1889–1942)
![Boris Yarkho (cropped)](images/boris-yarkho.jpg)
(Bildquelle: http://urokiistorii.ru/article/52560)
--
Boris Yarkho: ***Speech Distribution in Five-Act Tragedies (A Question of Classicism and Romanticism)*** (geschrieben 1935–1938).
Hrsg. von Frank Fischer, Marina Akimova und Boris Orekhov.
In: *Journal of Literary Theory*. [Vol. 13. No. 1: *»**Moscow Formalism and Literary History**«*](https://www.degruyter.com/view/j/jlt.2019.13.issue-1/issue-files/jlt.2019.13.issue-1.xml). De Gruyter 2019, S. 13–76.
DOI:[**10.1515/jlt-2019-0002**](https://doi.org/10.1515/jlt-2019-0002)
--
## Redeverteilung nach Yarkho
![Emilia Galotti, speech distribution](images/speech-distribution-lessing-emilia-galotti.png)
Implementiert in **DraCor** (hier für Lessings *Emilia Galotti*):
https://dracor.org/ger/lessing-emilia-galotti#speech
---
# Kapitel 5.
## Linked Open Data
--
## Anbindung an die
Linked-Open-Data-Cloud
- Beispiel: Lessings *Emilia Galotti* (1772)
- hat einen [Wikipedia-Artikel](https://de.wikipedia.org/wiki/Emilia_Galotti)
- hat einen Wikidata-Artikel mit Fakten:
https://www.wikidata.org/wiki/Q782653
--
## Uraufführungsorte in GerDraCor
![ezlinavis screenshot](images/first-performances-overall.png)
Via Wikidata:[P4647](https://www.wikidata.org/wiki/Property:P4647) (»location of first performance«).
--
## Urauführungsort Berlin in GerDraCor
![ezlinavis screenshot](images/first-performances-berlin.png)
Via Wikidata:[P4647](https://www.wikidata.org/wiki/Property:P4647) (»location of first performance«).
--
## Repräsentativität eines Korpus
| Stück | Anzahl Wikipedia-Links |
|:-----:|:----------------------:|
| Anton Tschechow: Der Kirschgarten | 35 |
| Anton Tschechow: Drei Schwestern | 34 |
| Nikolai Gogol: Der Revisor | 34 |
| Anton Tschechow: Die Möwe | 33 |
| Anton Tschechow: Onkel Wanja | 31 |
| Maxim Gorki: Nachtasyl | 12 |
| Alexander Puschkin: Boris Godunow | 12 |
| Alexander Gribojedow: Verstand schafft Leiden | 11 |
| Anton Tschechow: Iwanow | 10 |
| Nikolai Gogol: Die Hochzeit | 10 |
Die 10 international populärsten Stücke laut Wikipedia (RusDraCor umfasst momentan 144 Stücke).
---
# Kapitel 6.
## Laufende DraCor-Forschungsprojekte
--
Beispiel 1: Small-World-Phänomen in russischen Dramen
![Small-World-Phänomen in russischen Dramen)](images/rusdracor-small-world-preview.png)
Arbeit von Evgeniya Ustinova (Publikation in Vorbereitung).
--
Beispiel 2: Topics im gesprochenen Text russischer Dramen
![Topics)](images/rusdracor-topics-per-author.png)
Arbeit von Irina Pavlova ([Abstract](https://eadh2018.exordo.com/files/papers/158/final_draft/Pavlova___Fischer_-_Topic_Modeling_-_EADH_conference.pdf)).
--
Beispiel 3: Regieanweisungen
![Regieanweisungen)](images/rusdracor-didascalie-all-pos.png)
Arbeit von Daria Maximova ([Abstract](https://eadh2018.exordo.com/files/papers/79/final_draft/Stage_Directions_for_EADH_Conference.pdf)).
--
Beispiel 4: Female/Male Character Word Usage
![Female/Male Character Word Usage)](images/rusdracor-craigs-zeta.jpg)
Arbeit von Skorinkin/Fischer/Palchikov ([Artikel](http://www.dialog-21.ru/media/4332/skorinkind.pdf)).
---
## Zusammenfassung
allgemein:
- Konzept der **Programmable Corpora** für Forschung und Lehre
speziell:
- **dracor.org**: Forschungsinfrastruktur zum europäischen Drama:
- verlässliche, erweiterbare Korpora in mehreren Sprachen (→ komparatistische Ansätze)
- Open-Source-Projekt: lurken, forken, pull requests
--
Vielen Dank.
https://dracor.org/
#LiterAPIrwissenschaft
#ProgrammableCorpora