R Experte gesucht

Zürich, Pfäffikon ZH  ‐ Remote
Dieses Projekt ist archiviert und leider nicht (mehr) aktiv.
Sie finden vakante Projekte hier in unserer Projektbörse.

Beschreibung

Wir sind auf der Suche nach einem Statistiker, der sich mit dem polmineR Package auskennt und den folgenden Auftrag übernehmen kann:

Leistung:
Aufbereitung eines Datensatzes mit polmineR und Auswertung:
- Berechnung der LIX-Werte der einzelnen Fraktionen
- deskriptive Auswertung von einzelnen Begriffen

Honorar:
nach Vereinbarung

Deadline:
25.06.2019

Auftragsbeschreibung:

Für eine Abschlussarbeit benötige ich einen mit Hilfe von R/Studio R nutzbaren Korpus der Bundestagsplenarprotokolle.
Die Protokolle der aktuellen Debatte sind allesamt über die Homepage der Bundestagsverwaltung als .xml verfügbar.
Die Arbeit beschäftigt sich mit dem Thema Populismus. Einerseits solle der LIX für die einzelnen Fraktionen berechnet werden; andererseits soll auch eine Sentiment Analyse erfolgen. Außerdem sollen häufige Begriffe und die Häufigkeit einzelner Begriffe ausgewertet werden.
Prinzipiell gibt es mit PolmineR bereits einen Korpus — allerdings fehlt die aktuelle Legislaturperiode.

1. Für mein Forschungsvorhaben ist es wichtig, dass der Datensatz mit dem Datensatz aus dem PolmineR-Projekt vergleichbar ist.

„Das MigParl-Korpus der migrations- und integrationsbezogenen Debatten in den deutschen Parlamenten steht als linguistisch annotiertes und indiziertes Korpus zur Verfügung, das in die Corpus Workbench (CWB) eingepflegt worden ist. Die Analysen können mit dem R-Paket polmineR durchgeführt werden.“

2. Der Korpus sollte entsprechend der Vorgaben der Text Encoding Initiative (TEI) erfolgen.

„Die im PolMine-Projekt aufbereiteten Korpora werden aus Ausgangsformaten (pdf, plain text, html) in standardisierte XML-Formate übersetzt. Die Standardisierung erfolgt entspricht Vorgaben der Text Encoding Initiative (TEI)."

Beispiel: https://github.com/PolMine/GermaParlTEI/blob/master/16/BT_16_006.xml

3. Prinzipiell möchte ich folgende Analyse(n) für den Korpus der aktuellen Legislaturperiode wiederholen:

https://polmine.github.io/UCSSR/#1

Ich benötige eine ausfürhliche Dokumentation (inkl. Schritt für Schritt Anleitung) (vgl. mit dem Foliensatz).

Haben wir Ihr Interesse geweckt? Wir freuen uns auf Ihre Rückmeldung!
Start
ab sofort
Von
Novustat Statistik-Beratung Grünwald
Eingestellt
15.06.2019
Ansprechpartner:
Robert Grünwald
Projekt-ID:
1785316
Vertragsart
Freiberuflich
Einsatzart
100 % Remote
Um sich auf dieses Projekt zu bewerben müssen Sie sich einloggen.
Registrieren