R Experte gesucht

Canton of Zurich, Pfaeffikon  ‐ Remote
This project has been archived and is not accepting more applications.
Browse open projects on our job board.

Description

Wir sind auf der Suche nach einem Statistiker, der sich mit dem polmineR Package auskennt und den folgenden Auftrag übernehmen kann:

Leistung:
Aufbereitung eines Datensatzes mit polmineR und Auswertung:
- Berechnung der LIX-Werte der einzelnen Fraktionen
- deskriptive Auswertung von einzelnen Begriffen

Honorar:
nach Vereinbarung

Deadline:
25.06.2019

Auftragsbeschreibung:

Für eine Abschlussarbeit benötige ich einen mit Hilfe von R/Studio R nutzbaren Korpus der Bundestagsplenarprotokolle.
Die Protokolle der aktuellen Debatte sind allesamt über die Homepage der Bundestagsverwaltung als .xml verfügbar.
Die Arbeit beschäftigt sich mit dem Thema Populismus. Einerseits solle der LIX für die einzelnen Fraktionen berechnet werden; andererseits soll auch eine Sentiment Analyse erfolgen. Außerdem sollen häufige Begriffe und die Häufigkeit einzelner Begriffe ausgewertet werden.
Prinzipiell gibt es mit PolmineR bereits einen Korpus — allerdings fehlt die aktuelle Legislaturperiode.

1. Für mein Forschungsvorhaben ist es wichtig, dass der Datensatz mit dem Datensatz aus dem PolmineR-Projekt vergleichbar ist.

„Das MigParl-Korpus der migrations- und integrationsbezogenen Debatten in den deutschen Parlamenten steht als linguistisch annotiertes und indiziertes Korpus zur Verfügung, das in die Corpus Workbench (CWB) eingepflegt worden ist. Die Analysen können mit dem R-Paket polmineR durchgeführt werden.“

2. Der Korpus sollte entsprechend der Vorgaben der Text Encoding Initiative (TEI) erfolgen.

„Die im PolMine-Projekt aufbereiteten Korpora werden aus Ausgangsformaten (pdf, plain text, html) in standardisierte XML-Formate übersetzt. Die Standardisierung erfolgt entspricht Vorgaben der Text Encoding Initiative (TEI)."

Beispiel: https://github.com/PolMine/GermaParlTEI/blob/master/16/BT_16_006.xml

3. Prinzipiell möchte ich folgende Analyse(n) für den Korpus der aktuellen Legislaturperiode wiederholen:

https://polmine.github.io/UCSSR/#1

Ich benötige eine ausfürhliche Dokumentation (inkl. Schritt für Schritt Anleitung) (vgl. mit dem Foliensatz).

Haben wir Ihr Interesse geweckt? Wir freuen uns auf Ihre Rückmeldung!
Start date
ASAP
From
Novustat Statistik-Beratung Grünwald
Published at
15.06.2019
Contact person:
Robert Grünwald
Project ID:
1785316
Contract type
Freelance
Workplace
100 % remote
To apply to this project you must log in.
Register