Zugang zum Dokument

Huergo, Luis Augusto:

Multiple Imputationsmodelle für Knowledge Economy Indicators. Theorie, Implementierung und Verbesserungsvorschläge.

Multiple Imputation models for Knowledge Economy Indicators.

Datei(en):

Download PDF 3.291kB  




Zitierfähiger Link: Bitte nutzen Sie diese URL, um auf das Dokument zu verlinken oder es zu zitieren:
http://nbn-resolving.de/urn:nbn:de:bsz:21-opus-50771
URL: http://tobias-lib.uni-tuebingen.de/volltexte/2010/5077/
Hauptberichter: Schaich, Eberhard (Prof. Dr. Dr. h.c. mult.)
Fakultät: 04 Wirtschaftswissenschaftliche Fakultät
Fachgebiet/Einrichtung: 04 Abteilung Statistik, Ökonometrie und Empirische Wirtschaftsforschung
Dokumentart: Dissertation
Sprache: Deutsch
Erstellungsjahr: 2009
Publikationsdatum: 10.08.2010
Tag der mündlichen Prüfung: 02.01.2010
Kurze Inhaltszusammenfassung auf Deutsch Im Rahmen des Europäischen Projekts KEI wurde die Universität Tübingen
u.a. mit der Aufgabe betraut, einen mit 42% fehlenden Daten behafteten Datensatz zu rekonstruieren (imputieren), welcher die Grundlage für die Untersuchungen der anderen Partner-Institutionen darstellte.
Angesichts des hohen Anteils fehlender Werte wurde zur Imputation des Datensatzes ein Imputationsmodell ausgewählt, das sich in der Fachliteratur aufgrund seiner hohen Leistungsfähigkeit einer großen Beliebtheit erfreut.

Untersuchungen des Datensatzes haben jedoch ergeben, dass unterschiedliche Verletzungen der in diesem Basis-Modell getroffenen Annahme einer multivariaten Normalverteilung vorlagen, welche die Qualität der Imputationen gefährden konnten. Die Tatsache, dass die Stichproben per Definition von einem geringen Umfang sind, hat die Lage zusätzlich erschwert. Diese Annahmeverletzungen stellen jedoch keine Besonderheit des KEI-Datensatzes dar, sondern werden häufig in realistischen Datenlagen beobachtet.

Diese Arbeit hat sich daher auf sechs beobachtete Probleme konzentriert und versucht, sie weitmöglichst zu beheben:
1) Präsenz von Ausreißern z.B. aufgrund uneinheitlicher Definition der Indikatoren in den untersuchten Ländern.
2) Große Abweichungen der empirischen Verteilungen von der Normalverteiltheit.
3) Variablen meist strikt positiv.
4) Nichtlinearität der Beziehungen zwischen Variablen.
5) Kleine Stichproben.
6) Hoher Anteil an fehlenden Werten (NA's).
Die Vorgeschlagenen Lösungsansätze, welche die Leistungsfähigkeit computerintensiver Methoden wie MCMC-Verfahren und EM-Algorithmus mit modernen ökonometrischen Schätzverfahren kombinieren, versuchen das Basis-Imputationsmodell auf die besonderen Eigenschaften der Daten auszurichten.
Kurze Inhaltszusammenfassung auf Englisch Within the Sixth Framework Programme of the European commission the KEI (Knowledge Economy Indicators) project was entrusted with the development and improvement of composite indicators for the knowledge-based economy.
Particularly, the analysis of aggregation techniques and the behaviour of the resulting composite indicators was a key issue of the project.
In order to build the composite indicators, the availability of a complete dataset is needed. One single missing value (NA) may lead to a failure of the aggregation procedures. However, the KEI dataset has approximately 42% of missing values.
To cope with this situation, enhancements of some well established multiple imputation models which combine the powerful MCMC-methods and the EM-Algorithm with modern econometric techniques were proposed and implemented.


Kontrollierte Schlagwörter (Deutsch): Statistik
Freie Schlagwörter (Deutsch): MCMC , EM-Algorithmus , KEI , Multiple Imputation
Freie Schlagwörter (Englisch): EM-Algorithm , Multiple Imputation , Computational Statistics
DDC-Sachgruppe: Statistik
Gedruckte Kopie bestellen: POD-Logo Print-on-Demand
Lizenz: Lizenz-Logo  Veröffentlichungsvertrag mit Print-on-Demand