• search hit 1 of 2
Back to Result List

Consistent Estimation in Household Surveys

  • This dissertation deals with consistent estimates in household surveys. Household surveys are often drawn via cluster sampling, with households sampled at the first stage and persons selected at the second stage. The collected data provide information for estimation at both the person and the household level. However, consistent estimates are desirable in the sense that the estimated household-level totals should coincide with the estimated totals obtained at the person-level. Current practice in statistical offices is to use integrated weighting. In this approach consistent estimates are guaranteed by equal weights for all persons within a household and the household itself. However, due to the forced equality of weights, the individual patterns of persons are lost and the heterogeneity within households is not taken into account. In order to avoid the negative consequences of integrated weighting, we propose alternative weighting methods in the first part of this dissertation that ensure both consistent estimates and individual person weights within a household. The underlying idea is to limit the consistency conditions to variables that emerge in both the personal and household data sets. These common variables are included in the person- and household-level estimator as additional auxiliary variables. This achieves consistency more directly and only for the relevant variables, rather than indirectly by forcing equal weights on all persons within a household. Further decisive advantages of the proposed alternative weighting methods are that original individual rather than the constructed aggregated auxiliaries are utilized and that the variable selection process is more flexible because different auxiliary variables can be incorporated in the person-level estimator than in the household-level estimator. In the second part of this dissertation, the variances of a person-level GREG estimator and an integrated estimator are compared in order to quantify the effects of the consistency requirements in the integrated weighting approach. One of the challenges is that the estimators to be compared are of different dimensions. The proposed solution is to decompose the variance of the integrated estimator into the variance of a reduced GREG estimator, whose underlying model is of the same dimensions as the person-level GREG estimator, and add a constructed term that captures the effects disregarded by the reduced model. Subsequently, further fields of application for the derived decomposition are proposed such as the variable selection process in the field of econometrics or survey statistics.
  • Diese Dissertation beschäftigt sich mit konsistenten Schätzungen in Haushaltsstichproben. Haushaltsstichproben werden häufig als Klumpenstichprobe realisiert, das heißt auf der ersten Stufe werden die Haushalte gezogen und auf der zweiten Stufe die Personen innerhalb eines Haushaltes. Die gewonnenen Daten stellen Informationen über Personen und Haushalten zur Verfügung. Dabei stellt sich die Frage, inwiefern konsistente Schätzungen auf Personen- und Haushaltsebene gewährleistet werden können. In der bisherigen Praxis verwenden die Statistischen Ämter die integrierte Gewichtung, wobei allen Personen innerhalb eines Haushaltes und dem Haushalt selbst das gleiche Gewicht zugeordnet wird. Aufgrund der erzwungenen Gleichheit der Gewichte gehen jedoch die individuellen Muster der Personen verloren, ebenso wird die Heterogenität der Haushalte nicht beachtet. Um die negativen Auswirkungen der integrierten Gewichtung zu vermeiden, schlagen wir im ersten Teil der Dissertation alternative Gewichtungsverfahren vor, welche sowohl konsistente Schätzungen gewährleisten als auch individuelle Gewichte innerhalb eines Haushaltes zulassen. Die zugrundeliegende Idee ist es die Konsistenzbedingung auf Variablen zu beschränken, die sowohl im Personen- als auch im Haushaltsdatensatz vorkommen. Diese gemeinsamen Variablen werden als zusätzliche Hilfsmerkmale in die Schätzung auf Personen- und Haushaltsebene mit aufgenommen. Damit wird Konsistenz direkter und nur für die relevanten Merkmale erreicht, anstatt indirekt durch den Zwang gleicher Gewichte für alle Personen eines Haushaltes. Weitere Vorteile der vorgeschlagenen Gewichtungsverfahren sind, dass die originalen individuellen Hilfsmerkmale anstatt der konstruierten Mittelwerte der Haushalte verwendet werden und dass auf Personen- und Haushaltsebene separate Gewichtungsmodelle implementiert werden können, wodurch die Flexibilität in der Variablenselektion erhöht ist. Um die Effekte der Konsistenzbedingung im integrierten Gewichtungsansatz abschätzen zu können, werden im zweiten Teil der Dissertation die Varianzen eines GREG Schätzers auf Personenebene und eines integrierten Schätzer verglichen. Die Herausforderung besteht unter anderem darin, dass die zu vergleichenden Schätzer unterschiedlicher Dimensionen sind. Als Lösungsansatz wird eine Zerlegung der Varianz des integrierten Schätzers vorgeschlagen in die Varianz eines reduzierten GREG Schätzers, dessen Modell die gleichen Dimension hat wie das Modell auf Personenebene, und einen Restterm, der die vom reduzierten Modell unberücksichtigten Effekte erfasst. Anschließend werden weitere Anwendungsfelder für die vorgeschlagene Zerlegung im Bereich der Variablenselektion in der Ökonometrie oder Survey Statistik diskutiert.

Download full text files

Export metadata

Metadaten
Author:Anne Konrad
URN:urn:nbn:de:hbz:385-1-12356
DOI:https://doi.org/10.25353/ubtr-xxxx-438d-49c8
Referee:Ralf Münnich, Yves Berger
Document Type:Doctoral Thesis
Language:English
Date of completion:2019/09/16
Publishing institution:Universität Trier
Granting institution:Universität Trier, Fachbereich 4
Date of final exam:2019/03/22
Release Date:2019/12/05
Tag:Regression estimator, household surveys, calibration, weighting, integrated weighting
GND Keyword:Amtliche Statistik; Haushalt; Schätzfunktion; Stichprobe
Number of pages:239
Institutes:Fachbereich 4
Dewey Decimal Classification:3 Sozialwissenschaften / 31 Statistiken / 310 Sammlungen allgemeiner Statistiken
Licence (German):License LogoCC BY-NC-SA: Creative-Commons-Lizenz 4.0 International

$Rev: 13581 $