- search hit 1 of 1
Evaluation of Small Area Techniques for Applications in Official Statistics
Evaluation von Small Area Verfahren zur Anwendung in der amtlichen Statistik
- In politics and economics, and thus in the official statistics, the precise estimation of indicators for small regions or parts of populations, the so-called Small Areas or domains, is discussed intensively. The design-based estimation methods currently used are mainly based on asymptotic properties and are thus reliable for large sample sizes. With small sample sizes, however, this design based considerations often do not apply, which is why special model-based estimation methods have been developed for this case - the Small Area methods. While these may be biased, they often have a smaller mean squared error (MSE) as the unbiased design based estimators. In this work both classic design-based estimation methods and model-based estimation methods are presented and compared. The focus lies on the suitability of the various methods for their use in official statistics. First theory and algorithms suitable for the required statistical models are presented, which are the basis for the subsequent model-based estimators. Sampling designs are then presented apt for Small Area applications. Based on these fundamentals, both design-based estimators and as well model-based estimation methods are developed. Particular consideration is given in this case to the area-level empirical best predictor for binomial variables. Numerical and Monte Carlo estimation methods are proposed and compared for this analytically unsolvable estimator. Furthermore, MSE estimation methods are proposed and compared. A very popular and flexible resampling method that is widely used in the field of Small Area Statistics, is the parametric bootstrap. One major drawback of this method is its high computational intensity. To mitigate this disadvantage, a variance reduction method for parametric bootstrap is proposed. On the basis of theoretical considerations the enormous potential of this proposal is proved. A Monte Carlo simulation study shows the immense variance reduction that can be achieved with this method in realistic scenarios. This can be up to 90%. This actually enables the use of parametric bootstrap in applications in official statistics. Finally, the presented estimation methods in a large Monte Carlo simulation study in a specific application for the Swiss structural survey are examined. Here problems are discussed, which are of high relevance for official statistics. These are in particular: (a) How small can the areas be without leading to inappropriate or to high precision estimates? (b) Are the accuracy specifications for the Small Area estimators reliable enough to use it for publication? (c) Do very small areas infer in the modeling of the variables of interest? Could they cause thus a deterioration of the estimates of larger and therefore more important areas? (d) How can covariates, which are in different levels of aggregation be used in an appropriate way to improve the estimates. The data basis is the Swiss census of 2001. The main results are that in the author- view, the use of small area estimators for the production of estimates for areas with very small sample sizes is advisable in spite of the modeling effort. The MSE estimates provide a useful measure of precision, but do not reach in all Small Areas the level of reliability of the variance estimates for design-based estimators.
- In Politik und Wirtschaft und damit in der amtlichen Statistik wird aktuell die präzise Schätzung von Kennzahlen für kleine Regionen oder Teile von Populationen, sogenannten Small Areas oder Domains, intensiv diskutiert. Die derzeit verwendeten designbasierten Schätzmethoden beruhen überwiegend auf asymptotischen Eigenschaften und sind somit bei großen Stichprobenumfängen zuverlässig. Bei kleinen Stichprobenumfängen hingegen greifen diese designbasierte Überlegungen oft nicht, weswegen für diesen Fall spezielle modellbasierte Schätzverfahren entwickelt wurden -- Die Small Area-Verfahren. Diese können zwar Verzerrungen aufweisen, haben dafür aber häufig kleinere mittlere quadratische Fehler (MSE) der Schätzung als designbasierte Schätzer. In dieser Arbeit werden sowohl klassische, designbasierte Schätzmethoden, als auch modellbasierte Schätzmethoden vorgestellt und miteinander verglichen. Der Fokus liegt hierbei auf der Eignung der verschiedenen Methoden für einen Einsatz in der amtlichen Statistik. Hierzu werden zunächst Theorie und geeignete Algorithmen für die benötigten statistischen Modelle vorgestellt, die als Grundlage für die darauf folgenden modellbasierten Schätzer dienen. Anschließend werden für Small Area Anwendung entwickelte Stichprobendesigns vorgestellt. Auf diesen Grundlagen aufbauend werden sowohl designbasierte Schätzer und als auch modellbasierte-Schätzverfahren entwickelt. Besondere Berücksichtigung findet hierbei der area-level empirisch besten Prädiktor für binomiale Variablen. Für diesen analytisch nicht lösbaren Schätzer werden numerische und Monte-Carlo Schätzverfahren vorgeschlagen und verglichen. Weiterhin werden für ihn Methoden zur Schätzung seines MSEs herausgearbeitet. Eine sehr beliebte und flexible Resampling-Methode, die im Bereich der Small Area Statistik viel Anwendung findet, ist der parametrische Bootstrap. Ein großer Nachteil des Verfahrens ist dessen hohe Computerintensivität. Um diesen Nachteil abzuschwächen, wird in dieser Arbeit erstmals eine Varianzreduktionsmethode für parametrische Bootstraps vorgeschlagen. Anhand von theoretischen Überlegungen wird das enorme Potential dieses Vorschlags nachgewiesen. Mit Hilfe einer Monte-Carlo Simulationsstudie wird gezeigt, wie starke Varianzreduktion mit dieser Methode in realistischen Szenarien erreicht werden kann. Diese kann bis zu 90% betragen. Dadurch wird tatsächlich die Nutzung vom parametrischen Bootstrap in Anwendungen in der amtlichen Statistik realisierbar. Schließlich werden die vorgestellten Schätzmethoden in einer großen Monte-Carlo Simulationsstudie in einer konkreten Anwendung für die schweizerische Strukturerhebung hin untersucht. Dabei werden Fragestellungen erörtert, die gerade für die amtliche Statistik von hoher Relevanz sind. Insbesondere sind dies: (a) Wie klein gegliedert dürfen Areas sein, ohne dass die Präzision der Schätzung ungeeignet wird? (b) Sind die Genauigkeitsangaben für die Small Area Schätzer reliabel genug, um sie für die Veröffentlichung zu nutzen? (c) Stören sehr kleine Areas bei der Modellierung der interessierenden Variablen? Und wird dadurch ein Verschlechterung der Schätzungen größerer und damit wichtigere Areas verursacht? (d) Wie können Kovariablen, die in verschiedenen Aggregationsebenen vorliegen auf geeignete Weise zur Verbesserung der Schätzung herangezogen werden. Als Datengrundlage dient die schweizerische Volkszählung von 2001. Die zentralen Ergebnisse sind, dass aus Sicht des Autors die Verwendung von Small Area Schätzern für die Produktion von Schätzwerten für Areas mit sehr geringen Stichprobenumfängen trotz des Modellierungsaufwandes ratsam ist. Die MSE-Schätzung bietet dabei ein brauchbares Maß der Präzision, erreicht aber nicht in allen Small Areas die Reliabilität wie die Varianzschätzung für designbasierte Schätzer.
Author: | Jan Pablo Burgard |
---|---|
URN: | urn:nbn:de:hbz:385-9378 |
DOI: | https://doi.org/10.25353/ubtr-xxxx-2d32-f845 |
Advisor: | Ralf Münnich |
Document Type: | Doctoral Thesis |
Language: | English |
Date of completion: | 2015/07/29 |
Publishing institution: | Universität Trier |
Granting institution: | Universität Trier, Fachbereich 4 |
Date of final exam: | 2013/11/08 |
Release Date: | 2015/07/29 |
Tag: | Mixed Models; Parametric Bootstrap; Small Area Mixed Models; Parametric Bootstrap; Small Area |
GND Keyword: | Amtliche Statistik; Statistik |
Institutes: | Fachbereich 4 / Wirtschaftswissenschaften |
Dewey Decimal Classification: | 3 Sozialwissenschaften / 31 Statistiken / 310 Sammlungen allgemeiner Statistiken |
MSC-Classification: | 62-XX STATISTICS / 62Dxx Sampling theory, sample surveys / 62D99 None of the above, but in this section |
62-XX STATISTICS / 62Fxx Parametric inference / 62F40 Bootstrap, jackknife and other resampling methods |