UniNE > institut de statistique >
    annuaire    plan du site    accès    contact
 
institut de statistique



 
 
 
 
 
 
 



institut pratique 
Emplois
 


 
recherche et développements  

Recherches réalisées ou en cours

1/ Variance estimation via resampling methods in survey methodology, Erika Antal, supervised by Yves Tillé

The resample methods like the bootstrap and the jackknife are at present largely used for estimating the variance in practically all the statistical problem. Nevertheless, in survey sampling the variances depend on the sampling design and can have a complex form when the sampling design is sophisticated. We are working on a new resampling method for estimating the variance; it consists of selecting a subsample directly in the initial sample in a way that can reproduce an exact estimator of variance in the linear cases.

2/ Measures of Inequalities in Sampling from Finite Population, Yves Tillé - Matti Langel, supervised by Yves Tillé

The main goal is to evaluate the adequacy of the choice of the inequalities indicators from a statistical point of view and to eventually propose several alternatives. One of the essential questions that research on inequalities should aim to answer is straightforward: Are inequalities increasing? To provide credible statistical answers to this question, the estimation of variance and the construction of confidence intervals are imperative. Therefore, the estimation of variance will be a major focus of this study. This research is supported by grant no. 200021-121604 of the Swiss National Science Foundation.

3/ Développement des fondations de l'inférence, Desislava Nedyalkova et Yves Tillé

D. Nedyalkova et Y. Tillé ont clôturé une étude théorique sur les fondements de l'inférence dans les populations finies. Deux approches habituellement considérées comme antagonistes sont utilisées par les statisticiens d'enquête. La première approche, basée sur le plan de sondage, vise à construire des estimateurs asymptotiquement sans biais sous le plan de sondage tout en incorporant une information auxiliaire issue de données censitaires. La seconde approche consiste à modéliser la population. Les paramètres du modèle sont estimés et les valeurs des unités non-échantillonnées sont ensuite prédites, ce qui permet d'estimer les paramètres de la population. Ces deux approches fournissent habituellement des estimateurs complètement différents. Cependant D. Nedyalkova et Y. Tillé ont montré qu'en sélectionnant judicieusement le plan de sondage, il est possible de construire des estimateurs qui sont optimaux sous les deux approches. Un articlé rédigé sur base de cette recherche est déjà paru dans Biometrika. Suite à ce travail, D. Nedyalkova et Y. Tillé ont rédigé un article sur la robustesse des couples plan-estimateur sous l'approche basée sur le modèle. Une application au modèle polynomial est proposée. Cet article a été soumis pour publication à une revue internationale.

4/ Estimation de la précision des indices d'inégalités de l'enquête SILC

Anne Massiani travaille, depuis septembre 2009, sur l'estimation de la précision d'indices d'inégalité dans le cadre complexe de l'enquête SILC. Ce travail repose sur des techniques de linéarisation et s'appuie notamment sur des développements récents proposés par Langel et Tillé (cf. paragraphe précédent). Dans un premier temps, les calculs ont été effectués sous les hypothèses simplificatrices utilisées par Eurostat (qui ne tiennent pas compte des effets dus aux imputations). Ce travail doit maintenant se poursuivre de façon à intégrer dans les calculs tous les aspects de la réalisation de l'enquête.

5/ Stratégies d'estimation sous un plan de sondage assistées par des modélisations linéaires mixtes et Calage pénalisé

Fabien Guggemos et Yves Tillé ont poursuivi la recherche sur les stratégies d'estimation basées sur des modélisations de la population par des modèles linéaires mixtes afin de proposer une généralisation des procédures model-based pour l'estimation de combinaisons linéaires quelconques de la variable d'intérêt dans le cas de structures de variance complexe et à faire ressortir des bornes d'efficacité. Cela les a ensuite conduits à établir une unification des approches de Royall et d'Henderson et à dresser une analyse critique des techniques utilisées aujourd'hui, en particulier pour les petits domaines. Par suite, la prise en compte de structures de corrélation complexe dans les stratégies design-based a constitué un autre élément essentiel des recherches menées cette année. Les techniques de calage, très couramment employées, reposent en effet implicitement sur des modèles linéaires simples pour lesquels la matrice de variance est diagonale. Fabien Guggemos et Yves Tillé ont ainsi proposé et défini la notion de calage pénalisé, qui répond au problème fixé et peut être vu simultanément comme une généralisation du calage et une alternative design-based à l'estimation purement basée sur des modélisations mixtes. Deux articles ont été soumis pour publications.

6/ Spatio-Temporal Processes, Anthea Monod

The intended field of my doctoral research is spatio-temporal statistics, where the data concerned are multivariate, geographically referenced and temporally correlated.  The focus will be placed on the particular case of integer-valued space-time data, and addressing the frequently occuring problem of overdispersion where integer-valued data are concerned.  Overdispersion refers to the phenomenon where the specification of the variance of a parametric model is overly restrictive, and the practical variance of the data is larger than the theoretical model allows; a particular cause is the abundance of zero-valued observations in the data, in which case traditional methods for handling overdispersion prove to be inadequate.  My doctoral research will pursue the development of methods to address zero-inflation and more generally overdispersion in space-time data, in the context of generalized linear models comprising random effects, from a frequentist perspective.  For frequentist inference, the specification of the covariance structure is pivotal in statistical inference; as such, attention will also be placed on the development of covariance models for space-time processes.

7/ Coordination des échantillons

Suite au projet FNRS n° FN205121-105187/1 'Evaluation and improvement of techniques for sampling co-ordination' trois articles ont été publiés. Ces recherches sont utilisées dans le domaine des statistiques publiques d'entreprises. Un algorithme de sélection d'échantillons coordonnés reposant sur une méthode de numéros aléatoires permanents a été proposée par Y. Tillé et L. Qualité pour répondre aux besoins de l'OFS. Cet algorithme a été implémenté par L. Qualité et a été mis en production à l'OFS en 2009. Les travaux actuels portent sur l'intégration de cette méthode de sélection dans le système d'enquêtes auprès des entreprises : choix des règles de coordination parmi les options possibles, adaptation et optimisation des plans de sondage, évaluation de la charge d'enquête et valorisation du nouveau système.

8/ Advanced statistical modelling among Hedge Funds Categories, Donatien Tafin

The present research intends to delve into the world of alternative investment strategies. We aim to model correlations and nonlinear statistical relations among hedge fund investment strategies and between hedge funds categories and broad asset classes, to improve our understanding of the highly dynamic, complex investment profile of the vehicle and its systematic exposure to the market.

In this period of intense debate over the structure of the financial industry and how its architecture should be redesigned to safeguard it against future crises, the implementation of advanced statistical techniques to model and better understand hedge funds-like returns, will highlight a set of implications for asset allocation, performance analysis as well as better risk management practices.

9/ Développement du module d'échantillonnage 'sampling' en langage R

Un package d'échantillonnage et d'estimation pour des enquêtes a été développé à partir de 2005 par Yves Tillé et Alina Matei. Ce package est disponible sur le site web du langage R
(voir : http://cran.r-project.org/src/contrib/Descriptions/sampling.html).

Il comprend l'implémentation des algorithmes d'échantillonnage modernes décrits dans Tillé (2006). La dernière version du package est la version 2.3 (décembre 2009). La priorité est mise sur les méthodes de calage, l'estimation de variance et le traitement de la non-réponse.

10/ Valuation ratios: do they really have anything to say about the long-run stock market outlook: is there any statistical evidence - C. Starica

Since the end of the 80's a number of papers have investigated and documented the use of price-earnings ratio and divident-price ratios as forecasting variables for future stock price changes. The main statistical tool applied by the researchers is the linear regression model. Due to the special structure of the variables in the regression, the common work hypothesis under which the regression estimators are unbiased and asymptotically normal are violated.  Correcting for the bias strongly reduces the evidence of predictability and an out-of-sample forecasting exercise shows that no winning strategy can be constructed based on signals given by the valuation ratios.