CNR IMATI - Milano
Istituto di Matematica Applicata
e Tecnologie Informatiche

via Bassini 15 - 20133 Milano (Italy)

Giornata sul tema:

STATISTICA BAYESIANA NON PARAMETRICA

Giovedì 9 Ottobre 2003, presso la sede del C.N.R. (via Bassini 15 - 20133 Milano), aula Convegni (al piano terra), si svolgerà una giornata di studio su problemi di statistica bayesiana non parametrica.

Programma Provvisorio:

10.00 - 10.30 Teoria dei momenti generalizzati ed analisi di robustezza bayesiana: il caso non parametrico
Antonella BODINI
CNR-IMATI
10.30 - 11.00 Inferenza bayesiana nonparametrica con misure aleatorie normalizzate e a incrementi indipendenti
Antonio LIJOI
Dipartimento di Economia Politica e Metodi Quantitativi, Università di Pavia
11.00 - 11.30 Inferenza bayesiana nonparametrica sulla funzione di intensità
Luca LA ROCCA
Dipartimento di Matematica, Università di Pavia
11.30 - 12.00 Pausa caffè
12.00 - 12.30 Campionamento "size-biased" e inferenza bayesiana non parametrica discreta
Andrea ONGARO
Dipartimento di Statistica, Università degli Studi di Milano Bicocca
12.30 - 13.00 Come elicitare una iniziale nonparametrica?
Sonia PETRONE
Istituto di Metodi Quantitativi, Università Bocconi, Milano
13.00 - 13.30 Un modello bayesiano multifrattale per l'analisi e la simulazione dell'uso di dischi di elaboratori
Fabrizio RUGGERI
CNR-IMATI, Milano
13.30 - 14.30 Pausa pranzo
14.30 - 15.00 Rinforzo e scambiabilità finita
Pietro MULIERE
Istituto di Metodi Quantitativi, Univeristà Bocconi, Milano
15.00 - 15.30 Su una generalizzazione dell'urna di Polya
Anna PAGANONI
Dipartimento di Matematica, Politecnico di Milano
15.30 - 16.00 Sistemi di urne rinforzate interagenti
Piercesare SECCHI
Dipartimento di Matematica, Politecnico di Milano
16.00 - 16.30 Pausa caffè
16.30 - 17.00 Alcuni risultati preliminari sull'inferenza Bayesiana non parametrica per dati invarianti
Pietro RIGO
Dipartimento di Economia Politica e Metodi Quantitativi, Università di Pavia
17.00 - 17.30 Misture di alberi di Polya per la stima bayesiana non parametrica di densità di probabilità
Raffaello SERI
CNR-IMATI, Milano

Riassunti:

Antonella BODINI
Teoria dei momenti generalizzati ed analisi di robustezza bayesiana: il caso non parametrico

Nelle applicazioni dell'analisi bayesiana si incontra il problema della valutazione della sensibilità, o robustezza, della procedura inferenziale utilizzata rispetto alle componenti del modello statistico formulato. In particolare, risulta interessante studiare la robustezza rispetto alla distribuzione iniziale, quando non sia univocamente individuabile per insufficienza di informazioni, ma la si supponga variabile all'interno di una certa classe C. Lo scopo di questo seminario è illustrare il caso in cui la classe C è un insieme di misure iniziali non parametriche, definita attraverso condizioni sui momenti generalizzati.

Luca LA ROCCA
Inferenza bayesiana nonparametrica sulla funzione di intensità

La legge di una successione scambiabile di variabili positive può essere specificata tramite la funzione di intensità della sua legge di natura, quando quest'ultima possa considerarsi quasi certamente assolutamente continua. È un approccio alternativo alla stima bayesiana di densità, particolarmente interessante per modellare gli intertempi di una successione di eventi sismici. Si propone di costruire la funzione di intensità della legge di natura come mistura di convoluzione di una densità di probabilità mediante un processo di Poisson composito, fornendo una procedura per la scelta degli iperparametri che ha il pregio di essere invariante per cambiamento di scala. La legge finale può approssimarsi mediante tecniche di simulazione basate su catene di Markov, come si mostra su alcuni dati di esempio; i risultati ottenuti per diversi valori degli iperparametri sono fra loro coerenti.

Antonio LIJOI
Inferenza bayesiana nonparametrica con misure aleatorie normalizzate e a incrementi indipendenti

Le misure aleatorie a incrementi indipendenti possono essere impiegate per definire distribuzioni iniziali per l'inferenza bayesiana nonparametrica. Un celebre esempio è rappresentato dal processo di Dirichlet. Qui si prenderà in esame una classe di distribuzioni iniziali ottenute mediante la normalizzazione di misure aleatorie a incrementi indipendenti. Si dimostra che esse soddisfano alcune proprietà ben note del processo di Dirichlet. Nell'ipotesi che le osservazioni siano scambiabili, è possibile ottenere una rappresentazione delle leggi predittive che consiste di una combinazione lineare della distribuzione marginale e di una distribuzione empirica ponderata. Inoltre, la distribuzione finale ammette una caratterizzazione in termini di mistura.

Pietro MULIERE
Rinforzo e scambiabilità finita.

Supponiamo che un ricercatore sia interessato: i) a rinforzare le osservazioni passate nell'effettuare la previsione di una nuova osservazione; ii) alla nozione di scambiabilità finita. In questo seminario verrano presentate le conseguenze di queste due assunzioni.

Andrea ONGARO
Campionamento "size-biased" e inferenza bayesiana non parametrica discreta

In this work, we establish the connection between two different topics, i.e. size-biased sampling schemes and Bayesian updating mechanisms for a general class P of discrete nonparametric priors. By exploting this connection, we are able to use size-biased sampling theory to gain insight into the class P, to find representations of the class particularly suitable for applications to inference problems and to derive new general results about its posterior and predictive distributions and about the properties of a sample from P. Potential of the approach is illustrated via an investigation of a class of symmetric priors.

Anna PAGANONI
Su una generalizzazione dell'urna di Polya

Si considera una particolare generalizzazione di un'urna di Polya composta inizialmente da palline di due colori, e poi aggiornata ad ogni estrazione con un numero aleatorio di palline del colore estratto. La successione dei colori estratti da quest'urna è asintoticamente scambiabile; si può dimostrare una legge dei grandi numeri e approssimare in modo opportuno la distribuzione del limite.

Sonia PETRONE
Come elicitare una iniziale non parametrica?

Considererò il problema dell'elicitazione di una distribuzione iniziale nonparametrica (per dati continui). Proporrò alla discussione una possibile via, che consiste nel formulare una prima opinione su una versione semplificata della distribuzione incognita, e poi nell'interpolazione di tale valutazione. L'interpolazione proposta ricorre a misture di distribuzioni.

Pietro RIGO
Alcuni risultati preliminari sull'inferenza Bayesiana non parametrica per dati invarianti

Sotto condizioni generali, ogni legge invariante è un'unica mistura integrale di leggi ergodiche. Questo lascia sperare che sia possibile estendere al caso di dati con distribuzione invariante lo schema consueto dell'inferenza bayesiana non parametrica per dati scambiabili. Tale estensione, se effettivamente possibile, sarebbe di qualche interesse sul piano teorico (la scambiabilità è un caso molto particolare di invarianza) e su quello applicativo (ad esempio, diverrebbe possibile un'analisi bayesiana non parametrica di dati stazionari). Il punto cruciale è assegnare iniziali "ragionevoli" sulle leggi ergodiche, e calcolare (o perlomeno approssimare) le corrispondenti leggi finale e predittiva. Alcuni risultati molto preliminari in questo ambito vengono discussi. Una conseguenza di tali risultati, nel caso particolare di dati scambiabili, consente di gettare luce sulla distribuzione della variabile aleatoria P(A), dove A è un evento fissato, sotto una qualsiasi iniziale per P.

Fabrizio RUGGERI
Un modello bayesiano multifrattale per l'analisi e la simulazione dell'uso di dischi di elaboratori

Evaluating the performance of storage systems is a key aspect of the design and implementation of computers with heavy I/O workloads. Due to the difficulties and expenses involved in obtaining actual measurements of disk usage, disk performance simulators are usually fed with synthetic traces. As in many areas of computing and telecommunications, the time processes of disk usage exhibit dependencies that span over long ranges. In addition to the slow decaying of the auto-correlation function, the series have a bursty behaviour that can not usually be captured by commonly used times series methods. Also, when the number of packets, as opposed to inter-arrival times, is the variable of interest, a distribution with a point mass at zero has to be considered, since there is positive probability that no activity is observed during a given unit of time. Multiplicative cascade models have been considered in the literature as a way of capturing the bursty behaviour of the series. Such models have multi-fractal properties providing a rich structure that is able to capture the behaviour of series of disk usage. In this paper we present ongoing research on a Bayesian multi-scale modeling framework consisting of a multiplicative cascade, based on Haar wavelet transforms.

Piercesare SECCHI
Sistemi di urne rinforzate interagenti

Introdurrò una classe di processi stocastici a tempo discreto generati da sistemi di urne rinforzate interagenti. Questi processi sono semplici modelli per collezioni numerabili di successioni dipendenti di variabili aleatorie asintoticamente scambiabili. Essi possono essere utilizzati per estendere alcuni modelli d'urna già noti in ambito bayesiano non parametrico come, per esempio, il RUP a due colori sugli interi che genera il processo Beta-Stacy.

Raffaello SERI
Misture di alberi di Polya per la stima bayesiana non parametrica di densità di probabilità

La stima della funzione di densità di probabilità basata su metodi statistici parametrici può essere imprecisa quando i dati sono sparsi e irregolari. In questi casi, un modello semi-parametrico o non-parametrico è preferibile e può catturare meglio la struttura dei dati. Proponiamo un modello Bayesiano gerarchico il quale usa un albero di Polya (Lavine 1992, 1994) come distribuzione a priori nonparametrica per una misura di probabilità aleatoria. Dal momento che il problema maggiore degli alberi di Polya è la dipendenza dalla scelta della partizione, abbiamo considerato la classe di misture di alberi di Polya. Nel nostro caso, la partizione binaria che definisce l'albero è ottenuta attraverso i quantili di una densità Gamma Generalizzata i cui parametri sono essi stessi variabili aleatorie Gamma. La tecnica di stima si basa su un algoritmo Markov Chain Monte Carlo il quale usa un campionamento Metropolis-Hastings within Gibbs. Il modello viene poi applicato agli intertempi tra i terremoti fi forte intensità che hanno avuto luogo in Italia tra il 1600 e il 1992. Per tali eventi, è ragionevole assumere che gli intertempi siano indipendenti e identicamente distribuiti, e che, quindi, la sequenza degli eventi sia la realizzazione di un processo di rinnovamento. Come risultato, il metodo permette di valutare la probabilità di un terremoto nelle diverse zone sismogenetiche Italiane su diversi orizzonti temporali.