CNR IMATI - Milano
Istituto di Matematica Applicata
e Tecnologie Informatiche
via Bassini 15 - 20133 Milano (Italy) |
Giornata sul tema:
STATISTICA BAYESIANA NON PARAMETRICA
Antonella BODINI
Teoria dei momenti generalizzati ed analisi di robustezza bayesiana: il caso non parametrico
Nelle applicazioni dell'analisi bayesiana si incontra il problema della valutazione della sensibilità, o robustezza, della procedura inferenziale utilizzata rispetto alle componenti del modello statistico formulato. In particolare, risulta interessante studiare la robustezza rispetto alla distribuzione iniziale, quando non sia univocamente individuabile per insufficienza di informazioni, ma la si supponga variabile all'interno di una certa classe C. Lo scopo di questo seminario è illustrare il caso in cui la classe C è un insieme di misure iniziali non parametriche, definita attraverso condizioni sui momenti generalizzati.
Luca LA ROCCA
Inferenza bayesiana nonparametrica sulla funzione di intensità
La legge di una successione scambiabile di variabili positive
può essere specificata tramite la funzione di intensità della
sua legge di natura, quando quest'ultima possa considerarsi
quasi certamente assolutamente continua. È un approccio
alternativo alla stima bayesiana di densità, particolarmente
interessante per modellare gli intertempi di una successione
di eventi sismici. Si propone di costruire la funzione di intensità
della legge di natura come mistura di convoluzione di una
densità di probabilità mediante un processo di Poisson
composito, fornendo una procedura per la scelta degli
iperparametri che ha il pregio di essere invariante
per cambiamento di scala. La legge finale può approssimarsi
mediante tecniche di simulazione basate su catene di Markov,
come si mostra su alcuni dati di esempio; i risultati ottenuti per
diversi valori degli iperparametri sono fra loro coerenti.
Antonio LIJOI
Inferenza bayesiana nonparametrica con misure aleatorie normalizzate e a
incrementi indipendenti
Le misure aleatorie a incrementi indipendenti possono essere impiegate per
definire distribuzioni iniziali per l'inferenza bayesiana nonparametrica. Un
celebre esempio è rappresentato dal processo di Dirichlet. Qui si prenderà
in esame una classe di distribuzioni iniziali ottenute mediante la
normalizzazione di misure aleatorie a incrementi indipendenti. Si dimostra
che esse soddisfano alcune proprietà ben note del processo di Dirichlet.
Nell'ipotesi che le osservazioni siano scambiabili, è possibile ottenere
una rappresentazione delle leggi predittive che consiste di una combinazione
lineare della distribuzione marginale e di una distribuzione empirica
ponderata.
Inoltre, la distribuzione finale ammette una caratterizzazione in termini di
mistura.
Pietro MULIERE
Rinforzo e scambiabilità finita.
Supponiamo che un ricercatore sia interessato:
i) a rinforzare le osservazioni passate nell'effettuare la previsione di
una nuova osservazione;
ii) alla nozione di scambiabilità finita.
In questo seminario verrano presentate le conseguenze di queste due
assunzioni.
Andrea ONGARO
Campionamento "size-biased" e inferenza bayesiana non parametrica discreta
In this work, we establish the connection between two different topics, i.e.
size-biased sampling schemes and Bayesian updating mechanisms
for a general class P of discrete nonparametric priors.
By exploting this connection, we are able to use size-biased sampling
theory to gain insight into the class P, to find representations of the
class
particularly suitable for applications to inference problems and to
derive new
general results about its posterior and predictive distributions and about
the
properties of a sample from P. Potential of the approach is illustrated via
an investigation of a class of symmetric priors.
Anna PAGANONI
Su una generalizzazione dell'urna di Polya
Si considera una particolare generalizzazione di un'urna di Polya composta
inizialmente da palline di due colori, e poi aggiornata ad ogni estrazione
con un numero aleatorio di palline del colore estratto.
La successione dei colori estratti da quest'urna è asintoticamente
scambiabile; si può dimostrare una legge dei grandi numeri e approssimare in modo
opportuno la distribuzione del limite.
Sonia PETRONE
Come elicitare una iniziale non parametrica?
Considererò il problema dell'elicitazione di una distribuzione
iniziale nonparametrica (per dati continui). Proporrò alla discussione
una possibile via, che consiste nel formulare una prima opinione
su una versione semplificata della distribuzione incognita, e poi
nell'interpolazione di tale valutazione. L'interpolazione proposta ricorre
a misture di distribuzioni.
Pietro RIGO
Alcuni risultati preliminari sull'inferenza Bayesiana non parametrica per
dati invarianti
Sotto condizioni generali, ogni legge invariante è un'unica mistura
integrale di leggi ergodiche. Questo lascia sperare che sia possibile
estendere al caso di dati con distribuzione invariante lo schema consueto
dell'inferenza bayesiana non parametrica per dati scambiabili. Tale
estensione, se effettivamente possibile, sarebbe di qualche interesse sul
piano teorico (la scambiabilità è un caso molto particolare di
invarianza) e su quello applicativo (ad esempio, diverrebbe possibile
un'analisi bayesiana non parametrica di dati stazionari). Il punto cruciale
è assegnare iniziali "ragionevoli" sulle leggi ergodiche, e calcolare (o
perlomeno approssimare) le corrispondenti leggi finale e predittiva. Alcuni
risultati molto preliminari in questo ambito vengono discussi. Una
conseguenza di tali risultati, nel caso particolare di dati scambiabili,
consente di gettare luce sulla distribuzione della variabile aleatoria
P(A), dove A è un evento fissato, sotto una qualsiasi iniziale per P.
Fabrizio RUGGERI
Un modello bayesiano multifrattale per l'analisi e la simulazione dell'uso
di dischi di elaboratori
Evaluating the performance of storage systems is a key aspect of the
design and implementation of computers with heavy I/O workloads.
Due to the difficulties and expenses involved in obtaining actual
measurements of disk usage, disk performance simulators are usually fed
with synthetic traces. As in many areas of computing and
telecommunications, the time processes of disk usage exhibit
dependencies that span over long ranges. In addition to the slow
decaying of the auto-correlation function, the series have a bursty
behaviour that can not usually be captured by commonly used times series
methods. Also, when the number of packets, as opposed to inter-arrival
times, is the variable of interest, a distribution with a point mass at
zero has to be considered, since there is positive probability that no
activity is observed during a given unit of time.
Multiplicative cascade models have been considered in the literature as
a way of capturing the bursty behaviour of the series. Such models have
multi-fractal properties providing a rich structure that is able to
capture the behaviour of series of disk usage.
In this paper we present ongoing research on a Bayesian multi-scale
modeling framework consisting of a multiplicative cascade, based on Haar
wavelet transforms.
Piercesare SECCHI
Sistemi di urne rinforzate interagenti
Introdurrò una classe di processi stocastici a tempo discreto
generati da sistemi di urne rinforzate interagenti. Questi
processi sono semplici modelli per collezioni numerabili di
successioni dipendenti di variabili aleatorie asintoticamente
scambiabili. Essi possono essere utilizzati per estendere alcuni
modelli d'urna già noti in ambito bayesiano non
parametrico come, per esempio, il RUP a due colori sugli interi
che genera il processo Beta-Stacy.
Raffaello SERI
Misture di alberi di Polya per la stima bayesiana non parametrica di densità di probabilità
La stima della funzione di densità di probabilità basata su metodi
statistici parametrici può essere imprecisa quando i dati sono sparsi e
irregolari. In questi casi, un modello semi-parametrico o
non-parametrico è preferibile e può catturare meglio la struttura dei
dati. Proponiamo un modello Bayesiano gerarchico il quale usa un albero
di Polya (Lavine 1992, 1994) come distribuzione a priori nonparametrica
per una misura di probabilità aleatoria. Dal momento che il problema
maggiore degli alberi di Polya è la dipendenza dalla scelta della
partizione, abbiamo considerato la classe di misture di alberi di Polya.
Nel nostro caso, la partizione binaria che definisce l'albero è ottenuta
attraverso i quantili di una densità Gamma Generalizzata i cui parametri
sono essi stessi variabili aleatorie Gamma. La tecnica di stima si basa
su un algoritmo Markov Chain Monte Carlo il quale usa un campionamento
Metropolis-Hastings within Gibbs. Il modello viene poi applicato agli
intertempi tra i terremoti fi forte intensità che hanno avuto luogo in
Italia tra il 1600 e il 1992. Per tali eventi, è ragionevole assumere
che gli intertempi siano indipendenti e identicamente distribuiti, e
che, quindi, la sequenza degli eventi sia la realizzazione di un
processo di rinnovamento. Come risultato, il metodo permette di
valutare la probabilità di un terremoto nelle diverse zone
sismogenetiche Italiane su diversi orizzonti temporali.