9. Fundamentos da Teoria da Probabilidade

Você está aqui

A teoria da probabilidade apresentada  neste portal está fundamentada na base axiomática de Kolmogorov, nos quais os elementos estocásticos são definidos  sobre o espaço de probabilidade $ (\Omega, \mathcal{F} , \mathbb{P}) $:

a) $ \Omega $ um espaço abstrato;

b) $ \mathcal{F} $ uma $ \sigma $-álgebra formada por subconjuntos de $ \Omega $;

c) $ \mathbb{P} $ uma probabilidade sobre $ \mathcal{F} $;

Apesar do modelo axiomático de Kolmogorov ser universalmente aceito, em 1948, exemplos publicados por Dieudonné (1948), Andersen e Jessen (1948), Doob (1948) e Jessen (1948), abalaram o modelo de Kolmogorov. 

1. [Dieudonné] Existe um espaço mensurável $ (\Omega , \mathcal{F}) $, uma probabilidade $ \mathbb{P} $ sobre $ \mathcal{F} $ e uma sub-$ \sigma $-álgebra $ \mathcal{A} \subset \mathcal{F} $ para o qual não existe uma função $ \nu(\omega , E) $ definida para todo $ \omega \in \Omega $ e $ E \in \mathcal{F} $ com as seguintes propriedades:

a) Para todo $ \omega \in \Omega $, temos que $ \nu(\omega , \cdot) $ é uma probabilidade sobre $ \mathcal{F} $;

b) Para todo $ E \in \mathcal{F} $, a função $ \nu(\cdot , E) $ é $ \mathcal{A} $-mensurável;

c) Para todo $ A \in \mathcal{A} $ e $ E \in \mathcal{F} $, temos que

$$\mathbb{P} (A \cap E) = \int_A \nu(\omega , E) \mathbb{P}(d \omega).$$

O teorema de Radon-Nikodym nos mostra a existência de uma função satisfazendo (a) e (b), porém, a propriedade (c) nem sempre é válida como mostra Dieudonné. Neste caso, não garantimos a existência de probabilidade condicional regular. Desta forma se tomarmos  \Omega \rightarrow \mathbb{R} $ uma função $ \mathcal{F} $-mensurável e integrável, apesar da esperança condicional de $ f $ da a sub-$ \sigma $-álgebra $ \mathcal{A} $ existir, esta não pode ser escrita como a integral (de Lebesgue) em relação a probabilidade condicional. 

d) Para todo $ E \in \mathcal{A} $, temos que $ \nu(\omega , E) = 1\!\!1_{E} (\omega), ~ \omega \in \Omega. $ Uma probabilidade condicional regular satsifazendo a propriedade (d) é denominada desintegração. Apesar da desintegração ser uma propriedade intuíva, esta nem sempre é válida.

2. [Doob, Jessen] Considere $ (\Omega, \mathcal{F}, \mathbb{P}) $ um espaço de probabilidade e $ f $ e $ g $ duas variáveis aleatórias definidas sobre $ (\Omega, \mathcal{F}, \mathbb{P}) $. Dizemos que estas variáveis aleatórias são independentes, se

$$\mathbb{P}[f^{-1} (A) \cap g^{-1}(B)] = \mathbb{P}[f^{-1} (A) ] \mathbb{P}[g^{-1}(B)] ~ ~ (1)$$

para $ A $ e $ B $ nos quais as probabilidade acima estejam bem definidas. Entretanto, existe um espaço de probabilidade $ (\Omega, \mathcal{F}, \mathbb{P}) $ e variáveis aleatórias $ f $ e $ g $ para os quais $ (1) $ é válido para todo boreliano do reta, mas não para todo subconjunto da reta no qual $ (1) $ esteja bem definido. 

Esta questão é necessária para expressarmos a definição de independência em termos da função característica  das variáveis aleatórias, pois a função característica determina a probabilidade da variável aleatória pertencer a borelianos da reta. Desta forma, a propriedade da função característica conjunta de $ (f,g) $ ser o produto das funções características de $ f $ e $ g $ é equivalente a validade de $ (1) $ apenas para borelianos.  

3. [Andersen e Jessen] Considere  n \geq 1\} $ uma sequência de espaços mensuráveis. Tomamos $ \Omega = \Prod \Omega_n $  o espaço produto com $ \mathcalF} $ a $ \sigma $-álgebra produto. Existe uma sequência de espaços mensuráveis  n \geq 1\} $ e uma função de conjunto  \mathcal{F} \rightarrow [0,1] $ tal que a marginal  de $ \mathbb{P} $ sobre $ \mathcal{F}_n $ é $ \sigma $-aditiva para todo $ n \in \geq 1 $, embora a função de conjunto $ \mathbb{P} $ sobre $ \mathcal{F} $ não é $ \sigma $-aditiva.

Este exemplo nos mostra que o teorema de Extensão de Kolmogorov não pode ser estendido para uma sequência qualquer de espaços mensuráveis. 

Nos exemplos acima, observamos que conceitos fundamentais (intuítivos) da teoria da probabilidade são violados. Assim, podemos concluir que o modelo de Kolmogorov é muito geral e que modelos mais restritivos, nos quais os problemas acima não acontecem devem ser considerados. No livro de Gnedenko e Kolmogorov (1949) foi proposto o conceito de espaço de probabilidade perfeito para tratar a questão (2). No apêndice da versão inglesa deste livro, Doob, inspirado em parte pelo conceito de separabilidade de Marczewski (1938) e Halmos e von Neumann (1942), mostrou que para espaços de probabilidade perfeito os problemas (1) e (2) não ocorrem. Como consequência do teorem VIII em Ryll-Nardzewski (1954), concluímos que a questão (3) também não ocorre para espaços de probabilidade perfeito. A utilização da separabilidade de Halmos e von Neumann (1942) tinha por objetivo caracterizar via isomorfismos espaços de probabilidade abstratos através do espaço $ ([0,1] , \Sigma , m) $, no qual $ \Sigma $ corresponde a $ \sigma $-álgebra de Lebesgue e $ m $ a medida de lebesgue (ver módulo "Medida de Lebesgue").

Ao analisar o teorema de Extensão de kolmogorov, Marczewski (1954) observou que a aproximação da probabilidade de borelianos pela probabilidade de compactos é importante. Assim, Marczewski introduziu o conceito de espaço de probabilidade compacto e estabeleceu uma versão abstrata do teorema de extensão de Kolmogorov (ver módulo "Probabilidade Produto"). Em Jirina (1954) foi mostrado que a questão $ (1) $ não ocorre se o espaço de probabilidade for separável e compacto. 

O que distingue este módulo de fundamentos da teoria de probabilidade dos trabalhos citados acima é que ao invés de caracterizarmos os espaços de probabilidade nos quais os problemas acima não ocorrem, caracterizamos os espaços mensuráveis nos quais tais questões não ocorrem, independente da probabilidade sobre estes espaços mensuráveis. Estes espaços mensuráveis, denominados espaços de Radon, foram introduzidos por Leão, Fragoso e Rufino (1999).

Seleção Universalmente Mensurável

Dados dois espaços $ \Omega_1 $ e $ \Omega_2 $, denotamos por $ \Omega_1 \times \Omega_2 $ o produto Cartesiano de $ \Omega_1 $ e $ \Omega_2 $. Se $ A $ é um subconjunto arbitrário de $ \Omega_1 \times \Omega_2 $, denotamos por $ A_{w_1} $ a seção de $ A $ em $ w_1 $, isto é, um subconjunto de $ \Omega_2 $ definido por

 (w_1, w_2) \in A \right\} \]

Além disso, dado um subconjunto $ E $ de $ \Omega_1 \times \Omega_2 $, definimos a projeção sobre $ \Omega_1 $, na forma

 E_{w_1} \neq \emptyset \right\} \]

Considere dois espaços mensuráveis $ (\Omega_1 , \mathcal{F}_1) $ e $ (\Omega_2 , \mathcal{F}_2) $, um retângulo mensurável em $ \Omega_1 \times \Omega_2 $ é um subconjunto na forma

 w_1 \in A_1 ~ ~ \mbox{ e } ~ ~ w_2 \in A_2 \right\} \]

onde $ A_1 \in \mathcal{F}_1 $ e $ A_2 \in \mathcal{F}_2 $. A classe de todos os retângulos mensuráveis forma uma semi-álgebra de subconjuntos de $ \Omega_1\times \Omega_2 $ e denotaremos por $ \mathcal{F}_1 \times \mathcal{F}_2 $ a $ \sigma $-álgebra gerada pela semi-álgebra de retângulos mensuráveis (ver módulo "Espaço Produto").

Considere $ (\Omega , \mathcal{F}) $ e $ (E , \mathcal{E}) $ dois espaços mensuráveis e $ H \subset \Omega \times E $, sob quais condições temos:

a) $ Proj_{\Omega} [H] ~ \in ~ \bar{\mathcal{F}} , $ no qual $ \bar{\mathcal{F}} $ é a $ \sigma $-álgebra universal.
b) Existe uma função  Proj_{\Omega}[H] \rightarrow E $ que é universalmente mensurável e $ (w, f(w)) \in H $ para todo $ w \in Proj_{\Omega}[H] $.

A demonstração da existência de seleção universalmente mensurável será realizada dentro deste módulo na máxima generalidade possível. A seguir, vamos exemplificar a necessidade dos teoremas de seleção mensurável em problemas de otimização estocástica. Tomamos \Omega \times E \rightarrow \mathbb{R}^\star $  uma função  mensurável, no qual $ \mathbb{R}^\star= \mathbb{R} \cup \{-\infty,\infty\} $ corresponde ao conjunto de número reais aumentado. Definimos, 

$$f^{\star}(\omega) = \inf_{ u \in E} f(u, \omega) ~ ~ ; ~ ~ \omega \in \Bbb{R}.$$

 O problema da seleção mensurável pode ser formulado da seguinte forma. Dado $ \epsilon \textgreater 0 $, existe um seletor mensurável  \Omega \rightarrow E $, tal que

$$f[w, \phi(w)] \leq \left\{\begin{array}{c} f^{\star}(w) + \epsilon ;~ f^{\star}(w) \textgreater -\infty \\ \\- \frac{1}{\epsilon} ; f^{\star}(w) = - \infty ~ ?\end{array} \right.$$

Também, podemos definir o problema de seleção na forma. Seja, 

 ~ \mbox{existe} ~ x_{w} \in E ~ \mbox{com} ~f(w, x_{w}) = f^{\star}(w) \right\}, \]

o conjunto no qual o ínfimo ocorre. Assim,  requeremos que além da equação acima $ \phi $ satisfaça

$$f[w, \phi(w)] = f^{\star}(w) ~ ~ ; ~ ~ w \in I .$$

 De forma geral, não necessariamente existe uma função mensurável $ \phi $ (seletor) que satisfaça as condições acima. Outra questão que surge com o poblema de otimização descrito acima é a questão da mensurabilidade da função $ f^\star $.  Para mostrarmos estes resultados, vamos utilizar o Corolário do Teorema 5.5 em Leese(1978) em conjunto com o Teorema II.8 em Dellacherie (1980), a fim de apresentarmos um teorema de seleção para conjuntos universalmente mensuráveis.  A seguir, apresentamos alguns conceitos que serão utilizados neste módulo. 

Definições 

Considere um espaço mensurável $ (\Omega, \mathcal{F}) $ e $ A \subset \Omega $ um subconjunto qualquer, definimos por

 B \in \mathcal{F} \} \]

a $ \sigma $-álgebra traço de $ \mathcal{F} $ sobre $ A \subset \Omega $. Através do espaço mensurável $ (\Omega , \mathcal{F}) $ podemos definir uma relação de equivalência $ R $ sobre $ \Omega $, na forma

$$\mathds{1}_{A} (w) = \mathds{1}_{A} (w^{\prime}) ~ ~ ; ~ ~ \forall A \in \mathcal{F}.$$

 Como consequência,  esta relação induz uma partição sobre o espaço $ \Omega $. Os átomos de um espaço mensurável $ (\Omega , \mathcal{F}) $ são as classes de equivalência sobre $ \Omega $ definidas pela relação $ R $.

Definição 9.2 (Espaço Mensurável Separado e Espaço Mensurável Separável)

O espaço mensurável $ (\Omega, \mathcal{F}) $ é denominado separado se os átomos de $ \Omega $ são seus pontos (singletons). Também dizemos que o espaço mensrável $ (\Omega, \mathcal{F}) $ é separável, se existe uma sequência de elementos de $ \mathcal{F} $ que gera $ \mathcal{F} $. Neste caso, existe uma sequência $ \mathcal{A} = \{A_1 , A_2 , \cdots \} \subset \mathcal{F} $ tal que $ \sigma(\mathcal{A})=\mathcal{F} $.

Considere $ (\Omega , \mathcal{F}) $ um espaço mensurável não separado, podemos definir a transformação canônica que associa elementos $ w \in \Omega $ às classes de equivalência definidas pela relação $ R $. Com isso, podemos construir o espaço quociente (quotient space) $ \dot{\Omega}  $, imagem de $ \Omega $ pela transformação canônica, e uma $ \sigma $-álgebra $ \dot{\mathcal{F}} $ também consistindo das imagens em $ \dot{\Omega} $ de elementos de $ \mathcal{F} $ pela transformação canônica gerada pela relação $ R $. Assim, obtemos um espaço separado $ (\dot{\Omega} , \dot{\mathcal{F}}) $ associado ao espaço mensurável $ (\Omega , \mathcal{F}) $. Com esta construção, dado um espaço mensurável qualquer podemos construir um espaço mensurável separado via a transformação canônica induzida por $ R $.

Uma das principais estratégias para estudar espaços mensuráveis consiste em compará-los com outros espaços mensuráveis através de funções apropriadas. A seguir, apresentamos duas destas funções. 

Definição 9.3

(Isomorfismo)

Dois espaços mensuráveis são ditos isomorfos se existe uma bijeção entre estes que seja mensurável e tenha inversa mensurável, tal
bijeção é denominada isomorfismo mensurável.

(Homeomorfismo)

Da mesma forma, dois espaços topológicos são homeomorfos se existe uma bijeção entre estes que seja contínua e tenha inversa contínua, tal bijeção é denominada homeomorfismo.
 

Com o  isomorfismo mensurável conseguimos transportar propriedades associadas com a mensurabilidade, como a separabilidade. Por outro lado, homeomorfismos são utilizados para transportar propriedades topológicas de conjuntos. Na próximo módulo, vamos explorar estas propriedades. 

Definição 9.4:

1- (Espaço Métrico)
  Seja $ X $ um conjunto qualquer. Uma métrica definida sobre $ X $ é uma função X\times X\to \mathbb{R}} $  que satisfaz as seguintes propriedades:

$${\displaystyle d(x,y)\geq 0\ \ \forall x,y\in X}$$

e

$${\displaystyle d(x,y)=0\iff x=y}$$

$${\displaystyle d(x,y)=d(y,x)\ \ \forall x,y\in X}$$

$${\displaystyle d(x,z)\leq d(x,y)+d(y,z)\ \ \forall x,y,z\in X}$$

essa propriedade é conhecida como (desigualdade triangular).

Então o par $ (X,d) $ é chamado espaço métrico.

2- (Espaço Topologico)
  Uma topologia associada a um conjunto $ X $ é uma coleção $  \tau $  de partes de $ X $, denominados os abertos da topologia, com as seguintes propriedades:

$$\varnothing , X \in \tau;$$

Se

$$A_1,A_2 \in \tau,\text{ então } A_1\cap A_2\in\tau;$$

Dada uma família arbitrária

$$(A_\lambda)_{\lambda\in L},\text{ com } A_\lambda\in\tau, \forall\lambda\in L,\text{ tem-se }(\bigcup_{\lambda\in L}A_{\lambda})\in\tau.$$

Um espaço topológico é um par $ ( X, \tau) $ onde $ X $ é um conjunto e $ \tau $ é uma topologia em $ X $.

3- (Espaço de Hausdorff)
  Um espaço de Hausdorff (ou espaço topológico separado) é um espaço topológico no qual quaisquer dois pontos distintos têm vizinhanças disjuntas.

4- (Espaço de Borel )
  Um espaço topológico $ X $ é denominado Borel se este for homeomórfico a um subconjunto de Borel de um espaço métrico completo e separável.

5- (Espaço Polonês)
  Um espaço topológico $ X $ é denominado Polonês se é um espaço métrico completo e separável.

6-(Conjunto Compacto)

Seja $ F $ um espaço topológico com topologia $ \tau $. Um subconjunto $ X \subset F $ é dito compacto, se dado uma coleção de abertos $ \{A_\lambda\}_\lambda \subset \tau $, tal que $ X\subset\bigcup_{\lambda}A_\lambda $ então existe uma sub-coleção $ \{A_{\lambda_1}, A_{\lambda_2}, \dots , A_{\lambda_n}\} $ finita tal que $ X\subset \bigcup_{i=1}^n A_{\lambda_i} $.

Notação: Considere $ \mathcal{H} $ uma família de subconjuntos de um espaço $ X $, usaremos a notação

$$\mathcal{H}_{\sigma},~~ \mathcal{H}_{\delta}\text{ e } \mathcal{H}_c$$

para denotar, respectivamente, a família de uniões enumeráveis, intersecções enumeráveis e complementos de elementos de $ \mathcal{H} $. Se $ X $ é um espaço topológico, usaremos os símbolos

$$F(X), ~~ G(X) \text{ e } K(X)$$

para denotar, respectivamente, a classe dos subconjuntos fechados, abertos e compactos de $ X $.

Conjunto de Souslin

A seguir, vamos introduzir a principal classe de conjuntos associados aos teoremas de seleção mensurável, denominados conjuntos de Souslin. Considere $ \mathbb{N} $ o conjunto dos números naturais, equipado com a topologia discreta. Indicaremos por $ \Sigma $ o espaço das sequências finitas de elementos de $ \mathbb{N} $ equipado com a topologia produto e $ \mathbb{N}^{\mathbb{N}} $ o espaço das sequências de elementos de $ \mathbb{N} $ equipado com a topologia produto. Podemos identificar o espaço $ \mathbb{N}^{\mathbb{N}} $ com o espaço $ I $ dos números irracionais do $ [0,1] $ via a transformação  \mathbb{N}^{\mathbb{N}} \rightarrow I $, definida por

\[ \Psi (\sigma) = \frac{1}{\sigma_1} ~ + ~ \frac{1}{\sigma_2} ~ + ~ \cdots \]

no qual $ \sigma=(\sigma_1, \sigma_2, \cdots) \in \mathbb{N}^{\mathbb{N}} $. Além disso, a topologia do $ \mathbb{N}^{\mathbb{N}} $ coincide com a topologia em $ I $ herdada do $ [0,1] $, isto é, com a topologia da reta restrita ao conjunto I.

Se $ \sigma \in \mathbb{N}^{\mathbb{N}} $ e $ n \geq 0 $, usamos o símbolo $ \sigma|n $ para denotar a sequência finita

\[ \left\{\begin{array}{l} \emptyset, ~ ~ n = 0 \\ \sigma_1, \sigma_2, \cdots , \sigma_n, ~ ~ n \geq 1 \end{array}\right. \]

Definição 9.5:
Considere $ X $ um espaço qualquer e $ \mathcal{H} $ uma classe de subconjuntos de $ X $. Um esquema de Souslin é uma função  \Sigma \rightarrow \mathcal{H} $, isto é, para todo elemento $ \sigma \in \mathbb{N}^{\mathbb{N}} $, temos que

\[ S[\sigma|n] ~ \in ~ \mathcal{H} \]

O núcleo de um esquema de Souslin $ S $ é definido por

\[ \displaystyle N(S) = \bigcup_{\sigma \in \mathbb{N}^{\mathbb{N}}} \bigcap_{n=1}^{\infty} S[ \sigma|n] .\]

 Para cada $ \sigma \in \mathbb{N}^{\mathbb{N}} $ tomamos uma família enumerável $ (S(\sigma|n))_{n \geq 1} $ de elementos de $ \mathcal{H} $ no qual aplicamos a operação

\[ \displaystyle \bigcap_{n=1}^{\infty} S[\sigma|n] .\]

O conjunto

\[ \displaystyle A = \bigcup_{\sigma \in \mathbb{N}^{\mathbb{N}}}\bigcap_{n=1}^{\infty} S[\sigma|n] \]

é obtido por união sobre os elementos  $ \sigma \in \mathbb{N}^{\mathbb{N}} $, tal que a família de conjuntos $ (S[\sigma|n])_{\sigma|n \in \Sigma} $ é enumerável. Assim, dizemos que $ A $ é obtido da família enumerável $ \{ S[\sigma|n] \} $ por operações de Souslin. A classe de conjuntos obtida via operação de Souslin às famílias de subconjuntos de $ \mathcal{H} $ é denominada $ \mathcal{H} $-Souslin e será denotada por $ \mathcal{S}[\mathcal{H}] $. Apesar da família $ (S[\sigma|n])_{\sigma|n \in \Sigma} $ ser enumerável, a operação de união sobre os elementos de $ \sigma \in \mathbb{N}^{\mathbb{N}} $ não é enumerável. Portanto, dado um espaço polonês $ \Omega $ com a $ \sigma $-álgebras de Borel $ \mathcal{F} $ gerada pelos abertos da topologia de $ \Omega $ a classe dos conjuntos $ \mathcal{S}[\mathcal{F}] $ é estritamente maior que $ \mathcal{F} $, pois lidamos com operações não enumeráveis.

A notação $ s \leq t $, onde $ s \in \Sigma $ e $ t \in \Sigma ~ \mbox{ou} ~ \mathbb{N}^{\mathbb{N}} $, significa que $ t $ começa com a sequência $ s $. Por exemplo, $ s=\{2,4,5,9\} $ e $ t=\{2,4,5,9,10,15,19\} $. Um esquema de Souslin $ S $ é denominado regular se $ S(t) \subset S(s) $ para todo $ s \leq t $. Se $ \mathcal{H} $ for fechado por intersecção finita, podemos definir um esquema de Souslin regular

\[ S^{\prime}(s) = \bigcap_{r \leq s} S(r) ,\]

que tem o mesmo núcleo que $ \mathcal{H} $. Portanto, sempre que $ \mathcal{H} $ for fechada por intersecção finita, usaremos esquemas de Souslin regulares.
Uma discussão detalhada sobre operações de Souslin pode ser encontrado em Kuratowski (1966) e Rogers (1980). Observe que todo $ A\in \mathcal{H} $-Souslin tem representação da forma:

$$A=\bigcup_{\sigma \in \mathbb{N}^{\mathbb{N}}} \bigcap_{n=1}^{\infty} S[ \sigma|n]$$

com $ S[ \sigma|n] \in \mathcal{H} $. A seguir, vamos definir espaço analíticos em espaços de Hausdorff da mesma forma que Choquet (1954).

Definição 9.6: (Conjuntos Analítico)

Considere $ X, Y $ espaços de Hausdorff, com $ Y $ compacto. Dizemos que um conjunto $ A \subset X $ é analítico se existe uma transformação  E \rightarrow A $, tal que $ E \in F_{\sigma \delta}(Y) $ e $ \phi $ é contínua. A classe de subconjuntos analíticos $ A $ de $ X $ será denotada por $ A(X) $.
 

Em espaços topológicos, existem diferentes formas de se definir conjuntos analíticos, porém Rogers (1980) mostra que todas são equivalentes. Para uma discussão detalhada sobre conjuntos analíticos ver Rogers (1980). Uma forma útil de definir conjuntos é analíticos em um espaço Polonês são conjuntos obtidos pela aplicação das operações de Souslin aos conjuntos fechados do espaço.

Definição 9.7 (Conjuntos E-Analíticos.):
Considere $ E \subset F $ onde $ F $ é um conjunto analítico, dizemos que um subconjunto $ H \subset E $ é $ E $-analítico se existe $ A^{\prime} \in A(F) $ tal que

\[ H = A^{\prime} \cap E \]

Na realidade, definimos o traço dos conjuntos analíticos em $ F $ sobre o subconjunto $ E $.
 

 

Probabilidades

Sobre o Portal Action

O Portal Action é mantido pela Estatcamp - Consultoria Estatística e Qualidade, com o objetivo de disponibilizar uma ferramenta estatística em conjunto com uma fonte de informação útil aos profissionais interessados.

Facebook

CONTATO

  •  Maestro Joao Seppe, 900, São Carlos - SP | CEP 13561-180
  • Telefone: (16) 3376-2047
  • E-Mail: [email protected]