2.4.1 - Distribuição de probabilidade no R^n

Você está aqui

Os Borelianos de Rn

Nesta seção, vamos trabalhar com $\mathbb{R}^n=\mathbb{R}\times\mathbb{R}\times\cdots\times\mathbb{R}$, o conjunto das n-uplas ordenadas. Nosso primeiro objetivo consiste em construir a $\sigma$-álgebra de Borel correspondente ao $\mathbb{R}^n$. Neste caso, o conjunto gerador da $\sigma$-álgebra de Borel é dado pelos retângulos de $\mathbb{R}^n$. Os intervalos aberto à esquerda e fechados à direita serão definidos na forma \[ (a,b]=\left\{x \in \mathbb{R}: a < x \leq b \right\},\] para todo $a$ e $b$ tais que $-\infty \leq a < b < \infty$. O intervalo $(a ,\infty]$ é tomado como $(a,\infty)$, esta convenção é necessária para que o complementar do intervalo $(\infty,b]$ seja um intervalo da mesma forma (aberto à esquerda e fechado à direita).

Definição 2.4.1.1:

Para $I_k=(a_k,b_k]$ um intervalo, o conjunto $I=I_1\times I_2\times \cdots\times I_n$ definido por,
$$\{x\in \mathbb{R}^n| x_k\in I_k, k=1,\dots,n\}$$
é denominado de retângulo de lados $I_k$, com $k=1,\cdots,n$. O conjunto de todos os retângulos I, será denotado por $\mathcal{I}$. De forma geral, um conjunto $A=A_1\times A_2\times \cdots\times A_n$ é denominado de retângulo (ou cilindro) de lados $A_i$. Se $A_i \in \mathfrak{B}(\mathbb{R})$ dizemos que $A$ é um retângulo (ou cilindro) de lados borelianos.

Definição 2.4.1.2:

A $\sigma$-álgebra de Borel de subconjuntos de $\mathbb{R}^n$, denotada por $\mathfrak{B}(\mathbb{R}^n)$, é a menor $\sigma$-álgebra gerada por todos os retângulos de $\mathbb{R}^n$, isto é,$\mathfrak{B}(\mathbb{R}^n)=\sigma(\mathcal{I})$.

Da mesma forma que os intervalos geram a $\sigma$-álgebra de Borel na reta, os retângulos de lados representados por intervalos geram a $\sigma$-álgebra de Borel do $\mathbb{R}^n$. Na sequência, mostraremos que a $\mathfrak{B}(\mathbb{R}^n)$ também pode ser definida como a  menor $\sigma$-álgebra que contém os retângulos com lados Borelianos. Considere $$\mathcal{R}=\{A=A_1\times \cdots\times A_n: A_i \in \beta(\mathbb{R})\},$$ a classe dos retângulos com lados Borelianos. Denotamos por\[ \sigma(\mathfrak{B}(\mathbb{R})\times\mathfrak{B}(\mathbb{R})\times\cdots\times \mathfrak{B}(\mathbb{R}))=\sigma(\mathcal{R}).\]  

Exercício:

Mostre que a classe dos retângulos $\mathcal{I}$ e a classe dos retângulos de lados Borelianos $\mathcal{R}$ formam uma semi-álgebra. 

Teorema 2.4.1.1:

Temos que, $\mathfrak{B}(\mathbb{R}^n)=\sigma(\mathcal{I})=\sigma(\mathfrak{B}(\mathbb{R})\times\mathfrak{B}(\mathbb{R})\times\cdots\times \mathfrak{B}(\mathbb{R}))$

Demonstração: 

Note que o resultado é trivial se $n=1$. Vamos mostrar o caso $n=2$. Definimos por
$$\mathcal{C}=\{B_1\times B_2: B_i\in \mathfrak{B}(\mathbb{R}), i=1,2\},$$ a classe dos retângulos com lados Borelianos.
Sabemos que que $\mathcal{I}\subset \mathcal{C}$, logo é imediato que
$$\mathfrak{B}(\mathbb{R}^2)=\sigma(\mathcal{I})\subset \sigma(\mathcal{C})=\mathfrak{B}(\mathbb{R})\otimes\mathfrak{B}(\mathbb{R})$$
Assim resta-nos apenas mostrar que
$$\mathfrak{B}(\mathbb{R})\otimes\mathfrak{B}(\mathbb{R})\subset\mathfrak{B}(\mathbb{R}^2)$$
Na sequência, considere $\mathfrak{C}$ uma classe de subconjuntos de $\mathbb{R}^2$ e $B\subset\mathbb{R}^2$. Então, ao definirmos
$$\mathfrak{C}\cap B=\{A\cap B:A\in\mathfrak{{C}}\},$$ vamos provar que $$\sigma(\mathfrak{C}\cap B)=\sigma(\mathfrak{C})\cap B.$$
Como $\mathfrak{C}\subset \sigma(\mathfrak{C})$, concluímos que
$$\mathfrak{C}\cap B\subset \sigma(\mathfrak{C})\cap B$$
Além disso, temos que $\sigma(\mathfrak{C})\cap B$ é uma $\sigma$-álgebra (exercício). Assim, obtemos que
$$\sigma(\mathfrak{C}\cap B)\subset \sigma(\mathfrak{C})\cap B$$
Na sequência, vamos mostrar
$$\sigma(\mathfrak{C})\cap B\subset \sigma(\mathfrak{C}\cap B) $$
Para isso, tomamos $\mathcal{C}_B=\{A\in\sigma(\mathfrak{C}):A\cap B\in \sigma(\mathfrak{C}\cap B)\}$. Desde que $\sigma(\mathfrak{C})$ e $\sigma(\mathfrak{C}\cap B)$ são $\sigma$-álgebras, obtemos que $\mathcal{C}_B$ também é uma $\sigma$-álgebra, Portanto, temos que
$$\mathfrak{C}\subset\mathcal{C}_B\subset \sigma(\mathfrak{C})$$
O que implica que $\mathcal{C}_B= \sigma(\mathfrak{C})$. Assim, concluímos que
$$A\cap B\in \sigma(\mathfrak{C}\cap B)$$
para todo $A\in\mathfrak{C}$. Consequentemente $\sigma(\mathfrak{C})\cap B\subset \sigma(\mathfrak{C}\cap B)$.

Para terminarmos a demonstração do teorema, considere os seguintes conjuntos $\mathcal{B}\times \mathbb{R}=\{B\times \mathbb{R}| B\in\mathfrak{B}(\mathbb{R})\}$ e $\mathbb{R}\times \mathcal{B}=\{\mathbb{R}\times B| B\in\mathfrak{B}(\mathbb{R})\}$.

Então dado $B_1\times B_2$, com $B_1,B_2\in \mathfrak{B}(\mathbb{R})$, temos que
$$B_1\times B_2=(B_1\times \mathbb{R})\cap (\mathbb{R}\times B_2) \in\sigma(I_1 \times \mathbb{R})\cap (B_2\times \mathbb{R})= \sigma((I_1 \times \mathbb{R})\cap (B_2\times \mathbb{R}))\subset\sigma ((I_1\times \mathbb{R})\cap (I_2\times \mathbb{R}))=\sigma(\mathcal{I})$$
no qual, $I_i$ é o conjunto de todos os intervalos de $\mathbb{R}$ correspondente a $i$-ésima coordenada, com $i=1,2$.. Portanto o resultado segue.

Como a $\sigma$-álgebra de Borel do $\mathcal{R}^n$ é gerada pelo produto "direto" da $\sigma$-álgebra de Borel de cada coordenada, esta também pode ser denotada por $\mathfrak{B}(\mathbb{R})\otimes\mathfrak{B}(\mathbb{R})\otimes\cdots\otimes \mathfrak{B}(\mathbb{R})=\sigma(\mathcal{R}).$

Distribuição de probabilidade no Rn

Suponha $\mathbb{P}$ uma probabilidade no espaço mensurável $(\mathbb{R}^n,\mathfrak{B}(\mathbb{R}^n))$. A função
$$F_n(x_1,\dots,x_n)=\mathbb{P}((-\infty,x_1]\times (-\infty,x_2]\times\dots\times(-\infty,x_n])$$ é denominada função de distribuição da probabilidade $\mathbb{P}$. Usaremos uma notação mais compacta, a qual será denotada da seguinte forma
$$F_n(x)=\mathbb{P}((-\infty,x])$$
no qual $x=(x_1,\dots,x_n)$ e $(-\infty,x]=(-\infty,x_1]\times (-\infty,x_2]\times\dots\times(-\infty,x_n]$. Na sequência, introduzimos o operador diferença $\Delta_{a_i,b_i}:\mathbb{R}^n\rightarrow \mathbb{R}$ definido por
$$\Delta_{a_i,b_i}F_n(x)=F_n(x_1,\dots,x_{i-1},b_i,x_{i+1},\dots,x_n)-F_n(x_1,\dots,x_{i-1},a_i,x_{i+1},\dots,x_n),$$no qual $a_i\leq b_i$ para $i=1, \cdots , n$. Com esta notação, temos que
$$\Delta_{a_1,b_1}\dots\Delta_{a_n,b_n} F_n(x)=\mathbb{P}((a,b])$$
no qual $(a,b]=(a_1,b_1]\times\dots\times(a_n,b_n]$. Como no exemplo 2.4.2 mostrado na seção anterior no caso multidimensional em geral $\mathbb{P}((a,b])\neq F_n(b)-F_n(a)$, com $a=(a_1,\dots,a_n)$ e $b=(b_1,\dots,b_n)$. Além disso como $\mathbb{P}$ é positiva temos que
P1$$\Delta_{a_1,b_1}\dots\Delta_{a_n,b_n} F_n(x)\geq 0$$
Da continuidade a direita de $\mathbb{P}$, temos que $F_n$ também é contínua a direita, ou seja, se uma sequência $\{x^{k}\}_{k\in\mathbb{N}}$ e $x^k\downarrow x$, com $x^k=(x_1^k,\dots,x_n^k)$ então
P2$$F_n(x^k)\downarrow F_n(x),\quad k\rightarrow \infty.$$
Além disso,
P3$$\displaystyle\lim_{x\rightarrow \infty}F_n(x)=1$$
e
P4$$\displaystyle \lim_{x\downarrow y}F_n(x)=0$$
se pelo menos uma coordenada de $y$ é $-\infty$.

Definição 2.4.1.3:

Uma função de distribuição $n$-dimensional em $\mathbb{R}^n$ é uma função $F=F_n(x_1,\dots,x_n)$ com as propriedades P1,P2,P3,P4.

Nosso objetivo é mostrar que se $F$ é uma função de distribuição, então existe uma única probabilidade $\mathbb{P}$ definida em $(\mathbb{R}^n,\mathfrak{B}(\mathbb{R}^n))$, tal que
$$\mathbb{P}((a,b])=\Delta_{a_1,b_1}\dots\Delta_{a_n,b_n} F_n(x).$$
Para isso, vamos construir uma probabilidade definida na álgebra gerada pelos retângulos e então, usaremos o teorema de extensão. Relembramos que $\mathcal{I}$ denota  semi-álgebra composta pelos retângulos de lados compostos por intervalos na forma $I_k = (a_k , b_k]$, com $k=1,\cdots,n$.

Lema 2.4.1.1

Seja $F$ uma função de distribuição em $\mathbb{R}^n$. Tomamos a função de conjunto $\mathbb{P}_F$ sobre a semi-álgebra $\mathcal{I}$ na forma
$$\mathbb{P}_F((a,b])=\Delta_{a_1,b_1}\dots\Delta_{a_n,b_n} F_n(x),$$ para todo $I=I_1 \times \cdots \times I_n \in \mathcal{I}$. Então, a função de conjunto $\mathbb{P}_F$ é não negativa, finitamente aditiva em $\mathcal{I}$ e $\mathbb{P}_F(\emptyset)=0$.
Demonstração: 

Note que, pela definição de $F$, $\mathbb{P}_F$  é não negativa em $\mathcal{I}$ e $\mathbb{P}_F(\emptyset)=0$ . Agora para mostrar a aditividade finita, considere o caso n=2, consideraremos somente esse caso, por simplicidade da notação, a demonstração para o caso geral pode ser estendida naturalmente, a partir deste caso.

Assim considere 
$$\displaystyle \bigcup_{m=1}^{k}I_m\in \mathcal{I}$$
onde $I_m$ são elementos disjuntos $\mathcal{I}$. Primeiramente vamos considerar o caso em que $I_m$ tem lados disjuntos. Desta forma, podemos rescrever
$$\displaystyle \bigcup_{m=1}^k I_m=\bigcup_{i=1}^{K_1}\bigcup_{j=1}^{K_2} I_{i,j}$$
Onde
$$\displaystyle \bigcup_{m=1}^k I_m= (a^0,a^{K_1}]\times(b^0,b^{K_2}]$$
e
$$I_{i,j}=(a^{i-1},a^{i}]\times (b^{j-1},b^{j}].$$
no qual $I_m$ é um dos $I_{i,i}$.

Agora fixando $i$, temos que
$$\displaystyle \sum_{j=1}^{K_2}\mathbb{P}(I_{i,j})=\sum_{j=1}^{K_2}(F(a^i,b^j)-F(a^i, b^{j-1})-F(a^{i-1},b^j)+F(a^{i-1},b^{j-1}))=$$
$$\displaystyle \sum_{j=1}^{K_2}(F(a^i, b^j)-F(a^i,b^{j-1}))-\sum_{j=1}^{K_2}(F(a^{i-1},b^j)-F(a^{i-1},b^{j-1}))=$$
$$\displaystyle (F(a^i,b^{K_2})-F(a^i,b^0))-(F(a^{i-1},b^{K_2})-F(a^{i-1},b^0))=$$
$$\displaystyle \Delta_{a^{i-1},a^{i}}\Delta_{b^0,b^{K_2}} F(x_1,x_2)$$
Logo, obtemos que
$$\displaystyle \sum_{i=1}^{K_1}\sum_{j=1}^{K_2}\mathbb{P}_F(I_{i,j})=\sum_{j=1}^{K_2}\Delta^1_{a^{i-1},a^{i}}\Delta^2_{b^0,b^{K_2}}F(x_1,x_2)=$$
como
$$\displaystyle \sum_{i}^{K_1}\sum_{j=1}^{K_2}\mathbb{P}_F(I_{i,j})=\displaystyle \bigcup_{m=1}^k\mathbb{P}_F(I_m)$$
$$\displaystyle \sum_{i=1}^{K_1}\{(F(a^i,b^{K_2})-F(a^i,b^0))-(F(a^{i-1},b^{K_2})-F(a^{i-1},b^0))\}=$$
$$\sum_{i=1}^{K_1}(F(a^i,b^{K_2})-F(a^i,b^0))-\sum_{i=1}^{K_1}(F(a^{i-1},b^{K_2})-F(a^{i-1},b^0))=$$
$$F(a^{K_1},b^{K_2})-F(a^0,b^{K_2})-F(a^{K_1},b^0)-F(a^{K_1},b^0)+F(a^0,b^0)=$$
$$\Delta^1_{a^{0},a^{K_1}}\Delta^2_{b^{0},b^{K_2}}F(x_1,x_2)=$$
$$\mathbb{P}_F((a^0,b^{K_2}]\times(a^{K_1},b^{K_2}])=\mathbb{P}_F\left(\bigcup_{m=1}^{k}I_m\right)$$
Como 
$$\displaystyle \sum_{i=1}^{K_1}\sum_{j=1}^{K_2}\mathbb{P}_F(I_{i,j})=\sum_{m=1}^k \mathbb{P}_F(I_m)$$
Segue que
$$\mathbb{P}_F\left(\bigcup_{m=1}^{k}I_m\right)=\displaystyle \sum_{i=1}^{K_1}\sum_{j=1}^{K_2}\mathbb{P}_F(I_{i,j})=\sum_{m=1}^k \mathbb{P}_F(I_m)$$
Agora para o caso geral, pode sempre ser reduzido ao caso onde os lados dos retângulos são disjuntos. Por exemplo se
$$I_m=(u_1^{m},u_2^{m}]\times(v_1^m,v_2^m],\quad m=1,\dots,k$$
Assim basta colocar os valores em ordem crescente os valores distintos
$$u_1^{1},u_2^{1}, u_1^2,u_2^{2},\dots,u_1^{k}, u_2^{k}\quad e \quad v_1^{1},v_2^{1}, v_1^2,v_2^{2},\dots,v_1^{k}, v_2^{k}$$
respectivamente por
$$a^0< a^{1}<\dots< a^{K_1}\quad e \quad b^{0}< b^{1}<\dots< b^{K_2}$$
Então
$$\displaystyle \bigcup_{m=1}^k I_m=\bigcup_{i=1}^{K_1}\bigcup_{j=1}^{K_2} (a^{i-1},a^{i}]\times (b^{j-1},b^{j}]$$
Pelo caso anterior temos que
$$\displaystyle \mathbb{P}_F\left(\bigcup_{m=1}^k I_m\right)=\sum_{i=1}^{K_1}\sum_{j=1}^{K_2}\mathbb{P}_F\left((a^{i-1},a^{i}]\times(b^{j-1},b^{j}]\right)$$
Note que cada $I_m$ é união de elementos disjuntos com lados disjuntos da forma $(a^{i-1},a^{i}]\times(b^{j-1},b^{j}]$, logo cada $I_m$ é soma dos seus termos correspondentes $\mathbb{P}\left((a^{i-1},a^{i}]\times(b^{j-1},b^{i}]\right)$. Assim novamente usando o caso disjunto obtemos que
$$\displaystyle \mathbb{P}_F\left(\bigcup_{m=1}^k I_m\right)=\sum_{i=1}^{K_1}\sum_{j=1}^{K_2}\mathbb{P}_F\left((a^{i-1},a^{i}]\times(b^{j-1},b^{j}]\right)=\sum_{m=1}^{k}\mathbb{P}_{F}\left(I_m\right)$$
Portanto temos que $\mathbb{P}_F$ é finitamente aditiva em $\mathcal{I}$

Lema 2.4.1.2:

Seja $F$ uma função de distribuição em $\mathbb{R}^n$ e
$$\mathbb{P}_F((a,b])=\Delta_{a_1,b_1}\dots\Delta_{a_n,b_n} F_n(x)$$.
Considere em $\mathcal{I}$ os retângulos na forma $$R_k=(a_1^k,b_1^k]\times \cdots\times (a_n^k,b_n^k], \quad -\infty\leq a^k_{i}\leq b_i^k\leq \infty$$ com  $$\displaystyle R\subset \bigcup_{k=1}^{\infty} R_k$$ com $R\mathcal{I}$. Então $$\displaystyle \mathbb{P}_F(R)\leq \sum_{k=1}^{\infty}\mathbb{P}_F(R_k)$$

Demonstração:

Primeiramente notemos que para $h> 0$ 
$$\displaystyle \mathbb{P}_F((a_1^k,b_1^k+h]\times \cdots\times (a_n^k,b_n^k+h])=\Delta^1_{a_1^k,b_1^k+h}\cdots \Delta^n_{a_n^k,b_n^k+h}F(x_1,\dots,x_n)$$
Assim, devido a continuidade a direita de F em cada coordenada, segue que 
$$\displaystyle \lim_{h\rightarrow 0} \mathbb{P}_F((a_1^k,b_1^k+h]\times \cdots\times (a_n^k,b_n^k+h])=\lim_{h\rightarrow 0}\Delta^1_{a_1^k,b_1^k+h}\cdots \Delta^n_{a_n^k,b_n^k+h}F(x_1,\dots,x_n)=$$
$$\Delta^1_{a_1^k,b_1^k}\cdots \Delta^n_{a_n^k,b_n^k}F(x_1,\dots,x_n)=\mathbb{P}_F((a_1^k,b_1^k]\times \cdots\times (a_n^k,b_n^k])$$
Desta forma, dado $\epsilon> 0$, existe um $h_k$, tal que
$$\displaystyle \mathbb{P}_F((a_1^k,b_1^k+h_k]\times \cdots\times (a_n^k,b_n^k+h_k])=\mathbb{P}_F((a_1^k,b_1^k]\times \cdots\times (a_n^k,b_n^k])+\frac{\epsilon}{2^k}$$
Primeiramente vamos considerar o caso em que $R=(a_1^0,b_1^0]\times \cdots\times (a_n^0,b_n^0]$, para $-\infty< a^k_{i}< b_i^k< \infty$. Assim para $h> 0$ temos
$$\displaystyle [a_1^0+h,b_1^0]\times \cdots\times [a_n^0+h,b_n^0]\subset R\subset\bigcup_{k=1}^{\infty}(a_1^k,b_1^k+h_k]\times \cdots\times (a_n^k,b_n^k+h_k]$$
Mas $[a_1^0+h,b_1^0]\times \cdots\times [a_n^0+h,b_n^0]$ é um conjunto compacto de $\mathbb{R}^n$ e portanto pelo teorema de Heine-Borel toda cobertura aberta admite uma subcobertura finita. Em nosso caso a nossa cobertura aberta é 
$$\displaystyle \bigcup_{k=1}^{\infty}(a_1^k,b_1^k+h_k]\times \cdots\times (a_n^k,b_n^k+h_k]$$
Logo para algum $K$ temos que
$$\displaystyle [a_1^0+h,b_1^0]\times \cdots\times [a_n^0+h,b_n^0]\subset\displaystyle \bigcup_{k=1}^{K}(a_1^k,b_1^k+h_k]\times \cdots\times (a_n^k,b_n^k+h_k]$$
Além disso, como $\mathbb{P}_F$ é finitamente aditiva pelo Lema 2.4.1.1, temos que ela trivialmente monótona e sub-aditiva, e portanto
$$\displaystyle \mathbb{P}_F((a_1^0+h,b_1^0]\times \cdots\times (a_n^0+h,b_n^0])\leq \sum_{k=1}^{K}\mathbb{P}_F((a_1^k,b_1^k+h_k]\times \cdots\times (a_n^k,b_n^k+h_k]) $$
Pela equação acima temos que
$$\sum_{k=1}^{K}\mathbb{P}_F((a_1^k,b_1^k+h_k]\times \cdots\times (a_n^k,b_n^k+h_k])\leq \sum_{k=1}^{\infty}\left(\mathbb{P}_F((a_1^k,b_1^k]\times \cdots\times (a_n^k,b_n^k])+\frac{\epsilon}{2^k}\right)=$$
$$\sum_{k=1}^{\infty}\left(\mathbb{P}_F((a_1^k,b_1^k]\times \cdots\times (a_n^k,b_n^k])\right)+\epsilon=\sum_{k=1}^{\infty}\mathbb{P}_F(R_k)+\epsilon$$
Por outro lado temos que F é continua a direita em cada coordenada então
$$\displaystyle \lim_{h\rightarrow 0}\displaystyle \mathbb{P}_F((a_1^0+h,b_1^0]\times \cdots\times (a_n^0+h,b_n^0])=\lim_{h\rightarrow 0}\Delta^1_{a_1^0+h,b_1^0}\cdots \Delta^n_{a_n^0+h,b_n^0}F(x_1,\dots,x_n)=$$
$$\Delta^1_{a_1^k,b_1^k}\cdots \Delta^n_{a_n^0,b_n^0}F(x_1,\dots,x_n)=\mathbb{P}_F((a_1^0,b_1^0]\times \cdots\times (a_n^0,b_n^0])=\mathbb{P}_F(R)$$
Portanto
$$\displaystyle \mathbb{P}_F(R)\leq \sum_{k=1}^\infty \mathbb{P}_F(R_k)+\epsilon$$
Como $\epsilon$ é arbitrário temos 
$$\displaystyle \mathbb{P}_F(R)\leq \sum_{k=1}^\infty \mathbb{P}_F(R_k)$$
Para o caso em que $R$ não é finito considere
$$R^N=R\cap ((-N,N]\times\cdots\times (-N,N])$$
Logico que $R^N$ é limitado e ainda
$$\displaystyle R^N\subset R^{N+1}\subset R\subset \bigcup_{k=1}^{\infty}R_k$$
Então pelo resultado anterior temos que
$$\displaystyle \mathbb{P}_F(R^N)\leq \sum_{k=1}^{\infty}\mathbb{P}(R_k), \quad \forall N$$
Como $F$ é monótona em cada coordenada, tomando o limite em N tendendo a infinito, o resultado segue.

Lema 2.4.1.3:

$\mathbb{P}_F$ é $\sigma$-aditiva em $\mathcal{I}$

Demonstração: 

Seja $\displaystyle \bigcup_{k=1}^{\infty}R_k \in \mathcal{I}$, no qual $R_k\in\mathcal{I}^n$ e $R_j\cap R_i=\emptyset$ se $i\neq j$.
Pelo Lema 2.4.1.1 temos que $\mathbb{P}_F$ é finitamente aditiva, logo monótona. Assim
$$\displaystyle \sum_{k=1}^{N}\mathbb{P}(R_k)=\mathbb{P}_F\left(\bigcup_{k=1}^{N} R_k\right)\leq \mathbb{P}_F\left(\bigcup_{k=1}^{\infty}R_k\right), \quad \forall N\in\mathbb{N}$$
Agora tomando $N\rightarrow \infty$ temos que
$$\displaystyle \sum_{k=1}^{\infty}\mathbb{P}(R_k)\leq \mathbb{P}_F\left(\bigcup_{k=1}^{\infty}R_k\right).$$
Por outro pela lema 2.4.1.2 temos que
$$\mathbb{P}_F\left(\bigcup_{k=1}^{\infty} R_k\right)\leq \sum_{k=1}^{\infty}\mathbb{P}_F(R_k)$$
Portanto 
$$\mathbb{P}_F\left(\bigcup_{k=1}^{\infty} R_k\right)= \sum_{k=1}^{\infty}\mathbb{P}_F(R_k)$$
E o resultado segue

Até esse ponto mostrarmos que $\mathbb{P}_F$ é $\sigma$-aditiva na semi-álgebra porém precisamos de $\mathbb{P}_F$ seja definida na $\sigma$-algebra e ainda seja $\sigma$-aditiva. Na proposição a seguir mostraremos que podemos extender $\mathbb{P}_F$ para uma álgebra de maneira única. Para enfim podermos invocar o Teorema de Caratheodory e finalmente extender nossa medida para a $\sigma$-álgebra. 

A proposição a seguir nos diz que se temos uma medida de probabilidade qualquer (a qual chamaremos de $\lambda$), definida apenas na semi-álgebra e ainda se ela for $\sigma$-aditiva, então existe uma única extensão desta medida de probabilidade para a álgebra, tal que essa extensão seja $\sigma$-aditiva na algebra.

Uma extensão natural de $\lambda: \mathcal{I}\rightarrow \mathbb{R}^n$ a qual chamaremos de $\mu:\mathcal{A}(\mathcal{I})\rightarrow \mathbb{R}^n$, seja $A\in\mathcal{A}(\mathcal{I})$ então $A$ pode ser escrito como $$A=\displaystyle \bigcup_{i=1}^{n} I_i$$ e a extesão natural de $\lambda$ é dada por $$\mu(A)=\displaystyle \sum_{i=1}^{n}\lambda(I_i).$$ A proposição a seguir mostra que essa extensão é unica.

Proposição 2.4.1.1:

Seja $\lambda: \mathcal{I}\rightarrow \mathbb{R}^n$, uma função positiva e $\sigma$-aditiva definida em uma semi-álgebra $\mathcal{I}$. Então existe uma única extensão,  $\sigma$-aditiva, de $\lambda$ para a álgebra $\mathcal{A}(\mathcal{I})$.
Demonstração:

Primeiramente considere $\lambda$ finitamente aditiva em $\mathcal{I}$ e seja $A\in\mathcal{A}(\mathcal{I})$ então $A$ pode ser escrito como
$$A=\displaystyle \bigcup_{i=1}^{n} I_i$$
no qual os conjuntos $I_i$ são elementos disjuntos de $\mathcal{I}$. Então defina $\mu: \mathcal{A}(\mathcal{I})\rightarrow [0,1]$ com $\mu\mid_{\mathcal{I}}=\lambda$.
$$\mu(A)=\displaystyle \sum_{i=1}^{n}\lambda(I_i)$$
A função $\mu$ está bem definida, e por definição estende $\lambda$. Para ver que $\mu$ está bem definida considere
$$\displaystyle \sum_{i=1}^{n}I_i=A=\bigcup_{j=1}^{m} R_j$$
para conjuntos disjuntos $R_j\in\mathcal{I}$, então
$$\mu(A)=\displaystyle \sum_{i=1}^{n}\lambda(I_i)=\sum_{i=1}^{n}\mu(I_i)=\sum_{j=1}^{m}\mu(R_j)=\sum_{j=1}^{m}\lambda(R_j)=\mu(A)$$
De fato, considere
$$I_i\cap R_j, \quad i=1,\cdots,n, \quad j=1,\cdots,m$$
são elementos disjuntos de $\mathcal{I}$ e 
$$\displaystyle \bigcup_{j=1}^{m}(I_i\cap R_j)= I_i \quad e \quad \displaystyle \bigcup_{i=1}^{n}(I_i\cap R_j)=R_j$$
Então 
$$\displaystyle \mu(A)=\sum_{i=1}^n \lambda(I_i)=\sum_{i=1}^n\lambda\left(\displaystyle \bigcup_{j=1}^{m}(I_i\cap R_j)\right)=$$
$$\displaystyle \sum_{i=1}^n \sum_{j=1}^m \lambda(I_i\cap R_j)=\sum_{j=1}^m \sum_{i=1}^n \lambda(I_i\cap R_j)=\sum_{j=1}^m\lambda\left(\displaystyle \bigcup_{i=1}^{n}(I_i\cap R_j)\right)=\sum_{j=1}^m\lambda(R_j)=\sum_{j=1}^m\mu(R_j)$$
Portanto $\mu$ está bem definida em $\mathcal{A}(\mathcal{I})$. Agora vamos mostrar que $\mu$ é finitamente aditiva. Assim, considere os conjuntos $A,B\in \mathcal{A}(\mathcal{I})$, com $A\cap B=\emptyset$, como então podemos reescrever $A$ e $B$ da seguinte forma
$$\displaystyle A=\bigcup_{i=1}^{n}(I_i)\quad \quad e \quad \quad B=\bigcup_{i=1}^{n}R_j$$
onde $I_i\cap I_{i^\prime}=\emptyset$ para $i\neq i^\prime$ e $R_j\cap R_{j^\prime}=\emptyset$ para $j\neq j^\prime$ e $I_i,R_j\in \mathcal{I}$. Note que como $A\cap B=\emptyset$ então
$$I_i\cap R_j=\emptyset \quad \quad e \quad \quad A\cup B= \displaystyle\bigcup_{i=1}^{n}I_i\cup \bigcup_{j=1}^{m}R_j$$
Então pela definição de $\mu$ temos
$$\displaystyle \mu(A\cup B)=\sum_{i=1}^{n}\mu(I_i)+\sum_{j=1}^{m}\mu(R_j)=\mu(A)+\mu(B)$$
Logo por indução temos que $\mu$ é finitamente aditiva em $\mathcal{A}(\mathcal{I})$. Para mostrar a unicidade de $\mu$ seja $\theta:\mathcal{A}(\mathcal{I})\rightarrow [0,1]$ com $\theta\mid_{\mathcal{I}}=\lambda$ e $\theta$ finitamente aditiva. Então para
$$\displaystyle A\in\mathcal{A}(\mathcal{I}),\quad A=\bigcup_{i=1}^n I_i,\quad \quad I_i\cap I_j=\emptyset$$
como $\theta$ é finitamente aditiva e $\theta\mid_{\mathcal{I}}=\lambda=\mu\mid_{\mathcal{I}}$ temos
$$\mu(A)=\displaystyle \sum_{i=1}^n\mu(I_i)=\sum_{i=1}^n\lambda(I_i)=\sum_{i=1}^n\theta(I_i)=\theta(A)$$
o que implica que 
$$\mu=\theta$$
e portanto única.
Agora suponha $\lambda$ $\sigma$-aditiva, então mostremos que $\mu$ também é $\sigma$-aditiva em $\mathcal{A}(\mathcal{I})$. De fato, considere
$\{A_j\}_{j\in\mathbb{N}}$ uma sequência disjunta em $\mathcal{A}(\mathcal{I})$. Como cada $A_j\in\mathcal{A}(\mathcal{I})$, temos que existem conjuntos disjuntos $I^j_i\in\mathcal{I}$, tais que
$$A_j=\displaystyle \bigcup_{i=1}^{m_j}I^j_i$$
Assim
$$\displaystyle A=\bigcup_{j=1}^{\infty} A_j =\bigcup_{j=1}^{\infty}\bigcup_{i=1}^{m_j}I^j_i$$
Desta forma, temos duas possibilidades para $A$, ou $A\in\mathcal{A}(\mathcal{I})$ ou $A\notin \mathcal{A}(\mathcal{I})$. Vamos supor inicialmente que $A\in\mathcal{A}(\mathcal{I})$. Então como cada $A_i\cap A_j=\emptyset$ para $i\neq j$ temos que todos os $I^j_i$ são disjuntos. e como $\lambda$ é $sigma$-aditiva logo
$$\displaystyle \mu(A)=\lambda(A)=\lambda\left(\bigcup_{j=1}^{\infty}\bigcup_{i=1}^{m_j}I^j_i\right)=\sum_{j=1}^{\infty}\sum_{i=1}^{m_j}\lambda(I^j_i)=$$
$$\displaystyle \sum_{j=1}^{\infty}\sum_{i=1}^{m_j}\mu(I^j_i)=\sum_{j=1}^{\infty}\mu\left(\bigcup_{i=1}^{m_j}I^j_i\right)=\sum_{j=1}^{\infty}\mu(A_j)$$
portanto $\mu$ é $\sigma$-aditiva em $\mathcal{A}(\mathcal{I})$, se $A\in\mathcal{I}$.
Agora considere o caso em que $A\notin\mathcal{I}$. Então temos que $A\in\mathcal{A}(\mathcal{I})$, portanto 
$$A=\displaystyle \bigcup_{i=1}^{n} I_i, \quad \quad \bigcup_{j=1}^{\infty} A_j=A=\bigcup_{i=1}^{n} I_i$$
Desta forma 
$$\displaystyle I_i=A\cap I_i=\left(\bigcup_{j=1}^{\infty} A_j\right)\cap I_i=\bigcup_{j=1}^{\infty}(A_j\cap I_i)$$
como $I_i\in\mathcal{I}$ temos que pelo caso anterior que 
$$\mu(I_i)=\displaystyle \sum_{j=1}^{\infty}\mu(A_j\cap I_i)$$
Além disso, temos que 
$$A_j=\displaystyle \bigcup_{i=1}^n (A_j\cap I_i)$$
como $S_i$ são disjuntos temos que  
$$(A_j\cap I_i)\cap (A_j\cap I_n), \quad n\neq i$$
segue então, pela aditividade finita de $\mu$ temos
$$\mu(A_j)=\displaystyle \sum_{i=1}^n (A_j\cap I_i)$$
Então
$$\displaystyle \mu(A)=\mu\left(\bigcup_{i=1}^{n} I_i\right)=\sum_{i=1}^n \mu(I_i)$$
E pela equação anterior temos que
$$\displaystyle \sum_{i=1}^n \mu(I_i)=\sum_{i=1}^n\sum_{j=1}^\infty\mu(A_j\cap I_i)$$
como todos os termos da serie são positivos então podemos permutar a soma e obtemos que
$$\displaystyle \sum_{i=1}^n\sum_{j=1}^\infty\mu(A_j\cap I_i)=\sum_{j=1}^\infty\sum_{i=1}^n\mu(A_j\cap I_i)=\sum_{j=1}^\infty\mu\left(\bigcup_{i=1}^{n}(A_j\cap I_i)\right)=\sum_{j=1}^\infty\mu(A_j)$$
Logo $\mu$ é $\sigma$-aditivo em $\mathcal{A}(\mathcal{I})$ e o resultado segue.

 

Note que $\mathbb{P}_F$ satisfaz as condições da proposição, por isso existe uma única extensão de $\mathbb{P}_F$, tal que $\mathbb{P}_F$ é $\sigma$-aditiva na álgebra, desta forma basta-nos apenas estender $\mathbb{P}_F$ para a $\sigma$-álgebra, como vemos no teorema a seguir.

 

Teorema 2.4.1.2:

Dado uma função de distribuição $F$  com as propriedades P1,P2,P3,P4 então existe uma única medida de probabilidade $\mathbb{P}$ tal que 
$$\mathbb{P}((a,b])=\Delta_{a_1,b_1}\dots\Delta_{a_n,b_n} F_n(x)$$
Demonstração:

Pelos Lemas anteriores, e usando o teorema de extensão o resultado segue

Probabilidades

Sobre o Portal Action

O Portal Action é mantido pela Estatcamp - Consultoria Estatística e Qualidade, com o objetivo de disponibilizar uma ferramenta estatística em conjunto com uma fonte de informação útil aos profissionais interessados.

Facebook

CONTATO

  •  Maestro Joao Seppe, 900, São Carlos - SP | CEP 13561-180
  • Telefone: (16) 3376-2047
  • E-Mail: [email protected]