Caṕıtulo 4 Esperanza Condicional y Martingalas 4.1. Preliminares Comenzamos recordando algunos conceptos fundamentales sobre Espacios de Hilbert. Definición 4.1 Sea V un espacio vectorial real. Una función 〈*, *〉 : V × V → R es un producto interno si satisface (i) 〈x, x〉 > 0,∀x 6= 0. (ii) 〈x, y〉 = 〈y, x〉 para todo x, y ∈ V . (iii) 〈x, αy + βz〉 = α〈x, y〉+ β〈x, z〉. Si 〈x, x〉 ≥ 0 para todo x y (ii) y (iii) valen, decimos que 〈*, *〉 es una forma bilineal simétrica semipositiva definida o un semi-producto interno. El producto interno 〈*, *〉 en V define una norma ||x|| = 〈x, x〉1/2. Definición 4.2 Si (V, 〈*, *〉) es completo respecto a la norma definida por el producto interno, decimos que es un Espacio de Hilbert. Ejemplo 4.1 Para f, g ∈ L2(μ) definimos 〈f, g〉 = ∫ fg dμ. Si consideramos el espacio cociente L2(μ) y f, g se toman como representantes de sus clases de equivalencia f , ḡ respectivamente, definimos 〈f , ḡ〉 = 〈f, g〉. Entonces 〈*, *〉 es un producto interno en L2 y un semiproducto interno en L2. Hemos visto anteriormente que (L2, 〈*, *〉) es un espacio de Hilbert. Definición 4.3 Sea V un espacio vectorial real con producto interno 〈*, *〉. Si W ⊂ V , el complemento ortogonal de W se define como W⊥ = {v ∈ V : 〈v, w〉 = 0, ∀w ∈ W} Teorema 4.1 (Descomposición Ortogonal) Sea (V, 〈*, *〉) un espacio de Hilbert y W ⊂ V un subespacio lineal cerrado. Para todo x ∈ V hay una representación única x = y + z con y ∈ W y z ∈ W⊥. 68 CAPÍTULO 4. ESPERANZA CONDICIONAL Y MARTINGALAS Demostración. Sea x ∈ V , c = ınf{||x−w|| : w ∈ W} y sea (wn)n≥1 una sucesión en W con ||x−wn|| → c cuando n →∞. Usando la ley del paralelogramo obtenemos ||wm − wn||2 = 2||wm − x||2 + 2||wn − x||2 − 4 ∥∥∥1 2 (wm + wn)− x ∥∥∥ 2 Como W es un subespacio lineal, (wm + wn)/2 ∈ W y por lo tanto ||12 (wm + wn)− x|| ≥ c. Por lo tanto (wn)n≥1 es una sucesión de Cauchy: ||wm−wn|| → 0 si m,n →∞. Como V es completo y W es cerrado, también es completo, de modo que existe y ∈ W con wn → y cuando n → ∞. Sea ahora z = x − y, entonces ||z|| = ĺım ||wn − x|| = c por la continuidad de la norma. Consideremos un w ∈ W \ {0} cualquiera. Definimos ρ = −〈z, w〉/||w||2 y tenemos y + ρw ∈ W . En consecuencia c2 ≤ ||x− (y + ρw)||2 = ||z||2 + ρ2||w||2 − 2ρ〈z, w〉 = c2 − ρ2||w||2 y en conclusión 〈z, w〉 = 0 para todo w ∈ W y por lo tanto z ∈ W⊥. Falta ver la unicidad en la descomposición. Si x = y′ + z′ es otra descomposición ortogonal entonces y − y′ ∈ W y z − z′ ∈ W⊥ y además y − y′ + z − z′ = 0. En consecuencia 0 = ||y − y′ + z − z′||2 = ||y − y′||2 + ||z − z′||2 + 2〈y − y′, z − z′〉 = ||y − y′||2 + ||z − z′||2, de donde obtenemos que y = y′ y z = z′. ¥ Teorema 4.2 (de Representación de Riesz-Fréchet) Sea (V, 〈*, *〉) un espacio de Hilbert y F : V → R una función. Las siguientes afirmaciones son equivalentes: (i) F es lineal y continua. (ii) Existe f ∈ V con F (x) = 〈x, f〉 para todo x ∈ V . El elemento f ∈ V en (ii) es único. Demostración. (ii) ⇒ (i)Para cualquier f ∈ V , la función x 7→ 〈x, f〉 es lineal y continua por la definición del producto interno y la norma. (i) ⇒ (ii) Para ver el rećıproco, si F ≡ 0 escogemos f = 0. Si F no es idénticamente cero, como es una función continua, el núcleo W = F−1({0}) es un subespacio lineal cerrado y propio de V . Sea v ∈ V \W y sea v = y + z para y ∈ W y z ∈ W⊥ la descomposición ortogonal de v. Entonces z 6= 0 y F (z) = F (v)−F (y) = F (v) 6= 0. Por lo tanto podemos definir u = z/F (z) ∈ W⊥. Claramente, F (u) = 1 y para cualquier x ∈ V , tenemos F (x− F (x)u) = F (x)− F (x)F (u) = 0. Por lo tanto x− F (x)u ∈ W y 〈x− F (x)u, u〉 = 0. En consecuencia F (x) = 1 ||u||2 〈x, u〉. Definimos ahora f = u/||u||2, entonces F (x) = 〈x, f〉 para todo x ∈ V . Finalmente, para ver la unicidad, sea 〈x, f〉 = 〈x, g〉 para todo x ∈ V . Si ponemos x = f − g tenemos 0 = 〈f − g, f − g〉 de donde obtenemos que f = g. ¥ 4.2. EL TEOREMA DE RADON-NIKODYM 69 4.2. El Teorema de Radon-Nikodym Sea μ, ν medidas sobre (Ω,F). Decimos que la función medible f : Ω → [0,∞) es una densidad de ν respecto de μ si para todo A ∈ F , ν(A) = ∫ A f dμ (4.1) Por otro lado, dada cualquier función medible f : Ω → [0,∞), la ecuación (4.1) define una medida en (Ω,F). En este caso, si g : Ω → [0,∞] es medible entonces ∫ g dν = ∫ gf dμ, (4.2) de modo que g ∈ L(ν) si y sólo si gf ∈ L(μ), y en este caso (4.2) vale. Teorema 4.3 Sea ν una medida σ-finita. Si f1 y f2 son densidades de ν respecto de μ, entonces f1 = f2 c.s.(μ). Por lo tanto la densidad es única salvo por diferencias en conjuntos μ-nulos. Demostración. Sea Ω = ∪n≥1En una descomposición del espacio Ω en subconjuntos medibles de medida finita. Como la descomposición es numerable, basta con demostrar que f1 = f2 c.s.(μ) en los conjuntos En. Sea E cualquiera de estos conjuntos y sea A = E ∩ {f1 > f2}, entonces ν(A) < ∞. Por lo tanto ∫ A (f1 − f2) dμ = ν(A)− ν(A) = 0 y como en el conjunto A el integrando no es nulo, necesariamente μ(A) = 0. De manera similar se demuestra que μ({f1 < f2}) = 0 y en consecuencia f1 = f2 c.s.(μ). ¥ Usaremos la notación dν/dμ para la densidad de ν respecto de μ. Definición 4.4 Sea μ y ν dos medidas sobre (Ω,F). Decimos que ν es absolutamente continua respecto de μ (ν ¿ μ) si ν(A) = 0 para todo A ∈ F con μ(A) = 0. Decimos que las medidas μ y ν son equivalentes (μ ≈ ν) si ν ¿ μ y μ ¿ ν. Decimos que ν es singular respecto de ν (ν ⊥ μ) si existe un conjunto medible A tal que μ(A) = 0 y ν(Ac) = 0. Ejemplos 4.2 1. Sea μ una medida sobre (R,B) con densidad f respecto de la medida de Lebesgue m. Entonces μ(A) = ∫ A f dm = 0 para todo A ∈ B con m(A) = 0, de modo que μ ¿ m. Por otro lado si f > 0 c.s. respecto de la medida de Lebesgue, entonces μ(A) = ∫ A f dm > 0 si m(A) > 0, y en consecuencia μ ≈ m. En cambio, si f se anula en un conjunto de medida de Lebesgue positiva, como μ({f = 0}) = 0 pero m({f = 0}) > 0, la medida de Lebesgue no es absolutamente continua respecto de la medida μ. 2. La distribución de Poisson está concentrada en el conjunto {0, 1, 2, . . . } que tiene medida 0, de modo que es singular respecto de m. Teorema 4.4 (de Descomposición de Lebesgue) Sea μ y ν medidas σ-finitas en (Ω,F). Entonces ν puede descomponerse de manera única en una parte absolutamente continua νa y una parte singular νs respecto de μ: ν = νa + νs, donde νa ¿ μ y νs ⊥ μ. νa tiene densidad dνadμ que es medible y finita c.s.(μ). 70 CAPÍTULO 4. ESPERANZA CONDICIONAL Y MARTINGALAS Demostración. Basta con hacer la demostración en el caso en el cual ambas medidas son finitas. Consideremos el funcional T : L2(Ω,F , μ + ν) → R definido por T (h) = ∫ h dν. Este funcional es acotado ya que, usando la desigualdad de Cauchy-Schwarz, |T (h)| = ∣∣∣ ∫ h dν ∣∣∣ ≤ ( ∫ h2 dν )1/2( ∫ 1 dν )1/2 ≤ ν1/2(Ω)||h||L2(ν) ≤ ν1/2(Ω)||h||L2(μ+ν) y por lo tanto es continuo. Por el teorema de representación de Riesz-Fréchet, existe g ∈ L2(Ω,F , μ + ν) tal que para todo h ∈ L2(Ω,F , μ + ν), ∫ h dν = ∫ hg d(μ + ν) (4.3) o equivalentemente, para todo f ∈ L2(Ω,F , μ + ν), ∫ f(1− g) d(μ + ν) = ∫ f dμ (4.4) Si en (4.3) ponemos h = 1{g<0}, entonces g ≥ 0 c.s. (μ + ν). Si en cambio ponemos f = 1{g>1} en (4.4), obtenemos que g ≤ 1 c.s. (μ + ν) y en consecuencia 0 ≤ g ≤ 1. Sea ahora f ≥ 0 medible y sea (fn)n≥1 una sucesión de funciones medibles no-negativas en L2(Ω,F , μ+ ν) con fn ↑ f . Por el teorema de convergencia monótona aplicado a la medida (1− g)(μ + ν), obtenemos que (4.4) vale para toda f ≥ 0 medible. De manera similar se demuestra que (4.3) vale para toda h ≥ 0 medible. Sea E = g−1({1}). Si ponemos f = 1E en (4.4) entonces obtenemos μ(E) = 0. Definimos las medidas νa y νs para A ∈ F por νa(A) = ν(A \ E) y νs(A) = ν(A ∩ E) Entonces ν = νA + νs y νs(Ω \ E) = 0, de modo que νs ⊥ μ. Si tenemos que A ∩ E = ∅ y μ(A) = 0 entonces ∫ 1A dμ = 0. Por (4.4) también se tiene que ∫ A (1− g) d(μ + ν) = 0 Por otro lado tenemos que 1 − g > 0 en A, de modo que μ(A) + ν(A) = 0 y μ(A) = ν(A) = 0. Más generalmente, si B es medible con μ(B) = 0 entonces μ(B\E) = 0 y en consecuencia νA(B) = νA(B\E) = 0. En consecuencia νa ¿ μ y ν = νq + νs es la descomposición que buscábamos. Para obtener la densidad de νa respecto de μ, definimos f = g 1− g1Ω\E . Para cualquier A ∈ F , por (4.3) y (4.4) con h = 1A\E ∫ A f dμ = ∫ A∩Ec g d(μ + ν) = ν(A \ E) = νa(A) de modo que f = dνadμ . ¥ Corolario 4.1 (Teorema de Radon-Nikodym) Si μ y ν son medidas σ-finitas en (Ω,F), existe f medible tal que ν(A) = ∫ A f dμ, ∀A ∈ F , si y sólo si ν ¿ μ. 4.3. ESPERANZA CONDICIONAL 71 Escribimos f = dνdP y también dν = fdP . Corolario 4.2 Sean P y Q medidas de probabilidad en (Ω,F) tales que Q ¿ P . Sea G ⊂ F una sub-σálgebra. Sean Q ∣∣ G y P ∣∣ G las restricciones de Q y P a G. Entonces en (Ω,G) Q ∣∣ G ¿ P ∣∣ G y dQ ∣∣ G dP ∣∣ G es G-medible. 4.3. Esperanza Condicional Definición 4.5 Sea (Ω,F , P ) un espacio de probabilidad, X una v.a. integrable y G ⊂ F una sub-σálgebra. La esperanza condicional de X dada la σ-álgebra G es cualquier variable aleatoria Z medible respecto a G e integrable tal que ∫ A Z dP = ∫ A X dP ∀A ∈ G (4.5) Observación 4.1 (a) Usamos la notación E(X|G) para la esperanza condicional de X dada G. (b) La esperanza condicional no es única: Cualquier variable aleatoria Y que sea equivalente a Z en el sentido de se igual a ella casi seguramente tiene las mismas propiedades. (c) Observamos que las integrales de X y Z sobre los conjuntos A ∈ G coinciden. Sin embargo X ∈ F mientras que Z ∈ G. (d) La esperanza condicional no es un número, es una variable aleatoria. Veamos cuál es el sentido matemático de esta definición. Supongamos inicialmente que X ≥ 0 y definamos ν(A) = ∫ A X dP, A ∈ F . Entonces ν es finita y absolutamente continua respecto a P . Por lo tanto ν ∣∣ G ¿ P ∣∣ G . Por el teorema de Radon-Nikodym sabemos que existe la derivada y ponemos E(X|G) = dν|G dP |G la cual es G-medible por el corolario 4.2. Para cualquier G ∈ G se tiene ν|G(G) = ν(G) = ∫ G dν|G dP |G dP |G = ∫ G dν|G dP |G dP = ∫ G E(X|G) dP que es la ecuación (4.5). Si X no es positiva entonces E(X|G) = E(X+|G)− E(X−|G) satisface las condiciones de la definición. 72 CAPÍTULO 4. ESPERANZA CONDICIONAL Y MARTINGALAS Definición 4.6 Definimos la probabilidad condicional dada la (sub-)σ-álgebra G por P (A|G) = E(1A|G) para todo A ∈ F . Por lo tanto P (A|G) es una variable aleatoria tal que (a) P (A|G) es G-medible e integrable. (b) P (A|G) satisface ∫ G P (A|G) dP = P (A ∩G), (4.6) para todo G ∈ G. Definición 4.7 Sea {Xt, t ∈ T} una colección de v.a. definidas en el espacio (Ω,F , P ), donde T es algún conjunto de ındices. Definimos G = σ(Xt, t ∈ T ) la σ-álgebra generada por {Xt, t ∈ T}. Definimos E(X|Xt, t ∈ T ) = E(X|G). Ejemplo 4.3 Sea {Λi, i ≥ 1} una partición de Ω, de modo que Λi ∩ Λj = ∅ si i 6= j y ∪∞1 Λn = Ω. Definimos G = σ(Λi, i ≥ 1) de modo que podemos describir a esta σ-álgebra como G = { ⋃ i∈J Λi : J ⊂ N } Para X ∈ L1(Ω) definimos αn = αn(X) = E(X|Λn) = ∫ X P (dω|Λn) = 1 P (Λn) ∫ Λn X dP si P (Λn) > 0 y αn = 0 si P (Λn) = 0. Veamos que (a) E(X|G) c.s.= ∞∑ n=1 αn(X)1Λn . (b) Para cualquier A ∈ F , P (A|G) c.s.= ∞∑ n=1 P (A|Λn)1Λn . Para verificar (a) observamos que ∞∑ n=1 αn(X)1Λn ∈ G. Ahora escogemos Λ ∈ G y basta mostrar que ∫ Λ E(X|G) dP = ∫ Λ ( ∞∑ n=1 αn(X)1Λn ) dP = ∫ Λ X dP. (4.7) Como Λ ∈ G, Λ es de la forma Λ = ∪i∈JΛi para algún J ⊂ N. Veamos que la forma propuesta en (a) 4.3. ESPERANZA CONDICIONAL 73 satisface (4.7). ∫ Λ ∞∑ n=1 αn(X)1Λn dP = ∑ n≥1 ∑ i∈J ∫ Λi αn(X)1Λn dP = ∑ n≥1 ∑ i∈J αn(X)P (Λi ∩ Λn) = ∑ i∈J αn(X)P (Λi) = ∑ i∈J 1 P (Λi) ∫ Λi X dP P (Λi) = ∑ i∈J ∫ Λi X dP = ∫ ∪i∈JΛi X dP = ∫ Λ X dP. Esto demuestra (a). Para obtener (b) basta poner X = 1A. Ejemplo 4.4 Sea X una v.a. discreta con valores posibles x1, x2, . . . . Entonces para A ∈ F P (A|X) = P (A|σ(X)) = P (A|σ({X = xi}, i ≥ 1)) = ∞∑ i=1 P (A|X = xi)1{X=xi} Ejemplo 4.5 Supongamos que X e Y son v.a. cuya distribución conjunta es absolutamente continua con densidad f(x, y), de modo que para A ∈ B2 P [(X,Y ) ∈ A] = ∫∫ A f(x, y) dx dy. ¿Quién es P (Y ∈ C|X) para C ∈ B? Ponemos G = σ(X). Sea fX(x) = ∫ R f(x, y) dy la densidad marginal de X y definimos φ(x) = { 1 fX(x) ∫ C f(x, y) dy, si fX(x) > 0, 0 si fX(x) = 0. Veamos que P (Y ∈ C|X) = φ(X). En primer lugar observamos que ∫ C f(X, y) dy es σ(X)-medible y por lo tanto φ(X) es σ(X)-medible. Falta demostrar que para cualquier Λ ∈ σ(X), ∫ Λ φ(X) dP = P [(Y ∈ C) ∩ Λ]. Como Λ ∈ σ(X), podemos escribir Λ = {X ∈ A} para algún A ∈ B. Por el teorema de transformación tenemos ∫ Λ φ(X) dP = ∫ X−1(A) φ(X) dP = ∫ A φ(x) dPX(x) 74 CAPÍTULO 4. ESPERANZA CONDICIONAL Y MARTINGALAS y como existe la densidad conjunta de (X,Y ) obtenemos que esta expresión es igual a = ∫ A φ(x) ( ∫ R f(x, y) dy ) dx = ∫ A∩{x:fX(x)>0} φ(x)fX(x) dx + ∫ A∩{x:fX(x)=0} φ(x)fX(x) dx = ∫ A∩{x:fX(x)>0} φ(x)fX(x) dx+ = ∫ A∩{x:fX(x)>0} 1 fX(x) ∫ C f(x, y) dy fX(x) dx = ∫ A∩{x:fX(x)>0} ( ∫ C f(x, y) dy ) dx = ∫ A ( ∫ C f(x, y) dy ) dx = P (X ∈ A, Y ∈ C) = P ((Y ∈ C) ∩ Λ) 4.3.1. Propiedades de la Esperanza Condicional Proposición 4.1 Sean X e Y v.a. integrables, G ⊂ F y a, b, c números reales. Entonces (a) E(E(X|G)) = E(X). (b) E(aX + bY |G) c.s.= aE(X|G) + bE(Y |G). (c) Si X ∈ G entonces E(X|G) c.s.= X. (d) E(c|G) c.s.= c. (e) E(X|{∅,Ω}) c.s.= E(X). (f) Si X ≥ 0 c.s. entonces E(X|G) ≥ 0 c.s. (g) Si X ≤ Y c.s. entonces E(X|G) ≤ E(Y |G) c.s. (h) |E(X|G)| ≤ E(|X||G). (i) Si X es independiente de G entonces E(X|G) = E(X) c.s. Demostración. La primera propiedad se obtiene haciendo Λ = Ω en (4.5). (b) es ∫ Λ E(aX + bY |G) dP = ∫ Λ (aX + bY ) dP = a ∫ Λ X dP + b ∫ Λ Y dP = a ∫ Λ E(X|G) dP + b ∫ Λ E(Y |G) dP = ∫ Λ [ aE(X|G) + b E(Y |G)] dP. (c) es consecuencia de la tautoloǵıa ∫ Λ X dP = ∫ Λ X dP y como X es G-medible satisface las condiciones de la definición. Como toda constante es G-medible, (d) es inmediata de (c). Para (e) ∫ Λ X dP = { 0, para Λ = ∅, E(X), para Λ = Ω, es decir ∫ Λ X dP = ∫ Λ E(X) dP, para todo Λ ∈ {∅, Ω}, 4.3. ESPERANZA CONDICIONAL 75 de modo que podemos reemplazar E(X|G) por E(X). (f) se obtiene por ∫ Λ E(X|G) dP = ∫ Λ X dP ≥ 0. Usando esta propiedad y (b) aplicada a Y −X obtenemos (g). Para (h) tenemos |E(X|G)| = |E(X+|G)− E(X−|G)| ≤ E(X+|G) + E(X−|G) = E(|X||G). Para probar (j) observamos que E(X) ∈ G y que para cualquier Λ ∈ G, ∫ Λ E(X) dP = E(X)P (Λ) = E(X1Λ) = ∫ Ω X1Λ dP = ∫ Λ X dP. Esta relación dice que E(X) satisface (4.5). ¥ La siguiente proposición presenta las versiones condicionales del TCM, el lema de Fatou y el TCD. Proposición 4.2 (a) Si 0 ≤ Xn ↑ X ∈ L(Ω) cuando n → ∞ entonces E(Xn|G) ↑ E(X|G) cuando n →∞. (b) Si Xn ↓ X cuando n →∞ y X1, X ∈ L(Ω) entonces E(Xn|G) ↓ E(X|G) cuando n →∞. (c) Si {Xn, n ≥ 1} son no-negativas e integrables, entonces E(ĺım inf n→∞ Xn|G) ≤ ĺım inf n→∞ E(Xn|G) c.s. (d) Si Xn ≤ Y ∈ L1 para todo n, entonces E(ĺım sup n→∞ Xn|G) ≥ ĺım sup n→∞ E(Xn|G) c.s. (e) Si |Xn| ≤ Y ∈ L1 y Xn c.s.→ X cuando n →∞, entonces E(Xn|G) c.s.→ E(X|G) cuando n →∞. Demostración. Sabemos por la proposición anterior que E(Xn|G) es monótona creciente y no-negativa, de modo que el ĺımite Z = ĺımn→∞ E(Xn|G) existe. Usando la relación (4.5) y el TCM obtenemos para Λ ∈ G ∫ Λ Z dP = ∫ Λ ĺım n→∞ E(Xn|G) dP = ĺım n→∞ ∫ Λ E(Xn|G) dP = ĺım n→∞ ∫ Λ Xn dP = ∫ Λ ĺım n→∞ Xn dP = ∫ Λ X dP. Esto demuestra (a) y (b) sigue cambiando signos. Para demostrar (c) ponemos Zn = ınfk≥n Xk ≤ Xn y observamos que Zn c.s.→ ĺım inf Xn monotónicamente. Por lo tanto, usando la proposición anterior E(Xn|G) ≥ E(Zn|G) ↑ E(ĺım inf n→∞ Xn|G) de donde (c) sigue. Para (d) observamos que Z−Xn ≥ 0 es integrable y podemos aplicar (c). Finalmente, para (e) usamos (c) y (d). ¥ Proposición 4.3 Si X y XY son integrables, Y ∈ G, entonces E(XY |G) c.s.= Y E(X|G). 76 CAPÍTULO 4. ESPERANZA CONDICIONAL Y MARTINGALAS Demostración. Supongamos inicialmente que X e Y son no-negativas. Para Y = 1A, con A ∈ G, también se tiene que A ∩ Λ ∈ G, para todo Λ ∈ G y usando (4.5) ∫ Λ Y E(X|G) dP = ∫ Λ∩A E(X|G) dP = ∫ Λ∩A X dP = ∫ Λ XY dP y esto demuestra la relación para indicadores, y por linealidad para variables simples. Si {Yn, n ≥ 1} son v.a. simples tales que Yn ↑ Y c.s. cuando n → ∞, se tiene que XYn ↑ XY y Yn E(X|G) ↑ Y E(X|G) c.s. cuando n → ∞, y la conclusión sigue por convergencia monótona. El caso general sigue usando la descomposición X = X+ −X− y Y = Y + − Y −. ¥ Muchas propiedades de martingalas se demuestran condicionando sucesivamente. El siguiente lema es fundamental para este procedimiento Lema 4.1 (Suavizamiento) Sea H ⊂ G ⊂ F , entonces E(E(X|G)|H) = E(X|H) = E(E(X|H)|G) c.s. Demostración. Como E(X|H) ∈ G la segunda igualdad es consecuencia de la proposición 4.1 (c). Para demostrar la primera sea Λ ∈ H ⊂ G. Usando la relación (4.5) obtenemos ∫ Λ E(E(X|G)|H) dP = ∫ Λ E(X|G) dP = ∫ Λ X dP = ∫ Λ E(X|H) dP ¥ Para entender por qué el nombre del lema, recordemos el ejemplo 4.3 en el cual G = σ(Λn, n ≥ 1), donde {Λn, n ≥ 1} es una partición numerable de Ω. Entonces E(X|G) = ∞∑ n=1 αn(X)1Λn , de modo que E(X|G) es constante en cada conjunto Λn. Si G1 ⊂ G2 y ambas son generadas por particiones numerables {Λ(1)n , n ≥ 1} y {Λ(2)n , n ≥ 1}, entonces Λ(1)n ∈ G2, de modo que existe un conjunto de ındices J ⊂ N tal que Λ(1)n = ∑ j∈J Λ (2) j . Por lo tanto E(X|G1) es constante en Λ(1)n pero E(X|G2) puede cambiar de valor a medida que ω se mueve entre los conjuntos Λ(1)j , j ∈ J . Como función, E(X|G1) es más suave que E(X|G2). Teorema 4.5 Sea Y una v.a. con varianza finita y sea G una sub-σ-álgebra de F . Entonces E[(Y − E(Y |G))2] = E[Y 2]− E[(E(Y |G))2] Demostración. Usando la proposición 4.3 y el lema 4.1, E(Y E(Y |G)) = E [ E(Y E(Y |G))|G] = E [ E(Y |G) E(Y |G)] = E [ E(Y |G)2] de modo que E[(Y − E(Y |G))2] = E[Y 2] + E[(E(Y |G))2]− 2E[Y E(Y |G)] = E[Y 2]− E[(E(Y |G))2] ¥ 4.3. ESPERANZA CONDICIONAL 77 Proyecciones Sea G una sub-σ-álgebra de B. Sea L2(G) la clase de las variables aleatorias G-medibles con segundo momento finito. Si X ∈ L2(B) entonces E(X|G) es la proyección de X a L2(G), un subespacio de L2(B). La proyección de X en L2(G) es el (único) elemento de L2(G) en el cual se alcanza ınf Z∈L2(G) ||X − Z||2 Para alcanzar el ınfimo debe cumplirse que X − Z sea ortogonal a todas las variables del subespacio L2(G): 〈Y,X − Z〉 = 0, ∀Y ∈ L2(G). Es decir que ∫ Y (X − Z) dP = 0, ∀Y ∈ L2(G). Si probamos Z = E(X|G) obtenemos ∫ Y (X − Z) dP = E(Y (X − E(X|G))) = E(Y X)− E(Y E(X|G)) = E(Y X)− E(E(Y X|G)) = E(Y X)− E(Y X) = 0. 4.3.2. Desigualdades de Momentos Condicionales. Teorema 4.6 Sea X e Y v.a. y supongamos que G es una sub-σ-álgebra F . Las siguientes desigualdades de momentos valen c.s. siempre que los momentos correspondientes existan 1. E(|X + Y |r|G) ≤ cr ( E(|X|r|G) + E(|Y |r|G)), donde cr = 1 para r ≤ 1 y cr = 2r−1 para r ≥ 1. 2. Hölder. Si 1 < p < ∞, p−1 + q−1 = 1, |E(XY |G)| ≤ E(|XY ||G) ≤ (E(|X|p|G))1/p * (E(|Y |q|G))1/q 3. Minkowski (E(|X + Y |p|G)1/p ≤ (E(|X|p|G))1/p + (E(|Y |p|G)1/p 4. Jensen. Si g es una función convexa y g(X) ∈ L1, g(E(X|G)) ≤ E(g(X)|G). Demostración. Veamos la demostración de la desigualdad de Jensen. Consideremos la recta de soporte en x0; por convexidad debe estar por debajo de la gráfica de g de modo que g(x0) + λ(x0)(x− x0) ≤ g(x) (4.8) donde λ(x0) es la pendiente de la recta de soporte que pasa por (x0, g(x0)). Reemplazamos x0 por E(X|G) y x por X para obtener g(E(X|G)) + λ(E(X|G))(X − E(X|G)) ≤ g(X) (4.9) 78 CAPÍTULO 4. ESPERANZA CONDICIONAL Y MARTINGALAS Si no hay problemas de integrabilidad podemos tomar esperanza condicional respecto a G en ambos lados de (4.9). Para el lado izquierdo obtenemos g(E(X|G)) + E(λ E(X|G))(X − E(X|G))|G) = g(E(X|G)) + λ(E(X|G)) E(X − E(X|G))|G) = g(E(X|G)) donde usamos que E(X − E(X|G)|G) = 0. Por otro lado, al calcular la esperanza condicional del lado derecho de (4.9) obtenemos E(g(X)|G), y por lo tanto g(E(X|G)) ≤ E(g(X)|G). Para concluir veamos que no hay problemas de integrabilidad en (4.9). Observemos primero que podemos tomar λ(x) como la derivada por la derecha ĺım h↓0 g(x + h)− g(x) h que siempre existe y por convexidad es no-decreciente en x. Si podemos demostrar que E(X|G)(ω) es acotada como función de ω, entonces también lo seŕıan g(E(X|G)) y λ(E(X|G)), de modo que todos los términos de (4.9) seŕıan integrables. Sea ahora X ′ = X1{|E(X|G)|≤n}, observamos que E(X ′|G) = E(X1{|E(X|G)|≤n}|G) = 1{|E(X|G)|≤n} E(X|G) es acotado y podemos usar el resultado de la desigualdad de Jensen para esperanzas condicionales acotadas. Obtenemos g(E(X ′|G)) ≤ E(g(X ′)|G). Por lo tanto, cuando n →∞ E ( g(X ′)|G) = E (g(X1{|E(X|G)|≤n})|G ) = E ( g(X1{|E(X|G)|≤n}) + g(0)1{|E(X|G)|>n}|G ) = 1{|E(X|G)|≤n} E(g(X)|G) + g(0)1{|E(X|G)|>n} → E(g(X)|G). Además, cuando n →∞ g ( E(X ′|G)) = g(1{|E(X|G)≤n} E(X|G) ) → g(E(X|G)) ya que g es continua. ¥ Proposición 4.4 Si X ∈ Lp, definimos ||X||p = (E |X|p)1/p y supongamos que p ≥ 1. Entonces ||E(X|G)||p ≤ ||X||p. (4.10) Además, si Xn → X en Lp entonces E(Xn|G) → E(X|G) en Lp. Demostración. La desigualdad (4.10) vale si (E(|E(X|G)|p))1/p ≤ (E(|X|p))1/p o equivalentemente E(|E(X|G)|p) ≤ E(|X|p). A partir de la desigualdad de Jensen, si g es convexa, g(E(X|G)) ≤ E(g(X)|G). Como g(x) = |x|p es convexa para p ≥ 1 obtenemos E(|E(X|G)|p) ≤ E(|X|p). Para ver la convergencia observamos que ||E(Xn|G)− E(X|G)||p = ||E((Xn −X)|G)||p ≤ ||Xn −X||p → 0. ¥ 4.4. MARTINGALAS. 79 4.4. Martingalas. Comenzamos con un espacio de probabilidad (Ω,F , P ). Definición 4.8 Una sucesión {Fn, n ≥ 0} de sub-σ-álgebras es una filtración si es una sucesión creciente, es decir, F0 ⊂ F1 ⊂ * * * ⊂ Fn ⊂ Fn+1 ⊂ * * * ⊂ F . Si interpretamos n como el tiempo, Fn contiene la información disponible al tiempo n. También consideramos F∞ = σ(∪nFn). Definición 4.9 Una sucesión {Xn, n ≥ 0} de v.a. es adaptada a {Fn, n ≥ 1} si Xn ∈ Fn para todo n. Si Fn = σ(X0, X1, . . . , Xn) decimos simplemente que la sucesión es adaptada y llamamos a {Fn, n ≥ 1} la filtración natural. Definición 4.10 Una sucesión {Xn, n ≥ 0} de v.a. es Fn-predecible si Xn ∈ Fn−1 para todo n. Definición 4.11 Una sucesión {An, n ≥ 0} de v.a. es un proceso creciente si A0 = 0, An ↗ y {An} es predecible Definición 4.12 Una sucesión {Xn, Fn, n ≥ 1} donde Xn son v.a. integrables y {Fn} es una filtración, es una martingala si Xn es adaptada a Fn y se cumple que E(Xn+1|Fn) = Xn c.s. ∀n ≥ 0. (4.11) Decimos que la sucesión es una submartingala si E(Xn+1|Fn) ≥ Xn c.s. ∀n ≥ 0. (4.12) y una supermartingala si E(Xn+1|Fn) ≤ Xn c.s. ∀n ≥ 0. (4.13) Decimos que es una Lp-martingala si además E |Xn|p < ∞ para todo n. Decimos que es Lp-acotada si además supn E |Xn|p < ∞. Observación 4.2 1. {Xn} es una martingala si es a la vez una submartingala y una supermartingala. {Xn} es una supermartingala sii {−Xn} es una submartingala. 2. La relación (4.11) vale sii ∫ Λ Xn+1 = ∫ Λ Xn, ∀Λ ∈ Fn. Un comentario similar vale para sub y supermartingalas. 3. Podemos reemplazar la condición (4.11) por E(Xn|Fm) = Xm c.s. para cualesquiera 0 ≤ m < n. (4.14) Para ver esto basta usar repetidamente el lema de suavizamiento: E(Xn|Fm) = E(E(Xn|Fn−1)|Fm) = E(Xn−1|Fm) = E(E(Xn−1|Fn−2)|Fm) = E(Xn−2|Fm) = * * * = E(Xm+1|Fm) = Xm 80 CAPÍTULO 4. ESPERANZA CONDICIONAL Y MARTINGALAS 4. Si (Xn) es una martingala entonces E(Xn) es constante. En el caso de una submartingala, la media crece mientras que para una submartingala, decrece. Por ejemplo, para martingalas, E(Xm) = E(E(Xn|Fm)) = E(Xn). 5. Sea {Xn,Fn, n ≥ 0} una (sub, super) martingala, y sea Gn = σ(X0, X1, . . . , Xn). Entonces {Xn,Gn, n ≥ 0} también es una (sub, super) martingala. Para ver por qué es cierto esto observamos que como Xn ∈ Fn, se tiene que Gn = σ(X0, . . . , Xn) ⊂ Fn, y por suavizamiento E(Xn+1|Gn) = E(E(Xn+1|Fn)|Gn) = E(Xn|Gn) = Xn. Definición 4.13 Una sucesión integrable {Un} adaptada a {Fn} es una sucesión de diferencias de martingala si E(Un+1|Fn) = 0 ∀n ≥ 0. (4.15) {Un} es una sucesión de diferencias de submartingala (supermartingala) si E(Un+1|Fn) ≥ (≤)0 ∀n ≥ 0. (4.16) Teorema 4.7 Sea {Un} integrable y adaptada a{Fn} y sea Xn = ∑n k=0 Uk, n ≥ 0. (i) {(Xn,Fn), n ≥ 0} es una martingala sii {(Un,Fn), n ≥ 0} es una sucesión de diferencias de martingala, una submartingala sii {(Un,Fn), n ≥ 0} es una sucesión de diferencias de submartingala, y una supermartingala sii {(Un,Fn), n ≥ 0} es una sucesión de diferencias de supermartingala. (ii) Una sucesión de diferencias de martingala tiene esperanza constante 0, una sucesión de diferencias de submartingala tiene esperanza no-negativa, y una sucesión de diferencias de martingala tiene esperanza no-positiva. 4.4.1. Ejemplos. Ejemplo 4.6 Sea {Yn, n ≥ 1} una sucesión de v.a.i. con media 0 y sea Xn = ∑n k=1 Yk, n ≥ 1 con Y0 = X0 = 0. Sea Fn = σ(Y0, Y1, . . . , Yn) = σ(X0, X1, . . . , Xn), n ≥ 0. Entonces {(Xn,Fn), n ≥ 1} es una martingala y {(Yn,Fn), n ≥ 1} es una sucesión de diferencias de martingala: E(Xn+1|Fn) = E(Xn + Yn+1|Fn) = Xn + E(Yn+1|Fn) = Xn c.s. Ejemplo 4.7 Sean X ∈ L1 y {Fn, n ≥ 0} una filtración. Para n ≥ 0 definimos Xn = E(X|Fn) Entonces {(Xn,Fn), n ≥ 1} es una martingala: E(Xn+1|Fn) = E(E(X|Fn+1)|Fn) = E(X|Fn) = Xn. Ejemplo 4.8 Sea {Yn, n ≥ 1} v.a.i. con EYk = μk, Var(Yk) = σ2k y ponemos s2n = ∑n k=1 σ 2 k para n ≥ 1. Tomamos {Fn, n ≥ 1} la filtración natural. Finalmente ponemos Xn = ( n∑ k=1 (Yk − μk) )2 − s2n, n ≥ 1. 4.4. MARTINGALAS. 81 Entonces {(Xn,Fn), n ≥ 1} es una martingala. Para ver esto podemos suponer, sin pérdida de generalidad, que todas las medias valen 0. tenemos E(Xn+1|Fn) = E (( n∑ k=1 Yk + Yn+1 )2 − s2n+1|Fn ) = E (( n∑ k=1 Yk )2|Fn ) + E(Y 2n+1|Fn) + 2E (( n∑ k=1 Yk ) Yn+1|Fn ) − s2n+1 = ( n∑ k=1 Yk )2 + σ2n+1 + 2 ( n∑ k=1 Yk ) E(Yn+1|Fn)− s2n − σ2n+1 = Xn + 2 ( n∑ k=1 Yk) * 0 = Xn. En particular, si Y1, Y2, . . . son i.i.d. centradas, entonces {Xn = ( ∑n k=1 Yk) 2 − nσ21 , n ≥ 1} es una martingala. Ejemplo 4.9 Sea {Yn, n ≥ 1} una sucesión de v.a.i. con media 1 y definimos Xn = ∏n k=1 Yk, n ≥ 1, con Y0 = X0 = 1 y sea {Fn, n ≥ 1} la filtración natural. Entonces {(Xn,Fn), n ≥ 0} es una martingala porque E(Xn+1|Fn) = E(Xn * Yn+1|Fn) = Xn * E(Yn+1|Fn) = Xn * 1 = Xn. Ejemplo 4.10 Sea X0 = 1 y para n ≥ 1 definimos recursivamente Xn+1 = { 2Xn, con probabilidad 1/2, 0, con probabilidad 1/2, o equivalentemente P (Xn = 2n) = 1 2n , P (Xn = 0) = 1− 12n . Como Xn = n∏ k=1 Yk, donde Y1, Y2, . . . son i.i.d. que valen 0 ó 2 con probabilidad 1/2, Xn es el producto de variables i.i.d. con media 1, y por el ejemplo anterior es una martingala. Ejemplo 4.11 Sea {Yn, n ≥ 1} una sucesión de v.a.i.i.d. con función generadora de momentos ψ finita, y sea Sn =∑n k=1 Yk, n ≥ 1. Entonces Xn = etSn( ψ(t) )n = n∏ k=1 etYk ψ(t) , n ≥ 1, para t dentro del rango de convergencia de la f.g.m., es una martingala que se conoce como la martingala exponencial. Esto es consecuencia del ejemplo 4.9, porque Xn es el producto de n factores independientes con media 1. Ejemplo 4.12 Si {Yn, n ≥ 1} son variables independientes con densidad común f , la sucesión de cocientes de verosimilitudes es Ln = n∏ k=1 f(Yk; θ1) f(Yk; θ0) , n ≥ 0 82 CAPÍTULO 4. ESPERANZA CONDICIONAL Y MARTINGALAS donde θ0 y θ1 son los valores de algún parámetro bajo las hipótesis nula y alternativa, respectivamente. Esta sucesión es una martingala como la del ejemplo 4.9 bajo la hipótesis nula: E (f(Yk; θ1) f(Yk; θ0) ) = ∫ ∞ −∞ f(y; θ1) f(y; θ0) f(y; θ0) dy = ∫ ∞ −∞ f(y; θ1) dy = 1. Ejemplo 4.13 Sea {(Xn,Fn), n ≥ 0} una martingala y {Un, n ≥ 0} la sucesión de diferencias de martingala asociada. Sea {vk, k ≥ 0} una sucesión predecible, ponemos X0 = 0 y Xn = n∑ k=1 Ukvk, n ≥ 1. Una sucesión de este tipo se conoce como una transformada de martingala y es a su vez una martingala: E(Xn+1|Fn) = n∑ k=1 E(Ukvk|Fn) + E(Un+1vn+1|Fn) = Xn + vn+1 E(Un+1|Fn) = Xn. Ejemplo 4.14 Cualquier sucesión integrable y adaptada puede 'ajustarse' para transformarla en una martingala. Sea {Yn, n ≥ 0} una sucesión adaptada a {Fn} y pongamos X0 = Y0 y Xn = n∑ k=1 (Yk − E(Yk|Fk−1)), n ≥ 1. Por el lema de suavizamiento y el hecho de que Yk ∈ Fn para 1 ≤ k ≤ n, E(Xn+1|Fn) = E ( n+1∑ k=1 (Yk − E(Yk|Fk−1))|Fn ) = n∑ k=1 E ( Yk − E(Yk|Fk−1)|Fn ) + E ( Yn+1 − E(Yn+1|Fn)|Fn ) = n∑ k=1 (Yk − E(Yk|Fk−1)) + E(Yn+1|Fn)− E(Yn+1|Fn) = Xn de modo que {(Xn,Fn), n ≥ 1} es una martingala. Como corolario obtenemos que las sumas parciales de cualquier sucesión integrable y adaptada puede descomponerse como la suma de una martingala mas la suma de las esperanzas condicionales: n∑ k=1 Yk = Xn + n∑ k=1 E(Yk|Fk−1), n ≥ 1. Si las variables {Yn, n ≥ 1} son independientes con E Yk = μk, las esperanzas condicionales se convierten en esperanzas ordinarias y la descomposición se reduce a n∑ k=1 Yk = n∑ k=1 (Yk − μk) + n∑ k=1 μk, n ≥ 1. 4.4. MARTINGALAS. 83 Ejemplo 4.15 Sea {Yn, n ≥ 0} una cadena de Markov con los enteros como espacio de estados y matriz de transición P = (Pij). Sea f un eigenvector con eigenvalor asociado λ es decir, Pf = λf o en términos de las componentes ∑ j Pijf(j) = λf(i). En términos de esperanzas tenemos E(f(Yn+1)|Yn = i) = λf(i) o E(f(Yn+1)|Yn) = λf(Yn) y por la propiedad de Markov esto es E(f(Yn+1)|Yn) = E(f(Yn+1)|Y0, Y1, . . . , Yn) = λf(Yn) por lo tanto (λ−nf(Yn), σ(Y0, . . . , Yn)) para n ≥ 1 es una martingala. Un caso particular es el proceso de ramificación simple. Supongamos que {pk, k ≥ 0} es la distribución de la descendencia, de modo que pk es la probabilidad de que un individuo de la población tenga k descendientes. Sea m = ∑ k kpk el promedio de descendientes por individuo. Sea {Z(n)(i), n ≥ 0, i ≥ 1} una sucesión i.i.d. con función de probabilidad común {pk} y definimos de manera recursiva Z0 = 1 y Zn+1 = { Z(n)(1) + * * *Z(n)(Zn), si Zn > 0, 0, si Zn = 0, que representa el número de individuos en la generación n + 1. Entonces Zn es una cadena de Markov y Pij = P (Zn+1 = j|Zn = i) = { δ0j , si i = 0, p∗ij , si i ≥ 1, donde, para i ≥ 1, p∗ij es la j-ésima componente de la i-ésima convolución de la sucesión {pk}. Observamos que para i ≥ 1, ∞∑ j=0 Pijj = ∞∑ j=1 p∗ij j = im mientras que para i = 0 ∞∑ j=0 Pijj = P00 * 0 + 0 = 0 = im Con f(j) = j tenemos que Pf = mf y por lo tanto el proceso (m−nZn, σ(Z0, . . . , Zn)) para n ≥ 0 es una martingala. La siguiente proposición da algunos mecanismos para obtener nuevas martingalas a partir de ejemplos conocidos. Proposición 4.5 Sean a, b ∈ R y {(X(i)n ,Fn), n ≥ 0} para i = 1, 2 martingalas. Entonces (1) {(aX(1)n + bX(2)n ,Fn), n ≥ 0} es una martingala. (2) {(máx{X(1)n , X(2)n },Fn), n ≥ 0} es una submartingala. (2) {(mın{X(1)n , X(2)n },Fn), n ≥ 0} es una supermartingala. 84 CAPÍTULO 4. ESPERANZA CONDICIONAL Y MARTINGALAS Demostración. (1) es consecuencia de la linealidad de las esperanzas condicionales. Para ver (2), teniendo en cuenta que máx{X(1)n , X(2)n } ≥ X(1)n y máx{X(1)n , X(2)n } ≥ X(2)n tenemos E(máx{X(1)n+1, X(2)n+1}|Fn) ≥ máx{E(X(1)n+1|Fn), E(X(2)n+1|Fn)} = máx{X(1)n , X(2)n } lo cual demuestra (2). Para ver (3) basta cambiar signos. ¥ Proposición 4.6 Si {(Xn,Fn), n ≥ 0} es (a) una martingala y g es una función convexa o (b) una submartingala y g es convexa no-decreciente, y además E |g(Xn)| < ∞ para todo n, entonces {(g(Xn),Fn), n ≥ 0} es una submartingala. Demostración. Sea {(Xn,Fn), n ≥ 0} una martingala. Por convexidad E(g(Xn+1|Fn) ≥ g(E(Xn+1|Fn)) = g(Xn). Para submartingalas la primera desigualdad es igual pero como E(Xn+1|Fn) ≥ Xn la segunda igualdad se convierte en una desigualdad ≥ si g es no-decreciente. ¥ Teorema 4.8 (a) Si {(Xn,Fn), n ≥ 1} es una martingala, entonces {(X+n ,Fn), n ≥ 1}, {(X−n ,Fn), n ≥ 1} y {(|Xn|,Fn), n ≥ 1} son submartingalas. (b) Si {(Xn,Fn), n ≥ 1} es una martingala y E |Xn|p < ∞ para todo n y algún p > 1, entonces {(|Xn|p,Fn), n ≥ 1} es una submartingala. (c) Si {(Xn,Fn), n ≥ 1} es una submartingala, también lo es {(X+n ,Fn), n ≥ 1} (d) Si {(Xn,Fn), n ≥ 1} es una submartingala no-negativa y E |Xn|p < ∞ para todo n y algún p ≥ 1 entonces {(|Xn|p,Fn), n ≥ 1} es una submartingala. 4.5. Ortogonalidad Lema 4.2 Sea {(Xn,Fn), n ≥ 0} una martingala en L2 con sucesión de diferencias de martingala {Un}. (a) Se tiene E(UmUn) = { E(U2m), para n = m, 0, en otro caso. (b) Para m < n E(UnXm) = E(Un E(Xn|Fm)) = 0, E(XnXm) = E(Xm E(Xn|Fm)) = E(X2m), E(Xn −Xm)2 = E(X2n)− E(X2m), E ( n∑ k=m+1 Uk )2 = n∑ k=m+1 E(U2k ). (c) Si {(Xn,Fn), n ≥ 0} es una submartingala (super martingala) en L2, las mismas relaciones valen con = reemplazado por ≥ (≤). Demostración. La herramienta fundamental es el lema de suavizamiento. (a) El resultado es inmediato en el caso m = n. Si m < n, E(UnUm) = E(E(UnUm|Fm)) = E(Um E(Un|Fm)) = E(Xm * 0) = 0. (b) De manera similar, E(UnXm) = E(E(UnXm|Fm)) = E(Xm E(Un|Fm)) = E(Xm * 0) = 0, E(XnXm) = E(E(XnXm|Fm)) = E(Xm E(Xn|Fm)) = E(X2m). 4.6. DESCOMPOSICIONES 85 Usando este último resultado y E(Xn −Xm)2 = E(X2n)− 2E(XnXm) + E(X2m) = E(X2n)− E(X2m) La última igualdad es una consecuencia de este resultado. (c) Sigue de los resultados anteriores. ¥ Observación 4.3 Para martingalas se puede reescribir la tercera relación de (b) como E(X2n) = E(X 2 m) + E(Xn −Xm)2 que muestra que las martingalas tienen incrementos ortogonales, y además que E(X2n) ≥ E(X2m). 4.6. Descomposiciones Teorema 4.9 (Desomposición de Doob) Toda submartingala {(Xn,Fn), n ≥ 0} puede descomponerse de manera única en la suma de una martingala {(Mn,Fn), n ≥ 0} y un proceso creciente {(An,Fn), n ≥ 0}: Xn = Mn + An, n ≥ 0. Demostración. Recordemos el ejemplo 4.14. Ponemos M0 = X0 de modo que A0 = X0 −M0 = 0 y Mn = n∑ k=1 (Xk − E(Xk|Fk−1)), y An = Xn −Mn, de modo que {(Mn,Fn), n ≥ 0} es una martingala.Falta ver que {(An,Fn), n ≥ 0} es un proceso creciente, y ya sabemos que A0 = 0. Además, el proceso An es predecible: An = n∑ k=1 E(Xk|Fk−1)− n−1∑ k=1 Xk ∈ Fn−1. Finalmente, An+1 −An = Xn+1 −Mn+1 −Xn + Mn = (Xn+1 −Xn)− (Mn+1 −Mn) = Xn+1 −Xn − (Xn+1 − E(Xn+1|Fn)) = E(Xn+1|Fn)−Xn ≥ 0, por la definición de submartingala. Esto establece la existencia de la descomposición y falta ver que es única. Supongamos que Xn = M ′n + A ′ n es otra descomposición. Como An es predecible, A′n+1 −A′n = E(A′n+1 −A′n|Fn) = E ( (Xn+1 −Xn)− (M ′n+1 −M ′n)|Fn ) = E(Xn+1|Fn)−Xn − (M ′n −M ′n) = E(Xn+1|Fn)−Xn = An+1 −An, y como A0 = A′0 = 0 esto demuestra la unicidad del proceso creciente. Pero Mn = Xn −An = Xn −A′n = M ′n, y por lo tanto la martingala también es única. ¥ Corolario 4.3 Sea {Xn, n ≥ 0} una supermartingala. Existen una martingala {Mn, n ≥ 0} y un proceso decreciente {An, n ≥ 0} tales que Xn = Mn + An, con A0 = 0. Esta descomposición es única. 86 CAPÍTULO 4. ESPERANZA CONDICIONAL Y MARTINGALAS Ejemplo 4.16 Sea {(Xn,Fn), n ≥ 0} una martingala en L2, entonces {(X2n,Fn), n ≥ 0} es una submartingala. Para ver esto basta tener en cuenta que f(x) = x2 es una función convexa y la desigualdad de Jensen. Veamos cuál es su descomposición de Doob. Ponemos M0 = X20 y Mn = n∑ k=1 (X2k − E(X2k |Fk−1)), y An = X2n −Mn, Sea {Un, n ≥ 0} la sucesión de diferencias de martingala asociada a la martingala {Xn}. Sabemos que esta sucesión es centrada. Tenemos X2k = (Xk−1 + Uk) 2 = X2k−1 + 2Xk−1Uk + U 2 k y en consecuencia E(X2k |Fk−1) = X2k−1 + 2Xk−1 E(Uk|Fk−1) + E(U2k |Fk−1), pero E(Uk|Fk−1) = 0 y entonces E(X2k |Fk−1) = X2k−1 + E(U2k |Fk−1). Ahora An+1 −An = X2n+1 −X2n −Mn+1 + Mn = E(X2n+1|Fn)−X2n = X2n + E(U 2 m+1|Fn)−X2n = E(U2m+1|Fn), y por lo tanto la descomposición de Doob para X2n es Mn = X2n − n∑ k=1 E(U2k |Fk−1), An = n∑ k=1 E(U2k |Fk−1) El siguiente resultado, que presenta la descomposición de Krickeberg, lo enunciamos sin demostración, que puede verse en el libro Probability. A Graduate Course de A. Gut, p. 490. Teorema 4.10 (Descomposición de Krickeberg) (a) Para cualquier martingala {(Xn,Fn), n ≥ 0} con supn E(X+n ) < ∞, existen dos martingalas no-negativas {(M (i)n ,Fn), n ≥ 0}, i = 1, 2 tales que Xn = M (1)n −M (2)n . (b) Para cualquier submartingala {(Xn,Fn), n ≥ 0} con supn E(X+n ) < ∞, existen dos martingalas no-negativas {(M (i)n ,Fn), n ≥ 0}, i = 1, 2 y un proceso creciente {(A− n,Fn), n ≥ 0} tales que Xn = M (1)n −M (2)n + An. 4.7. Tiempos de Paro Definición 4.14 Una v.a. T : Ω → N = N ∪ {+∞} es un tiempo de paro si {T ≤ n} ∈ Fn para todo n. Una v.a. constante con valor entero o +∞ es un tiempo de paro. Podemos pensar que los tiempos de paro son el instante en el cual ocurre un evento aleatorio, con la convención de que toma el valor +∞ si 4.7. TIEMPOS DE PARO 87 el evento nunca ocurre. Por ejemplo, supongamos que (Xn)n≥0 es una martingala y nos interesa el primer instante en el cual vale al menos 12. Este instante es aleatorio y lo podemos describir como T = { ınfn≥0{n : Xn ≥ 12} si Xn ≥ 12 para algún n ∈ N, +∞ si no. Es decir, T (ω) = ınf n≥0 {n : Xn(ω) ≥ 12} si Xn(ω) ≥ 12 para algún n ∈ N y T (ω) = +∞ si no. Observamos que el evento {ω : T (ω) ≤ n} se puede expresar como {T ≤ n} = n⋃ k=0 {Xk ≥ 12} ∈ Fn porque {Xk ≥ 12} ∈ Fk ⊂ Fn si k ≤ n. Un tiempo de paro es acotado si existe una constante c tal que P (T ≤ c) = 1. Si T es un tiempo de paro finito denotamos por XT a la variable XT (ω) = XT (ω)(ω), es decir, toma el valor Xn siempre que T = n. Teorema 4.11 Sea T un tiempo de paro acotado por c y sea {Xn, n ≥ 0} una martingala. Entonces E(XT ) = E(X0). Demostración. Partimos de XT (ω) = ∑∞ n=0 Xn(ω)1{T (ω)=n}. Por lo tanto, suponiendo sin pérdida de generalidad que c es entero, E(XT ) = E [ ∞∑ k=0 Xn1{T=n} ] = E [ c∑ k=0 Xn1{T=n} ] = c∑ k=0 E [ Xn1{T=n} ] . Como {T = n} = {T ≤ n}\{T ≤ n−1} vemos que {T = n} ∈ Fn, y obtenemos que la expresión anterior es = c∑ k=0 E [ E[Xc|Fn]1{T=n} ] = c∑ k=0 E [ Xc1{T=n} ] = E [ Xc c∑ n=0 1{T=n} ] = E(Xc) = E(X0). ¥ Teorema 4.12 Sea T un tiempo de paro acotado por c ∈ N y sea {Xn, n ≥ 0} una submartingala. Entonces E(XT ) ≤ E(Xc). Demostración. Es similar a la del teorema 4.11 y queda como ejercicio. ¥ Definición 4.15 Sea T un tiempo de paro. Definimos la σ-álgebra FT como FT = {A ∈ F : A ∩ {T ≤ n} ∈ Fn, para todo n} Teorema 4.13 Si T es un tiempo de paro, FT es una σ-álgebra. 88 CAPÍTULO 4. ESPERANZA CONDICIONAL Y MARTINGALAS Demostración. Claramente ∅ y Ω están en FT . Si A ∈ FT entonces Ac ∩ {T ≤ n} = {T ≤ n} \ (A ∩ {T ≤ n}), y por lo tanto Ac ∈ FT . Además si (Ai)i≥1 están en FT , entonces ( ∪i≥1 Ai ) ∩ {T ≤ n} = ∪i≥1 ( Ai ∩ {T ≤ n} ) ∈ Fn, de modo que FT es cerrada bajo complementos y uniones numerables, y por lo tanto es una σ-álgebra. ¥ Teorema 4.14 Sean S, T tiempos de paro, con S ≤ T . Entonces FS ⊂ FT . Demostración. Como S ≤ T tenemos {T ≤ n} ⊂ {S ≤ n}. Por lo tanto si A ∈ FS se tiene A ∩ {T ≤ n} = A ∩ {S ≤ n} ∩ {T ≤ n} pero A ∩ {S ≤ n} ∈ Fn y {T ≤ n} ∈ Fn de modo que A ∩ {T ≤ n} ∈ Fn y en consecuencia A ∈ FT . ¥ Sea ahora {Xn, n ≥ 1} una sucesión de v.a. adaptada a la filtración {Fn}. Sea T un tiempo de paro con P (T < ∞) = 1. Entonces XT = ∑ n≥0 Xn1{T=n}, y tenemos el siguiente resultado: Teorema 4.15 XT es FT -medible. Demostración. Sea Λ ∈ B, queremos mostrar que {XT ∈ Λ} ∈ FT , es decir, tenemos que ver que {XT ∈ Λ} ∩ {T ≤ n} ∈ Fn. Pero {XT ∈ Λ} ∩ {T ≤ n} = n⋃ k=0 {XT ∈ Λ} ∩ {T = k} = n⋃ k=0 {Xk ∈ Λ} ∩ {T = k}, y {Xk ∈ Λ} ∩ {T = k} ∈ Fk ⊂ Fn para k ≤ n. ¥ Teorema 4.16 (Teorema de Muestreo Opcional de Doob) Sea {Xn, n ≥ 0} una martingala y sean S, T tiempos de paro acotados por una constante c, con S ≤ T c.s. Entonces E(XT |FS) = XS c.s. Demostración. En primer lugar |XT | ≤ ∑c n=0 |Xn| es integrable, y lo mismo ocurre para XS , y además XS es FS-medible por el teorema anterior. Falta demostrar que para todo A ∈ FS E(XS1A) = ∫ A XT dP = ∫ A XS dP = E(XT 1A) Definimos una nueva variable aleatoria R por R(ω) = S(ω)1A(ω) + T (ω)1Ac(ω). Entonces R también es un tiempo de paro: {R ≤ n} = (A ∩ {S ≤ n}) ∪ (Ac ∩ {T ≤ n}), y A ∩ {S ≤ n} ∈ Fn porque A ∈ FS . Como A ∈ FS tenemos Ac ∈ FS ⊂ FT . En consecuencia Ac ∩ {T ≤ n} ∈ Fn y concluimos que {R ≤ n} ∈ Fn y R es un tiempo de paro. Por lo tanto E(XR) = E(XT ) = E(X0). Pero E(XR) = E(XS1A + XT 1Ac), E(XT ) = E(XT 1A + XT 1Ac), restando obtenemos E(XS1A)− E(XT 1A) = 0. ¥ 4.8. DESIGUALDADES. 89 Teorema 4.17 Sea {Xn, n ≥ 0} una sucesión de v.a. adaptada a la filtración {Fn, n ≥ 0}. Supongamos que E |Xn| < ∞ para todo n y E(XT ) = E(X0) para todo tiempo de paro acotado T . Entonces X es una martingala. Demostración. Sea 0 ≤ m < n < ∞, y sea A ∈ Fm Definimos un tiempo aleatorio por T (ω) = { m si ω ∈ Ac, n si ω ∈ A. Entonces T es un tiempo de paro, de modo que E(X0) = E(XT ) = E(Xm1Ac + Xn1A). Pero también E(X0) = E(Xm1Ac + Xm1A). Restando obtenemos E(Xn1A) = E(Xm1A) o equivalentemente E(Xn|Fm) = Xm c.s. ¥ 4.8. Desigualdades. Sea (Ω,F , P ) un espacio de probabilidad y {Fn, n ≥ 0} una filtración. Sea {Xn, n ≥ 0} una sucesión de v.a. integrables con Xn ∈ Fn. Sea Wn = supj≤n |Xj |. Observamos que Wn ≤ Wn+1 y si Xn es una martingala, Wn es una submartingala ya que E(Wn) ≤ E [ n∑ j=1 |Xj | ] < ∞. La desigualdad de Markov dice que, para α > 0, P (Wn ≥ α) = E[1{Wn≥α}] ≤ 1 α E(Wn). En el caso de una martingala podemos reemplazar Wn por |Xn| en el lado derecho. Teorema 4.18 (Primera Desigualdad de Doob) Sea {Xn, n ≥ 1} una martingala o una submartingala positiva. Entonces P (Wn ≥ α) ≤ 1 α E(|Xn|). Demostración. Sea T = mın{j : |Xj | ≥ α} con la convención de que el mınimo de un conjunto vaćıo es +∞. Como g(x) = |x| es convexa y creciente en R+, tenemos que |Xn| es una submartingala. Teniendo en cuenta que {T ≤ n} = {Wn ≥ α} tenemos P (Wn ≥ α) ≤ P (T ≤ n) ≤ E(1{T≤n}) ≤ E [ |XT | α 1{T≤n} ] , y como XT = XT∧n en {T ≤ n}, P (Wn ≥ α) ≤ 1 α E[|XT∧n|1{T≤n}] ≤ 1 α E[|XT∧n|] ≤ 1 α E[|Xn|] por el teorema 4.12. ¥ Lema 4.3 Sea X ≥ 0 una v.a., p > 0 y E[Xp] < ∞. Entonces E[Xp] = ∫ ∞ 0 pλp−1P (X > λ) dλ. 90 CAPÍTULO 4. ESPERANZA CONDICIONAL Y MARTINGALAS Demostración. Tenemos ∫ ∞ 0 pλp−1P (X > λ) dλ = ∫ ∞ 0 pλp−1 E(1{X>λ}) dλ, y por el teorema de Fubini = E [ ∫ ∞ 0 pλp−11{X>λ} dλ ] = E [ ∫ X 0 pλp−1 dλ ] = E[Xp]. ¥ Teorema 4.19 (Segunda Desigualdad de Doob) Sea {Xn, n ≥ 1} una martingala o una submartingala positiva. Sea 1 < p < ∞. Existe una constante cp que depende únicamente de p tal que E[(Wn)p] ≤ cp E[|Xn|p]. Demostración. Daremos la demostración para el caso de una martingala. Como g(x) = |x| es convexa, |Xn| es una submartingala. Sea α > 0 y Yn = Xn1{|Xn|>α/2}. Para n fijo definimos Zj = E[Yn|Fj ], 0 ≤ j ≤ n. Observamos que {Zj , 0 ≤ j ≤ n} es una martingala (ver ejemplo 4.7) y además que Wn ≤ Z∗n + α2 con Z∗n = máx1≤j≤n |Zj | ya que |Xj | = |E(Xn|Fj)| = |E(Xn1{|Xn|>α/2} + Xn1{|Xn|≤α/2}|Fj)| = |E(Yn + Xn1{|Xn|≤α/2}|Fj)| ≤ |E(Yn|Fj)|+ α2 = |Zj |+ α 2 . Por la primera desigualdad de Doob tenemos P (Wn > α) ≤ P ( Z∗n > α 2 ) ≤ 2 α E(|Zn|) ≤ 2 α E(|Yn|) = 2 α E[|Xn|1{|Xn|>α/2}] Por el lema 4.3 y usando el teorema de Fubini tenemos E[W pn ] = ∫ ∞ 0 pλp−1P (Mn > λ) dλ ≤ ∫ ∞ 0 2pλp−2 E[|Xn|1{|Xn|>λ/2}] dλ = E [ ∫ 2|Xn| 0 2pλp−2 dλ |Xn| ] = 2pp p− 1 E[|Xn| p]. ¥ En la demostración vimos que cp ≤ 2pp/(p − 1). Es posible demostrar que c1/pp = p/(p − 1), lo que permite reescribir el teorema de la siguiente manera Teorema 4.20 (Doob) Sea {Xn, n ≥ 1} una martingala o una submartingala positiva. Sea 1 < p < ∞. Entonces (E[(Wn)p])1/p ≤ p p− 1(E[|Xn| p])1/p. 4.8. DESIGUALDADES. 91 Para la última desigualdad de esta sección introducimos la noción de cruces hacia arriba (upcrossings). Sea {Xn, n ≥ 0} una submartingala y sea a < b. El número de cruces hacia arriba del intervalo [a, b] es el número de veces que el proceso pasa de estar por debajo de a a estar por encima de b en un tiempo posterior. Esta idea se puede expresar de manera simple con tiempos de paro. Definimos T0 = 0 e inductivamente para j ≥ 0 Sj+1 = mın{k > Tj : Xk ≤ a}, Tj+1 = mın{k > Sj+1 : Xk ≥ b} (4.17) con la convención usual de que el mınimo de un conjunto vaćıo es +∞. Tomando como convención que el máximo de un conjunto vaćıo es 0, definimos Un = máx{j : Tj ≤ n}, (4.18) Un es el número de cruces hacia arriba de [a, b] al tiempo n Teorema 4.21 (Desigualdad de Doob para cruces hacia arriba) Sea {Xn, n ≥ 0} una submartingala, sean a < b y sea Un el número de cruces hacia arriba de [a, b] al tiempo n según la definición (4.18). Entonces E[Un] ≤ 1 b− a E[(Xn − a) +] donde (Xn − a)+ = máx{Xn − a, 0}. Demostración. Sea Yn = (Xn − a)+. Como la función φ(x) = (x − a)+ es convexa y no-decreciente, tenemos que (Yn) es una submartingala. Como Sn+1 > n obtenemos Yn = YS1∧n + n∑ i=1 (YTi∧n − YSi∧n) + n∑ i=1 (YSi+1∧n − YTi∧n) (4.19) Cada cruce hacia arriba de (Xn) entre los tiempos 0 y n corresponde a un entero i tal que Si < Ti ≤ n, con YSi = 0 y YTi = YTi∧n ≥ b− a mientras que YTi∧n − YSi∧n ≥ 0 por construcción para todo i. Por lo tanto n∑ i=1 (YTi∧n − YSi∧n) ≥ (b− a)Un. Por (4.19) obtenemos (b− a)Un ≤ Yn − YSi∧n − n∑ i=1 (YSi+1∧n − YTi∧n), y como YS1∧n ≥ 0 obtenemos (b− a)Un ≤ Yn − n∑ i=1 (YSi+1∧n − YTi∧n), Tomamos esperanzas en ambos lados: Como (Yn) es una submartingala, los tiempos de paro Ti ∧ n y Si+1 ∧ n están acotados y Ti ∧ n ≤ Si+1 ∧ n tenemos E[YSi+1∧n − YTi∧n] ≥ 0 y por lo tanto (b− a) E[Un] ≤ E[Yn]. ¥ 92 CAPÍTULO 4. ESPERANZA CONDICIONAL Y MARTINGALAS 4.9. Teoremas de Convergencia. Teorema 4.22 (Teorema de Convergencia de Martingalas) Sea {Xn, n ≥ 1} una submartingala tal que supn E(X+n ) < ∞. Entonces ĺımn→∞Xn = X existe c.s. y es finito c.s. Además, X ∈ L1. Observación 4.4 El teorema no dice que hay convergencia en L1. Esto no es cierto en general. Demostración. Sea Un el número de cruces hacia arriba de [a, b] antes de n, entonces Un es no-decreciente y por lo tanto U(a, b) = ĺımn→∞ Un existe. Por el teorema de convergencia monótona E[U(a, b)] = ĺım n→∞ E[Un] ≤ 1 b− a supn E[(Xn − a) +] ≤ 1 b− a ( sup n E[X+n ] + |a| ) ≤ c b− a < ∞ para alguna constante c que por hipótesis satisface c < ∞. La primera desigualdad viene del teorema 4.21 y la segunda de (x− a)+ ≤ x+ + |a| para a, x ∈ R. Como E[U(a, b)] < ∞, tenemos P (U(a, b) < ∞) = 1. En consecuencia Xn cruza [a, b] hacia arriba sólo un número finito de veces c.s. y si ponemos Λa,b = {ĺım sup n→∞ Xn ≥ b; ĺım inf n→∞ Xn ≤ a}, entonces P (Λa,b) = 0. Sea Λ = ⋃ a<b a,b∈Q Λa,b, entonces P (Λ) = 0 ya que los pares de racionales son numerables. Pero Λ = {ĺım sup n Xn > ĺım inf n Xn}, y concluimos que ĺımn→∞Xn existe c.s. Veamos que el ĺımite es finito. Como Xn es una submartingala, E(Xn) ≥ E(X0), y en consecuencia, E(|Xn|) = E(X+n ) + E(X−n ) = 2E(X+n )− E(Xn) ≤ 2E(X+n )− E(X0), (4.20) y por lo tanto E(ĺım n |Xn|) ≤ ĺım inf n→∞ E(|Xn|) ≤ 2 sup n E(X+n )− E(X0) < ∞, donde hemos usado el lema de Fatou, (4.20) y la hipótesis de que supn E(X+n ) < ∞. Por lo tanto Xn converge c.s. a un ĺımite finito X. Hemos mostrado además que E(|X|) = E(ĺımn |Xn|) < ∞, de modo que X ∈ L1. ¥ Corolario 4.4 Si Xn es una supermartingala no-negativa, o una martingala acotada superior o inferiormente, entonces ĺımn→∞Xn = X existe c.s. y X ∈ L1. Demostración. Si Xn es una supermartingala no-negativa, (−Xn) es una submartingala acotada superiormente por 0 y podemos usar el teorema anterior. Si Xn es una martingala acotada inferiormente, entonces Xn ≥ −c c.s. para todo n para alguna constante c > 0. Sea Yn = Xn + c, entonces Yn es una martingala no-negativa y por lo tanto también una supermartingala no-negativa y podemos aplicar lo que hemos demostrado del corolario. Si Xn es una martingala acotada superiormente entonces −Xn es una martingala acotada inferiormente. ¥ 4.9. TEOREMAS DE CONVERGENCIA. 93 Ejemplo 4.17 Consideremos un paseo al azar simple: Xn = ∑n 1 Yk donde las variables Yk, k ≥ 1 son independientes con distribución de Bernoulli de parámetro 1/2. No es difıcil demostrar que que el paseo al azar {Xn, n ≥ 1} no converge porque oscila con excursiones que se alejan cada vez más del origen, pero regresa al origen infinitas veces. Por el TCL sabemos que Xn/ √ n → N (0, 1) en distribución y en L1 y por lo tanto E |Xn| ∼ (2n/π)1/2 cuando n →∞. Para obtener convergencia en L1 necesitamos la hipótesis de integrabilidad uniforme. Recordemos la definición de este concepto. Definición 4.16 Una colección de variables aleatorias H ⊂ L1 es uniformemente integrable si ĺım a→∞ sup X∈H E[|X|1{|X|≥a}] = 0. Recordamos también las siguientes condiciones suficientes para integrabilidad uniforme, que están contenidas en la sección 1.6. Teorema 4.23 Sea H una clase de variables aleatorias a) Si supX∈H E(|X|p) < ∞ para algún p > 1, entonces H es uniformemente integrable. b) Si existe una v.a. Y tal que |X| ≤ Y c.s. para toda X ∈ H y E(Y ) < ∞, entonces H es uniformemente integrable. Definición 4.17 Decimos que una martingala {(Xn,Fn), n ≥ 1} es cerrada, regular o completa si existe una variable aleatoria Y con E(|Y |) < ∞ y Xn = E(Y |Fn) para todo n. Teorema 4.24 (Teorema de Convergencia de Martingalas) a) Sea {Xn, n ≥ 1} una martingala uniformemente integrable. Entonces ĺım n→∞ Xn = X∞ existe c.s. X∞ ∈ L1 y Xn converge a X∞ en L1. Además Xn = E(X∞|Fn). b) Rećıprocamente sea Y ∈ L1 y consideremos la martingala Xn = E(Y |Fn). Entonces {Xn, n ≥ 1} es uniformemente integrable. En otras palabras, la martingala es regular si y sólo si es uniformemente integrable. Demostración. a) Como (Xn) es uniformemente integrable, para ε > 0 existe c tal que supn E(|Xn|1{|Xn|≥c}) ≤ ε. Por lo tanto E(|Xn|) = E(|Xn|1{|Xn|≥c}) + E(|Xn|1{|Xn|<c}) ≤ ε + c. Aśı (Xn)n≥1 está acotada en L1 y en consecuencia supn E(X+n ) < ∞. Por el teorema 4.22 tenemos que ĺım n→∞ Xn = X∞ existe c.s. y X∞ ∈ L1. Para ver que Xn converge a X∞ en L1, definimos fc(x) =    c si x > c, x si |x| ≤ c, −c si x < −c. 94 CAPÍTULO 4. ESPERANZA CONDICIONAL Y MARTINGALAS Entonces fc es Lipschitz. Por integrabilidad uniforme existe c suficientemente grande tal que para ε > 0 dado E(|fc(Xn)−Xn|) < ε3 para todo n, (4.21) E(|fc(X∞)−X∞|) < ε3 . (4.22) Como ĺımXn = X∞ c.s. tenemos ĺımn→∞ fc(Xn) = fc(X∞) y por el TCD tenemos para n ≥ N , N suficientemente grande E(|fc(Xn)− fc(X∞)|) < ε3 (4.23) Usando (4.21), (4.22) y (4.23) tenemos E(|Xn −X∞|) < ε, para n ≥ N. Por lo tanto Xn → X∞ en L1. Falta demostrar que E(X∞|Fn) = Xn. Sea Λ ∈ Fm y n ≥ m, entonces E(Xn1Λ) = E(Xm1Λ) por la propiedad de martingala. Sin embargo, |E(Xn1Λ)− E(X∞1Λ)| ≤ E(|Xn −X∞|1Λ) ≤ E(|Xn −X∞|) que tiende a 0 cuando n →∞. Por lo tanto E(Xm1Λ) = E(X∞1Λ) y E(X∞|Fn) = Xn c.s. b) Ya sabemos que {Xn, n ≥ 1} es una martingala. Si c > 0 tenemos Xn1{|Xn|≥c} = E(Y |Fn)1{|Xn|≥c} = E(Y 1{|Xn|≥c}|Fn), porque {|Xn| ≥ c} ∈ Fn. para cualquier d > 0 tenemos E(|Xn|1{|Xn|≥c}) ≤ E(|Y |1{|Xn|≥c}) ≤ E(|Y |1{|Y |>d}) + dP (|Xn| ≥ c) ≤ E(|Y |1{|Y |>d}) + d c E(|Xn|) ≤ E(|Y |1{|Y |>d}) + d c E(|Y |). (4.24) Tomamos ε > 0 y escogemos d de modo que el primer término de (4.24) sea menor que ε/2, y luego escogemos c de modo que el segundo término también sea menor que ε/2. Hemos demostrado que E(|Xn|1{|Xn|>c}) ≤ ε. ¥ Corolario 4.5 Sea {Fn n ≥ 0} una filtración y F∞ = σ(∪n≥0Fn) la σ-álgebra generada por la filtración. Si Y ∈ L1(F∞) entonces ĺım n→∞ E[Y |Fn] = Y donde el ĺımite es c.s. y en L1. Demostración. Sea Xn = E(Y |Fn), entonces Xn es una martingala uniformemente integrable. Observemos que si Λ ∈ Fm ∫ Λ Y dP = ∫ Λ Xn dP → ∫ Λ X∞ dP cuando n →∞. Esto permite demostrar que ∫ Λ Y dP = ∫ Λ X∞ dP ∀Λ ∈ F∞ 4.9. TEOREMAS DE CONVERGENCIA. 95 y en consecuencia X∞ = E(Y |F∞) = Y. porque Y ∈ F∞ ¥ Ejemplo 4.18 Recordemos el ejemplo 4.10 en el cual se duplica la apuesta cuando se pierde: X0 = 0 y Xn+1 = { 2Xn, con probabilidad 1/2, 0 con probabilidad 1/2 Vimos que {(Xn,Fn), n ≥ 0} es una martingala multiplicativa con media 1. Como P (Xn = 2n) = 1 − P (Xn = 0) = 2−n, una aplicación del lema de Borel-Cantelli muestra que Xn → 0 c.s. cuando n → ∞. Pero E(Xn = 1) para todo n, el valor esperado no converge a 0, de modo que la martingala no es uniformemente integrable y no es regular. Una aplicación del teorema de convergencia de martingalas es la siguiente. Teorema 4.25 (Kolmogorov) Sea (Yn, n ≥ 1) v.a.i. centradas con E(Y 2n ) < ∞ para todo n. Supongamos que ∑∞ n=1 E(Y 2 n ) < ∞. Sea Sn = ∑n j=1 Yj, entonces ĺım n→∞ Sn = ∞∑ j=1 Yj existe c.s. y es finito c.s. Demostración. Sea Fn = σ(Y1, . . . , Yn) y observemos que E(Sn+1 − Sn|Fn) = E(Yn+1|Fn) = E(Yn+1) = 0 de modo que (Sn, n ≥ 1) es una Fn-martingala. Observamos además que sup n E(S+n ) ≤ sup n (E(S2n) + 1) ≤ ∞∑ k=1 E(Y 2k ) + 1 < ∞. El resultado sigue del teorema de convergencia de martingalas. ¥ Definición 4.18 Consideremos ahora una sucesión creciente de σ-álgebras con ındices negativos {F−n, n ≥ 0}, es decir que F−(n+1) ⊂ F−n. Una martingala invertida es una sucesión {X−n, n ≥ 0} de v.a. integrables con X−n ∈ F−n y satisface E[X−n|F−m] = X−m (4.25) con 0 ≤ n < m. Una diferencia fundamental entre una martingala y una martingala invertida es que esta última tiene último elemento pero no tiene primer elemento, mientras que para una martingala es lo contrario. Por la definición tenemos que E(X0|F−n) = X−n, para todo n ≥ 0 lo que implica que una martingala invertida es regular y por lo tanto uniformemente integrable. 96 CAPÍTULO 4. ESPERANZA CONDICIONAL Y MARTINGALAS Teorema 4.26 (Teorema de Convergencia para Martingalas Invertidas) Sea {(X−n,F−n), n ≥ 0} una martingala invertida, y sea F−∞ = ∩∞n=0F−n. Entonces la sucesión (X−n) converge c.s. y en L1 a un ĺımite X cuando n → +∞. En particular X es c.s. finita e integrable. Demostración. Sea U−n el número de cruces hacia arriba del intervalo [a, b] por (X−n)n≥0 entre el instante −n y 0. Entonces U−n crece con n y sea U(a, b) = ĺımn→∞ U−n. Por el TCM E[U(a, b)] = ĺım n→∞ E[U−n] ≤ 1 b− a E[(X0 − a) +] < ∞, por lo tanto P (U(a, b) < ∞) = 1. El mismo argumento usado en la demostración del teorema 4.22 implica que X = ĺımn→∞X−n existe c.s. Sea φ(x) = x+ = (x ∧ 0), que es convexa y creciente. Además φ(X−n) es integrable para todo n. La desigualdad de Jensen y (4.25) implican que X+−n ≤ E(X+0 |F−n), de modo que E(X+−n) ≤ E(X+0 ). Por el lema de Fatou y como X+−n ≥ 0 y X+−n → X+ c.s. obtenemos E(X+) ≤ ĺım inf n E(X+−n) ≤ E(X+0 ) < ∞. Por lo tanto X+ ∈ L1 y el mismo argumento aplicado a la martingala (−X−n) muestra que X− ∈ L1. En consecuencia X ∈ L1. Falta demostrar que la convergencia también es en L1. Observamos que en la demostración del teorema 4.24 vimos que si X−n → X c.s., si X ∈ L1 y si la sucesión (X−n) es uniformemente integrable entonces X−n → X en L1. Todas estas condiciones se satisfacen en este caso. ¥ Como aplicación demostramos la LFGN de Kolmogorov. Teorema 4.27 (LFGN) Sea (Xn)n≥1 una sucesión i.i.d. con E(|X1|) < ∞ y sea Sn = X1 + * * *+ Xn. Entonces ĺım n→∞ 1 n Sn = E(X1) c.s. Demostración. Sea F−n = σ(Sn, Sn+1, Sn+2, . . . ). Entonces F−n ⊂ F−m si n ≥ m, y el proceso M−n = E(X1|F−n) es una martingala invertida. Observemos que E(M−n) = E(X1), para todo n, y además, como la sucesión es i.i.d., para 1 ≤ j ≤ n E(X1|F−n) = E(Xj |F−n) c.s. (4.26) Por lo tanto, M−n = E(X1|F−n) = E(X2|F−n) = * * * = E(Xn|F−n). En consecuencia M−n = 1 n n∑ j=1 E(Xj |F−n) = 1 n E(Sn|F−n) = 1 n Sn c.s. Por el teorema 4.26 ĺım n→∞ 1 n Sn = X c.s. con E(X) = E(X1). Además X es medible respecto a la σ-álgebra cola, y por la ley 0-1 de Kolmogorov, tenemos que X es constante c.s. En consecuencia debe ser igual a su valor esperado. ¥