Tema 4. Producto escalar. En bachiller habéis visto los conceptos de producto
escalar, longitud, distancia y per- pendicularidad en R2 y R3. En este tema del ...
Tema 4 Producto escalar En bachiller hab´eis visto los conceptos de producto escalar, longitud, distancia y perpendicularidad en R2 y R3 . En este tema del curso se generalizan estos conceptos a Rn , junto sus propiedades. Las secciones de las que consta el tema son: Secci´on 4.1: Producto escalar en Rn . Secci´on 4.2: M´etodo de Gram-Schmidt Secci´on 4.3: Proyecci´on ortogonal. Secci´on 4.4: Isometr´ıas. Secci´on 4.5: Transformaciones del plano y del espacio. Secci´on 4.6: Problema de m´ınimos cuadrados y aplicaciones.
4.1.
Producto escalar en Rn
A continuaci´on generalizamos la noci´on de producto escalar. Definici´ on 4.1.1. Sean v = (a1 , . . . , an ), w = (b1 , . . . , bn ) dos vectores de Rn , llamaremos producto escalar (usual) de v y w al n´ umero real: v · w = a1 b1 + ... + an bn Si veis los vectores como matrices fila, daros cuenta de la siguiente igualdad: b1 b2 v|{z} ·w = a1 b1 + ... + an bn = (a1 , a2 , ..., an ) · . · w}t |v {z ... = notaci´on vectorial notaci´on matricial bn 29
30
TEMA 4. PRODUCTO ESCALAR
Por tanto las propiedades del producto escalar son semejantes a las del producto de matrices con una diferencia: el producto escalar s´ı es conmutativo. Propiedades Se verifica 1. v.u = u.v 2. v.(u + w) = v.u + v.w 3. (r v).u = r (v.u) con r ∈ R. De igual manera se generaliza la noci´on de m´odulo de un vector. Definici´ on 4.1.2.pSe llama longitud (m´odulo o norma) del vector v = (a1 , ..., an ) ∈ Rn √ a kvk = v · v = a21 + ... + a2n Propiedades Se verifica 1. kvk ≥ 0 2. kvk = 0 ⇔ v = 0 3. kr · vk = |r| · kvk con r ∈ R. Una vez que hemos definido la longitud de un vector, la distancia entre dos vectores u y v viene definida por la longitud de vector de su resta, dist(u, v) = ku − vk. Observad que si u y v pertenecen a la misma recta, la longitud ku − vk no es m´as que la distancia normal (uni dimensional) que hay entre ellos.
4.1.1.
Pit´ agoras y ´ angulos
En esta secci´on vamos a presentar propiedades que quiz´a no hay´ais visto en bachillerato. Empecemos por la desigualdad de Cauchy–Schwarz: sean u y w dos vectores de Rn , entonces |u · w| ≤ kuk · kwk Existe una demostraci´on geom´etrica que veremos m´as adelante. Sin embargo, podemos llegar al resultado simplemente haciendo cuentas. Supongamos que n = 2, u = (a, b) y w = (x, y). Entonces kuk2 · kwk2 − u · w2 = (a2 + b2 )(x2 + y 2 ) − (ax + by)2 = (ay − bx)2 ≥ 0,
4.1. PRODUCTO ESCALAR EN RN
31
teniendo la desigualdad. Si n es un n´ umero cualquiera, u = (a1 , . . . , an ) y w = (x1 , . . . , xn ). Entonces X (ai xj − aj xi )2 ≥ 0, kuk2 · kwk2 − u · w2 = 1≤i. Dado v = (4, −2, −2), calculemos proyW v y proyW ⊥ v tal que v = proyW v + proyW ⊥ v. Los pasos son los siguientes: 1. Calcular una base ortonormal de W por el proceso de Gram–Schmidt. Denotemos dicha base por B = {w1 , w2 }. 2. proyW v = U U t v, donde U es la matriz que tiene por columnas la base B. 3. proyW ⊥ v = v − proyW v. Desarrollemos cada punto: 1. Base ortonormal de W por el proceso de Gram–Schmidt. Siguiendo la notaci´on de la Secci´on 4.2, hallemos primero una base ortogonal: 7 5 2 13 u1 = (1, 2, −1), u2 = (2, 3, 1) − (1, 2, −1) = , , 6 6 3 6 A continuaci´on, la ortonormalizamos obteniendo: 1 2 −1 5 4 13 w1 = √ , √ , √ , w2 = √ ,√ ,√ 6 6 6 210 210 210
´ ORTOGONAL 4.3. PROYECCION
37
2. proyW v = U U t v: La matriz U viene dada por
√1 6
√5 210
√2 6
√4 210
−1 √ 6
√13 210
√
√
210 1√ √ 2 = |{z} 3 6 105 210 . √ √ racionalizamos −1 13 6 210 210 6
1 6
6
1 42
Entonces,
proyW v = U U t v =
2 7 3 7 1 7
3 7 26 35 3 − 35
1 7
4
3 − 35 −2 = 34 −2 35
0 2 5 −6 5
) = (4, − 12 , − 45 ). 3. proyW ⊥ v = v − proyW v = (4, −2, −2) − (0, 25 , −6 5 5
La siguiente figura muestra la descomposici´on de v en dos vectores, uno en el plano W y otro en W ⊥ . El plano est´a dibujado W en azul, su ortogonal en rojo, el vector v en verde y sus proyecciones en naranja.
38
TEMA 4. PRODUCTO ESCALAR
Una vez llegado a este punto, os recomendamos leer (o volver a leer) la secci´on ”Iluminaci´on de objetos”del documento “Introducci´on del Tema 4”.
4.4.
Isometr´ıas
Si una aplicaci´on lineal no modifica las longitudes, podemos imaginar c´omo son las im´agenes de ciertos objetos. A estas aplicaciones se denominan isometr´ıas. Definici´ on 4.4.1. Una aplicaci´on lineal f : Rn → Rm es una isometr´ıa si conserva el producto escalar, es decir, si ∀ u, v ∈ Rn se verifica que u · v = f (u) · f (v). Otras definiciones de isometr´ıa son: Aplicaci´on que conserva longitudes, es decir, kuk = kf (u)k.
´ 4.5. TRANSFORMACIONES GEOMETRICAS EN R2 Y R3
39
Aplicaci´on donde la imagen de la base can´onica sigue siendo un conjunto ortonormal. Como consecuencia del punto anterior, aplicaci´on definida por una matriz A = MCC (f ) ortogonal. Es decir, At · A = In . Es importante retener los siguientes puntos: 1. Una aplicaci´on lineal ortogonal es inyectiva. Si f (v) = 0 ⇒ kf (v)k = 0 = kvk ⇒ v = 0 ⇒ ker(f ) = 0. 2. No tiene que ser biyectiva. Si n = m, s´ı es biyectiva; si n < m, no es biyectiva. 3. En particular, un cambio de base entre dos bases ortonormales es una aplicaci´on ortogonal.
4.5.
Transformaciones geom´ etricas en R2 y R3
En esta secci´on presentamos las principales transformaciones geom´etricas del plano y del espacio
4.5.1.
Transformaciones en el plano
Las transformaciones del plano se dividen en: proyecciones ortogonales sobre una recta, simetr´ıas respecto una recta, giros alrededor del origen. Para cada una de ellas vamos a ver c´omo se construye su matriz asociada. Proyecci´ on ortogonal sobre la recta de ecuaci´ on ax + by = 0 Denotemos fp la aplicaci´on de proyecci´on ortogonal sobre la recta r : ax + by = 0, tal que fp (v) = proyr v. Consideremos la base de R2 formada por el vector director de la recta (−b, a) y el vector perpendicular a la recta (a, b). Normalizando, obtenemos la siguiente base de R2 . −b a a b , v2 = √ ,√ ,√ B = v1 = √ a2 + b2 a2 + b2 a2 + b2 a2 + b 2 Como fp (v1 ) = v1 y fp (v2 ) = (0, 0), la matriz de f asociada a la base B viene dada por 1 0 MBB (fp ) = 0 0
40
TEMA 4. PRODUCTO ESCALAR
Ahora, aplicando la teor´ıa matricial sobre los cambios de base, tenemos que MCC (fp ) = PBC MBB (fp ) PCB , donde PBC =
√ −b a2 +b2 √ a a2 +b2
√ a a2 +b2 √ b a2 +b2
!
−1 t , PCB = PBC = PBC =
√ −b a2 +b2 √ a a2 +b2
√ a a2 +b2 √ b a2 +b2
!
As´ı MCC (fp ) =
√ −b a2 +b2 √ a a2 +b2
√ a a2 +b2 √ b a2 +b2
!
1 0 0 0
√ −b a2 +b2 √ a a2 +b2
√ a a2 +b2 √ b a2 +b2
!
==
b2 a2 +b2 −ab a2 +b2
−ab a2 +b2 a2 a2 +b2
!
(4.2) Veamos que aplicando la metodolog´ıa de la Secci´on 4.3, obtenemos la misma matriz. Sea U la matriz formad por la base ortonormal de la recta, ! U=
√ −b a2 +b2 √ a a2 +b2
,
entonces proyr v = U U t v. Verificad que la matriz U U t es exactamente la matriz (4.2). Observad que los vectores de la recta dada < (−b, a) > permanecen fijos, es decir, para v ∈< (−b, a) >, f (v) = v. En cambio, esta aplicaci´on no es una isometr´ıa. Por ejemplo, 6 0. De hecho, la imagen de la proyecci´on sobre (a, b) 6= (0, 0), fp (a, b) = (0, 0) y kf (a, b)k = 2 la recta es la propia recta y no todo R . Simetr´ıa respecto a la recta de ecuaci´ on ax + by = 0 Denotemos por fs la aplicaci´on de simetr´ıa tal que fs (v) = 2fp (v) − v. Utilizando esta definici´on de la aplicaci´on, la matriz que la define ser´a 2MCC (fp ) − I. A´ un as´ı, vamos a seguir una razonamiento an´alogo al anterior para deducir la matriz. Consideremos la base de R2 formada por el vector director de la recta (−b, a) y el vector perpendicular a la recta (a, b). Normalizando obtenemos la base ortonormal del plano −b a a b ,√ ,√ B = v1 = √ , v2 = √ . a2 + b2 a2 + b2 a2 + b2 a2 + b 2 Entonces, fs (v1 ) = v1 y fs (v2 ) = −v2 . Por lo tanto, la matriz de f asociada a la base B viene dada por 1 0 MBB (fs ) = . 0 −1 Ahora, aplicando la teor´ıa matricial sobre los cambios de base, tenemos que MCC (fs ) = PBC MBB (fs ) PCB ,
´ 4.5. TRANSFORMACIONES GEOMETRICAS EN R2 Y R3
41
donde PBC =
√ −b a2 +b2 √ a a2 +b2
√ a a2 +b2 √ b a2 +b2
!
, PCB =
−1 PBC
=
t PBC
=
√ −b a2 +b2 √ a a2 +b2
√ a a2 +b2 √ b a2 +b2
!
.
As´ı MCC (fs ) =
√ −b a2 +b2 √ a a2 +b2
√ a a2 +b2 √ b a2 +b2
!
1 0 0 −1
√ −b a2 +b2 √ a a2 +b2
√ a a2 +b2 √ b a2 +b2
!
b2 −a2 a2 +b2 −2ab a2 +b2
=
−2ab a2 +b2 a2 −b2 a2 +b2
!
(4.3) Observad que los vectores de la recta dada < (−b, a) > permanecen fijos, es decir, para v ∈< (−b, a) >, f (v) = v. −→ Si v ∈< / (−b, a) >, entonces f (v) 6= v, ¿sabr´ıas decir por qu´e? Por otro lado, esta transformaci´on es una isometr´ıa porque no modifica las longitudes. M´as concretamente, kvk = kfs (x)k. Ejemplo 4.5.1. Veamos la simetr´ıa respecto la recta x = y. El m´etodo consta s´olo de dos pasos: 1. Hallar una base ortonormal, definida por el vector normal de la recta y su perpendicular. 2. Hacer la multiplicaci´on de la Igualdad (4.3). Desarrollemos cada punto: 1. El vector director de la recta es (1, 1) y el de su complemento ortogonal (1, −1). Si −1 los normalizamos, obtenemos B = {( √12 , √12 ), ( √12 , √ )}. 2 2. MCC (fs ) =
√1 2 √1 2
√1 2 −1 √ 2
!
1 0 0 −1
√1 2 √1 2
√1 2 −1 √ 2
!
=
0 1 1 0
.
La matriz podr´ıamos haberla deducido directamente, pues es f´acil de observar que fs (1, 0) = (0, 1) y fs (0, 1) = (1, 0). Observad que para hallar la imagen de un vector tan s´ olo hay que intercambiar sus coordenadas. Gr´aficamente, veamos c´omo fs transforma la casa dibujada en la portada del libro de G. Strang. Recordad que la casa ven´ıa definida por las coordenadas (−6, −7), (−6, 2), (−7, 1), (7, 1), (0, 8), (6, −7), (6, 2), (0, −2), (0, −7), (−3, −7) y (−3, −2),
42
TEMA 4. PRODUCTO ESCALAR
Entonces, para calcular su imagen, calculamos la im´agenes de las coordenadas, las unimos de nuevo y obtenemos la siguiente figura:
Giro alrededor del origen de ´ angulo α Denotemos fg la aplicaci´on de giro alrededor del origen de un ´angulo α dado tal que, para v ∈ R2 , f (v) es el vector que resulta de girar v un ´angulo de α grados.
´ 4.5. TRANSFORMACIONES GEOMETRICAS EN R2 Y R3
43
La matriz de fg asociada a la base can´onica vendr´a definida por las im´agenes de (1, 0), ´ (0, 1). Estas son las siguientes: fg (1, 0) = (cos α, senα), fg (0, 1) = (−senα, cos α) Por lo tanto MCC (fg ) =
cos α, −senα senα cos α
Observad que el u ´nico vector que permanece fijo es el origen (0, 0). Adem´as, esta aplicaci´on es una isometr´ıa porque al girar no modificamos longitudes. Esto equivale a decir que fg (0, 1) y fg (1, 0) permanecen siendo ortogonales y unitarios. Ejemplo 4.5.2. Sea α = −90 = 270. Entonces la matriz de giro es 0 1 cos 270, −sen270 MCC (f ) = . = −1 0 sen270 cos 270 Consideremos de nuevo la casa dibujada en la portada del libro de G. Strang. Entonces, si le aplicamos el giro, queda de la siguiente manera:
Comparad, aunque sea s´olo por curiosidad, esta imagen con la imagen de la simetr´ıa respecto la recta x = y. Una vez vistos los giros, os recomendamos leer (o volver a leer) la construcci´on de los p´etalos de la flor descrita en el documento “Introducci´on del Tema 4”.
44
TEMA 4. PRODUCTO ESCALAR
4.5.2.
Transformaciones en el espacio
De forma an´aloga, vamos a considerar en R3 las siguientes transformaciones: 1. proyecci´on ortogonal sobre un plano, 2. simetr´ıa respecto un plano, 3. proyecci´on ortogonal sobre una recta, 4. simetr´ıa respecto una recta, 5. giro de ´angulo α de una recta que pasa por el origen. Para cada una de ellas vamos a ver c´omo se construye su matriz asociada. Proyecci´ on sobre un plano ax + by + cz = 0 Denotemos por fPπ la aplicaci´on de proyecci´on ortogonal al plano π : ax + by + cz = 0, tal que para v ∈ R3 , fPπ (v) = proyπ v. Consideremos ahora una base ortonormal del plano {v1 , v2 }, que calculamos partiendo de una base del plano y aplic´ando Gram-Schmidt. A esta base le a˜ nadimos el vector unitario ortogonal al plano, v3 = √a2 +ba 2 +c2 , √a2 +bb 2 +c2 , √a2 +bc 2 +c2 , obteniendo una base B ortonormal de R3 . Fijaros que la ecuaci´on impl´ıcita de π nos dice que su complemento ortogonal es la recta π ⊥ = h(a, b, c)i. Como fPπ (v1 ) = v1 , fPπ (v2 ) = v2 , fPπ (v3 ) = 0, la matriz de fPπ asociada a B viene dada por 1 0 0 MBB (fPπ ) = 0 1 0 0 0 0
Por consiguiente,
MCC (fPπ ) = PBC MBB (fPπ )PCB ,
(4.4)
donde las columnas de PBC vienen definidas por los vectores de B y, debido a que B es −1 t = PBC . ortonormal, PCB = PBC Del mismo modo que ocurr´ıa en el plano, aplicando la metodolog´ıa de la Secci´on 4.3, obtenemos la misma matriz. Sea U la matriz formad por la base ortonormal del plano v1 , v2 , . . .. .. U = v1 v2 , .. .. . .
´ 4.5. TRANSFORMACIONES GEOMETRICAS EN R2 Y R3
45
entonces proyπ v = U U t v. Verificad que la matriz U U t es exactamente la matriz (4.4). Observad que los vectores del plano π permanecen fijos, es decir, para v ∈ π, f (v) = v. En cambio, esta aplicaci´on no es una isometr´ıa. Por ejemplo, (a, b, c) 6= (0, 0, 0), fP (a, b, c) = (0, 0) y kfP (a, b, c)k 6= 0. De hecho, la imagen de la proyecci´on sobre el plano es el propio plano y no todo R3 . Simetr´ıa respecto a un plano ax + by + cz = 0 Denotemos por fSπ la aplicaci´on de simetr´ıa respecto al plano π : ax + by + cz = 0, tal que fSπ (v) = 2proyπ (v) − v. Utilizando esta definici´on de la aplicaci´on, la matriz que la un as´ı, vamos a seguir una razonamiento an´alogo al anterior define ser´a 2MCC (fPπ ) − I. A´ para deducir la matriz. Como antes, tomemos una base ortonormal del plano {v1 , v2 }, a˜ nadimos el vector unitario perpendicular al plano, v3 = √a2 +ba 2 +c2 , √a2 +bb 2 +c2 , √a2 +bc 2 +c2 , obteniendo una base B ortonormal de R3 . Como fSπ (v1 ) = v1 , fSπ (v2 ) = v2 , fSπ (v3 ) = −v3 , entonces 1 0 0 MBB (fSπ ) = 0 1 0 . 0 0 −1 As´ı tenemos
t MCC (fSπ ) = PBC MBB (fSπ )PCB = PBC MBB (fSπ )PBC .
Observad que los vectores del plano son los u ´nicos que permanecen fijos, es decir, para π v ∈ π, fS (v) = v. Por otro lado, esta transformaci´on es una isometr´ıa porque no modifica las longitudes. M´as concretamente, kvk = kfSπ (x)k para todo v. −→ ¿Os hab´eis dado cuenta de que fSπ (v) = 2proyπ (v) − v = v − 2proyπ⊥ (v)?
Ejemplo 4.5.3. Consideremos el plano π : x = y. Hallemos la matriz MCC (fSπ ). Siguiendo la metodolog´ıa descrita, pasos a dar en el problema son: 1. calcular base ortonormal del plano; 2. calcular vector unitario de su complemento ortonormal; t 3. multiplicamos MCC (fSπ ) = PBC MBB (fSπ )PBC .
Desarrollemos dichos pasos. 1. Una base ortonormal del plano viene dada por v1 =
√1 , √1 , 0 2 2
, v2 = (0, 0, 1).
46
TEMA 4. PRODUCTO ESCALAR 2. El complemento ortonormal es la recta r = h(1, −1, 0)i, por lo que v3 =
√1 , − √1 , 0 2 2
.
3. As´ı,
MCC (fSπ ) =
√1 2 √1 2
0
0 0 1
1 √ 0 1 0 0 2 1 0 1 0 √ 0 2 0 0 −1 0 0 1
√1 2 −1 √ 2
t
0 1 0 = 1 0 0 . 0 0 1 0
√1 2 −1 √ 2
Geom´etricamente, consideremos por ejemplo el cubo definido por los puntos (2, 3, 1), (2, 4, 1), (2, 4, 2), (2, 3, 2), (1, 3, 2), (1, 4, 2), (1, 4, 1) y (1, 3, 1), el cubo rojo de la figura que aparece a continuaci´on. Si hacemos su imagen por simetr´ıa, obtenemos el cubo verde.
´ 4.5. TRANSFORMACIONES GEOMETRICAS EN R2 Y R3
47
Proyecci´ on sobre una recta Sea r = h(a, b, c)i una recta en el espacio y a la vez espacio vectorial (pasa por el origen). Denotemos por fPr la aplicaci´on de proyecci´on ortogonal sobre la recta, tal que para v ∈ R3 , fPr (v) = proyr v.
48
TEMA 4. PRODUCTO ESCALAR
Tomemos el vector director unitario de la recta v1 , a b c ,√ ,√ v1 = √ , a2 + b 2 + c 2 a2 + b 2 + c 2 a2 + b2 + c2 y lo completamos a una base B ortonormal de R3 . Como fPr (v1 ) = v1 , fPr (v2 ) = 0, fPr (v3 ) = 0, tenemos 1 0 0 MBB (fPr ) = 0 0 0 . 0 0 0 As´ı, siguiendo el mismo razonamiento que en secciones anteriores, t MCC (fPr ) = PBC MBB (fPr )PCB = PBC MBB (fPr )PBC .
(4.5)
Del mismo modo que ocurr´ıa en el plano, aplicando la metodolog´ıa de la Secci´on 4.3, obtenemos la misma matriz. Sea U la matriz formad por v1 , a U =
√
a2 +b2 +c2 b a2 +b2 +c2 c √ a2 +b2 +c2 √
,
entonces proyπ v = U U t v. Verificad que la matriz U U t es exactamente la matriz (4.5). Observad que los vectores de la recta r permanecen fijos, es decir, para v ∈ r, f (v) = v. En cambio, esta aplicaci´on no es una isometr´ıa. Por ejemplo, la imagen del plano ax + by + cz = 0, complemento ortogonal de la recta, es 0. −→ ¿Os hab´eis dado cuenta de que fPr (v) = v − proyr⊥ (v)? Simetr´ıa respecto a una recta Sea r = h(a, b, c)i una recta en el espacio y a la vez espacio vectorial (pasa por el origen). Denotemos por fSr la aplicaci´on de simetr´ıa respecto a r, tal que fSr (v) = 2proyr (v) − v. Utilizando esta definici´on de la aplicaci´on, la matriz que la define ser´a 2MCC (fP ) − I. A´ un as´ı, vamos a seguir una razonamiento an´alogo al anterior para deducir la matriz. Tomemos el vector unitario de la recta v1 y lo completamos a una base B ortonormal de R3 . Entonces, como fSr (v1 ) = v1 , fSr (v2 ) = −v2 , fSr (v3 ) = −v3 , tenemos 1 0 0 MBB (fSr ) = 0 −1 0 0 0 −1
t . As´ı MCC (fSr ) = PBC MBB (fSr )PCB = PBC MBB (fSr )PBC Observad que los vectores de la recta son los u ´nicos que permanecen fijos. Por otro lado, esta transformaci´on es una isometr´ıa porque no modifica las longitudes. M´as concretamente, kvk = kfSr (x)k para todo v.
−→ ¿Os hab´eis dado cuenta de que fSr (v) = 2proyr (v) − v = v − 2proyr⊥ (v)?
´ 4.5. TRANSFORMACIONES GEOMETRICAS EN R2 Y R3
49
Giro de ´ angulo α alrededor de una recta que pasa por el origen Sea r = h(a, b, c)i una recta en el espacio y a la vez espacio vectorial (pasa por el origen). Denotemos por fG la aplicaci´on de giro respecto a r de ´angulo α. Para hallar la matriz que la define, tomemos el vector unitario de la recta v1 y lo completamos a una base B ortonormal de R3 . Entonces, tenemos fG (v1 ) = v1 , fG (v2 ) = cos α v2 + senα v3 , fG (v3 ) = −senα v2 + cos α v3 . Por tanto
1 0 0 MBB (fG ) = 0 cos α −senα 0 senα cos α
Ahora, como en las transformaciones anteriores, MCC (fG ) = PBC MBB (fG )PCB = t . PBC MBB (fG )PBC
4.5.3.
Traslaciones
Una traslaci´on o desplazamiento de vector (a, b, c) tiene por ecuaci´on T (x, y, z) = (x + a, y + b, z + c). Geom´etricamente equivale a sumar a cada vector del espacio el vector (a, b, c). Dichas transformaciones no son lineales, pero permiten calcular algunas transformaciones u ´tiles en el plano y en el espacio Por ejemplo, si queremos hacer una simetr´ıa respecto a el plano π : ax + by + cz = d, con d 6= 0 por lo que no pasa por el origen, ya no es v´alida la construcci´on descrita en la secci´on anterior. La idea consiste en trasladar el plano al origen, hacer la simetr´ıa y volver al lugar del plano en el espacio. Se hace en tres pasos: 1. Trasladamos el plano π al origen. Para ello calculamos un punto (a0 , b0 , c0 ) del plano y tomamos como traslaci´on T1 (x, y, z) = (x − a0 , y − b0 , z − c0 ). 2. El plano trasladado es ahora ax+by +cz = 0. Calculamos ahora la simetr´ıa respecto a este plano 3. Devolvemos el plano a su posici´on mediante la traslaci´on inversa T2 (x, y, z) = (x + a0 , y + b0 , z + c0 ) El mismo m´etodo se puede seguir para calcular cualquier tipo de simetr´ıas, proyecciones o giros alrededor de puntos, rectas o planos que no pasen por el origen.
50
TEMA 4. PRODUCTO ESCALAR
4.6.
Aproximaci´ on por m´ınimos cuadrados
Al principio de este curso, estudiar la resoluci´on de un sistema de ecuaciones lineales como el que aparece a continuaci´on, a11 x1 + a12 x2 + ... + a1n xn = b1 a21 x1 + a22 x2 + ... + a2n xn = b2 , (4.6) . ................................. am1 x1 + am2 x2 + ... + amn xn = bm
equival´ıa a saber si existe soluci´on, y si es as´ı, calcularla. Basta aplicar Gauss a la matriz ampliada (A | b) y aplicar el teorema de Rouch´e–Fr¨obenius. Pero a estas alturas del curso, el problema lo podemos plantear de forma diferente: ”Estudiar la resoluci´on de un sistema de ecuaciones lineales equivale a estudiar si el vector independiente (b1 , . . . , bm ) pertenece al subespacio vectorial ImA.” Supongamos ahora que tenemos un sistema Ax = b incompatible. ¿Cu´al ser´a el vector de la forma Ax m´as cercano a b? Esto nos dar´ıa una soluci´on aproximada del sistema. La respuesta es f´acil: la proyecci´on ortogonal del vector b al subespacio ImA. Fijaros que si proyImA b = y, entonces existe un vector x b tal que Ab x = y,
ky − bk= kAb x − bk = m´ınn kAx − bk. x∈R
Por lo tanto, lo visto en las secciones anteriores nos sirve para encontrar una soluci´on aproximada del sistema que se denomina soluci´on por m´ınimos cuadrados. Definici´ on 4.6.1. Sea A ∈ Mm×n (R), b ∈ Rm . Una soluci´on por m´ınimos cuadrados del sistema Ax = b es encontrar x ∈ Rn que haga m´ınima la distancia kAx − bk Si aplicamos la metodolog´ıa explicada anteriormente, podr´ıamos hallar una soluci´on por m´ınimos cuadrados de un sistema incompatible siguiendo los siguientes pasos: 1. Calcula la proyecci´on de b en el subespacio ImA. La denotamos y. 2. Resuelve al sistema de ecuaciones Ax = y. Sin embargo, el siguiente resultado proporciona un m´etodo que conlleva menos c´alculo que el anterior. Proposici´ on 4.6.1. El conjunto de soluciones por m´ınimos cuadrados de Ax = b coincide con el conjunto de soluciones del sistema At Ax = At b.
´ POR M´INIMOS CUADRADOS 4.6. APROXIMACION
51
Demostraci´on. Decir que x b es una soluci´on por m´ınimos cuadrados del sistema Ax = b, equivale a decir que Ab x − b es ortogonal Im A. Entonces: (Ab x − b) ⊥ Im A ⇔ (Ab x − b) · Ax = 0 ∀x ∈ Rn ⇔
⇔ At (Ab x − b) · x = 0 ⇔ At (Ab x − b) = 0 ⇔ At Ab x = At b.
A la hora de hacer problemas, tened en cuenta que: 1. El sistema At Ax = At b es siempre compatible. 2. La matriz At A es cuadrada. Puede demostrarse que es invertible si y s´olo si las columnas de A son independientes. En este caso hay algoritmos para calcular dicha inversa de forma eficiente. Quiz´as el m´as conocido se basa en la descomposici´on QR. 3. Se llama error de m´ınimos cuadrados a la distancia kAb x − bk, donde x b es una soluci´on en m´ınimos cuadrados del sistema.
4.6.1.
Ajuste de curvas
La soluci´on por m´ınimos cuadrados tiene numerosas aplicaciones al ajuste de datos. Recta de regresi´ on Suponed que tenemos n puntos disjuntos en el plano R2 , (x1 , y1 ), . . . , (xn , yn ) y queremos encontrar la recta y = cx + d que mejor se aproxime a esos puntos. Este problema tiene soluci´on u ´nica cuando todos los puntos pertenecen a la misma recta, hecho que no suele ocurrir. Por tanto, se trata de encontrar la mejor soluci´on del siguiente sistema: cx1 + d = y1 cx2 + d = y2 ........ cxn + d = yn
donde las inc´ognitas son c y d. Si escribimos el sistema de forma matricial, tenemos: y1 x1 1 y2 x2 1 c ... ... d = ... xn 1 yn
52
TEMA 4. PRODUCTO ESCALAR
Observad si tenemos 3 puntos que no pertenecen a la misma recta, el rango de la matriz de coeficientes es 2 y el de la matriz ampliada es 3, por lo que el sistema es incompatible. Entonces, aplicamos la proposici´on 4.6.1 para encontrar la soluci´on por m´ınimos cuadrados, resolviendo el sistema asociado
x1 x2 ... xn 1 1 ... 1
x1 1 y1 x2 1 c x1 x2 ... xn y2 . = ... ... d ... 1 1 ... 1 yn xn 1
Observad la facilidad de calcular una soluci´on de este sistema, ya que consta de 2 ecuaciones con dos inc´ognitas.
Ejemplo 4.6.1. Tenemos los puntos {(2, 1), (5, 2), (7, 3), (8, 3)} y vamos a calcular su recta de regresi´on. El sistema a resolver es el siguiente:
2 2 5 7 8 5 1 1 1 1 7 8
1 1 2 2 5 7 3 c 1 = 1 1 1 1 3 1 d 3 1
Una vez realizadas las operaciones, 5 La soluci´on es: c = 14 , d= en la siguiente figura.
2 7
142 22 22 4
c d
=
57 9
y la gr´afica de la recta junto los puntos quedan reflejados
´ POR M´INIMOS CUADRADOS 4.6. APROXIMACION
4.6.2.
53
Ajuste general de curvas
Una modificaci´on del m´etodo anterior sirve para ajustar datos a curvas que no sean rectas, en el sentido de buscar la curva de una determinada familia que se ajuste mejor a los puntos dados. Supongamos, por ejemplo, que tenemos k funciones en x (polinomios) f1 (x), . . . , fk (x), y buscamos la mejor curva de la forma y = c1 f1 (x) + .... + ck fk (x) que se ajuste mejor a los puntos dados del plano (x1 , y1 ), . . . , (xn , yn ). As´ı, nos encontramos con el problema de resolver el siguiente sistema lineal c1 f1 (x1 ) + .... + ck fk (x1 ) = y1 c1 f1 (x1 ) + .... + ck fk (x1 ) = y1 , .................... c1 f1 (x1 ) + .... + ck fk (x1 ) = y1
54
TEMA 4. PRODUCTO ESCALAR
que tiene como las inc´ognitas c1 , . . . , ck . La expresi´on matricial de este sistema es:
f1 (x1 ) f2 (x1 ) f1 (x2 ) f2 (x2 ) ... ... f1 (xn ) f2 (xn )
... fk (x1 ) c1 ... fk (x2 ) c2 ... ... ... ck ... fk (xn )
y1 y2 = ... , yn
que en la mayor´ıa de los casos, habr´a que resolver por m´ınimos cuadrados. Por tanto, la ecuaci´on auxiliar a resolver es
f1 (x1 ) . . . f1 (xn ) f1 (x1 ) . . . f1 (xn ) f1 (x1 ) . . . fk (x1 ) c1 y1 ... ... ... ... ... ... ... = ... ... ... ... . fk (x1 ) . . . fk (xn ) f1 (xn ) . . . fk (xn ) fk (x1 ) . . . fk (xn ) ck yn Ejemplo 4.6.2. Dados los puntos (1, 1), (2, 3), (3, 5), (4, 8), (5, 9), vamos a calcular la mejor curva de la forma y = ax2 + bx que se aproxime a los puntos dados. El sistema a resolver es:
1 4 9 16 25 1 2 3 4 5
1 4 9 16 25
1 2 3 4 5
a 1 4 9 16 25 b = 1 2 3 4 5
1 3 5 8 9
.
Una vez realizadas las operaciones, 33 , b= La soluci´on es: a = 322 en la siguiente figura.
979 225 225 55
2223 1610
a b
=
411 99
y la gr´afica de la curva junto los puntos quedan reflejados
´ POR M´INIMOS CUADRADOS 4.6. APROXIMACION
55
Tras esta secci´on, comprender´eis mejor la secci´on “M´ınimos Cuadrados”del documento “Introducci´on del Tema 4”.