418 24 23MB
Spanish; Castilian Pages 542 [558] Year 1990
Algebra Lineal con aplicaciones
Traducción:
Carlos Manuel Sánchez Trujillo Licenciado en Física Revisión Técnica:
Abel Clemente Reyes Ingeniero Mecánico Electricista, UNAM Coordinador de Algebra Lineal, UNAM
WILLIAM L. PERRY Texas A & M University
McGRAW-HILL MÉXICO ● BOGOTÁ ● BUENOS AIRES ● CARACAS ● GUATEMALA ● LISBOA MADRID ● NUEVA YORK ● PANAMÁ ● SAN JUAN ● SANTIAGO ● SAO PAULO AUCKLAND ● HAMBURGO ● LONDRES ● MILÁN ● MONTREAL ● NUEVA DELHI PARÍS ● SAN FRANCISCO ● SINGAPUR ● ST. LOUIS ● SIDNEY ● TOKIO ● TORONTO
Algebra Lineal con aplicaciones
Prohibida la reproducción total o parcial de esta obra, por cualquier medio, sin autorización escrita del editor. DERECHOS RESERVADOS © 1990, respecto a la primera edición en español por McGRAW-HILL/INTERAMERICANA DE MÉXICO, S. A. de C. V. Atlacomulco 499-501, Fracc. Ind. San Andrés Atoto 53500 Naucalpan de Juárez, Edo. de México Miembro de la Cámara Nacional de la Industria Editorial, Reg. Núm. 1890 ISBN 968-422-576-8
Traducido de la primera edición en inglés de Elementary Linear Algebra Copyright © MCLXXXVIII, by McGraw-Hill, Inc., U.S.A. ISBN 0-07-049431-2 1234567890
Impreso en México Esta obra se terminó de imprimir en Febrero de 1990 en Impresora Roma, S.A. Tomás Vázquez No. 152 Col. Ampliación Moderna Delegación Benito Juárez 03510 México, D.F. Se tiraron 5 000 ejemplares
I.R. —90
9123456780
Printed in México
SEMBLANZA DEL AUTOR Nacido y educado en Missouri, Bill Perry recibió su doctorado de matemáticas en la University of Illinois, Urbana-Champaign, en 1972. Desde entonces trabaja en la Texas A&M University, donde es actualmente profesor de matemáticas. Su investigación se centra en las ecuaciones diferenciales, especialmente las que tienen aplicaciones en la física y en la ingeniería. Ha recibido los premios University y College of Science por su labor docente. Fuera de las horas de trabajo, Perry disfruta su tiempo en actividades con su familia, sobre todo el alpinismo en el Parque Nacional de las Montañas Rocallosas.
A LINDA
Prólogo ix Al estudiante xiii 1 SISTEMAS DE ECUACIONES Y ÁLGEBRA MATRICIAL
1
1.1 Fuentes de las ecuaciones lineales, 1 1.2 Método de eliminación, 11 1.3 Computadoras, errores relacionados con ellas y estrategia en la eliminación gaussiana, 36 1.4 Matrices, 45 1.5 Álgebra matricial, 59 1.6 Determinantes y regla de Cramer para ecuaciones lineales, 80 1.7 Método de la inversa matricial, 96 1.8 Otros dos métodos de cálculo: descomposición LU e iteración de Gauss-Seidel, 112 2 VECTORES EN EL PLANO Y EN EL ESPACIO
2.1 2.2 2.3 2.4
Vectores, 131 Ángulo entre vectores; proyecciones, 141 Matrices como transformadores del espacio, 149 Aplicaciones a la geometría analítica, 167
3 ESPACIOS VECTORIALES
3.1 3.2 3.3 3.4 3.5 3.6 3.7 3.8 3.9
131
n
179
Espacio euclidiano E , 179 Espacios vectoriales, 184 El problema del subespacio, 195 Conjuntos de vectores linealmente independientes, 202 Bases de espacios vectoriales; el problema de la base, 216 Perpendicularidad en espacios vectoriales, 234 Reconsideración del problema de la base, 242 Cambios de base en espacios vectoriales, 253 Parangón con el cálculo, 266
VIII
CONTENIDO
4 TRANSFORMACIONES LINEALES Y SUS MATRICES 4.1 4.2 4.3 4.4 4.5
277
Transformaciones lineales, 277 El problema de la representación matricial de las transformaciones lineales, 295 Matrices similares y cambio de base, 307 Transformaciones invertibles y clasificación de las transformaciones, 314 Parangón con el cálculo, 327
5 VALORES CARACTERÍSTICOS, VECTORES CARACTERÍSTICOS Y DIAGONALIZACIÓN 337 5.1 5.2 5.3 5.4 5.5
Importancia de la similaridad diagonal; aplicación a cadenas de Markov, 337 El problema de los valores característicos, 344 Diagonalización de matrices, 362 Diagonalización: matrices simétricas y hermitianas, 377 Postcálculo: sistemas de ecuaciones diferenciales lineales de primer orden, frecuencias fundamentales y estabilidad, 393
6 CÁLCULO NUMÉRICO DE LOS VALORES CARACTERÍSTICOS, 411 6.1 6.2 6.3
Estabilidad del problema numérico de valores característicos, 411 Método de las potencias, 416 Método QR, 432
7 INTRODUCCIÓN A LA PROGRAMACIÓN LINEAL 7.1 7.2 7.3
447
Ejemplos simples, 447 Reformulación del problema de PL, 454 Independencia lineal, soluciones accesibles de PL y el algoritmo simplex, 457 APÉNDICES
467
I. Números complejos, 467 II. Principio de la inducción matemática, 471 III.
Ajuste de curvas, 473 Respuestas a los problemas de número impar 477 Índice
539
El álgebra lineal, nombre con que se conoce actualmente esta disciplina, constituye una bella estructura matemática; sus partes integrantes son herramientas poderosas para ingenieros, científicos y matemáticos. Los que estudian estas disciplinas llegan al álgebra lineal con una formación común; han aprendido matemáticas resolviendo problemas y estudiando ejemplos. Teniendo presente esta idea, en el libro he tratado de dirigir la atención del lector hacia lo que considero que son los cinco problemas básicos del álgebra lineal: 1. El problema de la solución de las ecuaciones lineales 2. El problema de la construcción de una base para un espacio vectorial 3. El problema de la construcción de una matriz que represente una transformación lineal 4. El problema de los valores y los vectores propios 5. El problema de la diagonalización. Estos problemas le indican al estudiante el camino a seguir y las habilidades y conocimientos que debe desarrollar en el curso. Como es de esperarse, las soluciones a los cinco problemas básicos dan por resultado los importantes teoremas del álgebra lineal. Éstos se enuncian con precisión y luego se demuestran, excepto cuando rebasan el ámbito del álgebra lineal elemental. Espero que el lector llegue a visualizar la estructura del álgebra lineal sostenida por esas cinco vigas maestras que son los cinco problemas básicos, cuyos detalles se exponen en los ejemplos, las aplicaciones y los teoremas. He incluido una gran variedad de aplicaciones del álgebra lineal. Sin embargo, la mayor parte de ellas se centran en las ciencias y la ingeniería. Presentar aplicaciones puede parecer un poco difícil ya que debe darse una idea exacta
X
ÁLGEBRA LINEAL CON APLICACIONES
del origen de la aplicación para poder convencer al estudiante de que el ejemplo no es inventado, pero al mismo tiempo no debe entrarse en mucho detalle para no asustar al principiante. Por ejemplo, la presentación de algunas ecuaciones lineales que surgen en las estructuras es el punto importante, no un minicurso en estática y dinámica. Creo que las aplicaciones se han dado con suficientes detalles y que los estudiantes podrán ver y manejar los aspectos del álgebra lineal de los ejemplos, una vez que éstos hayan sido expuestos. Exceptuadas las secciones que tienen la palabra cálculo junto a su título, el lector solamente necesita tener un conocimiento elemental de las derivadas y las integrales. He colocado las conexiones más profundas entre el cálculo y el álgebra lineal en esas secciones aparte, de manera que el lector interesado pueda hallarlas con facilidad. El capítulo 1 está dedicado al álgebra matricial y las ecuaciones lineales. Ahí se plantean los cinco problemas básicos del álgebra lineal. Los métodos numéricos aparecen ya en la sección 1.3, en vez de estar en un capítulo aparte. Éste es el lugar apropiado para explicar los métodos numéricos, y con mis alumnos he logrado muy buenos resultados con esta organización. No obstante, los métodos numéricos pueden omitirse sin perder la continuidad. Como los estudiantes de ciencias e ingeniería están acostumbrados al empleo de los números complejos, no he limitado mi atención exclusivamente a las matrices reales. El capítulo 2 se refiere concretamente al espacio de dos y tres dimensiones. En la sección 2.3 se presentan las funciones lineales y su análisis geométrico. En todo el texto he tratado de recalcar los aspectos geométricos del álgebra lineal. El capítulo 3 trata de los espacios vectoriales reales y complejos. Se incluyen los espacios estándar, y la atención se centra en los espacios vectoriales reales. Los estudiantes de esta materia trabajarán con números complejos en su desempeño profesional. La inclusión del caso complejo permite que más adelante se trabaje con valores y vectores propios complejos. Es más, ciertos operadores lineales de la ciencia, como el operador de la cantidad de movimiento (momentum) en la mecánica cuántica, son fáciles de introducir cuando se habla de las transformaciones lineales. También en el capítulo 3 hay un ejemplo de códigos lineales de canal binario. Dicho ejemplo incluye el espacio vectorial Fn, donde F = {0, 1}, con la suma y la multiplicación definidas como mod 2 (pero sólo mediante una tabla dentro del texto); esto le permite al profesor introducir campos numéricos en el contexto de una aplicación, si lo desea. En la sección 3.9 se hallarán aplicaciones del cálculo. Hice esto por dos razones: facilitar a los estudiantes encontrar las aplicaciones y hacer sucinta la discusión, ya que el conocimiento requerido de álgebra lineal se adquirió con anterioridad. En los capítulos 4 y 5 hay secciones similares. En el capítulo 4 se subraya el problema de la representación matricial para transformaciones lineales y los invariantes bajo similitudes. En el capítulo 5 se analizan el problema de la diagonalización, el problema de los valores y los vectores propios. Como para entonces ya se habrán usado los números complejos con amplitud, el estudiante no encontrará una diferencia fundamental entre los casos real y complejo.
XI
En el capítulo 6 he incluido métodos numéricos para calcular valores propios, con la intención de analizar la estabilidad del problema y el algoritmo QR, el cual quizá algunos profesores deseen omitir. La inclusión del breve capítulo 7 fue el resultado de discusiones con algunos estudiantes de ingeniería química durante un semestre. No se dan demostraciones rigurosas de los resultados; sin embargo, se muestra que el resultado principal en la programación lineal se basa en el concepto de la independencia lineal de un conjunto de vectores. El capítulo finaliza con algunos manejos simples de tablas. Al final de los capítulo del 1 al 6 he añadido algunos problemas. No son demasiados y, en rigor, tampoco son problemas de "repaso". Más bien sirven para facilitar al lector la transición a otros capítulos, anticipar desarrollos o bien para despertar el interés por desarrollos más avanzados. Además, al final de cada capítulo he incluido resúmenes narrativos del tipo "dónde hemos estado y adonde vamos". Sirven para recordarle al estudiante las ideas clave expuestas en el capítulo que termina y cómo podrían aplicarse esas ideas en el capítulo que sigue. Este libro se ha utilizado en forma de manuscrito en un curso de un semestre, en 45 sesiones. El material contenido en los capítulos del 1 al 5 y el de las secciones 6.1 y 6.2 se estudió sin dificultad. Por lo general, se dan las respuestas a algunos problemas (casi siempre los problemas impares). Con sombreado se intentó facilitar el aprendizaje de algunos temas: la eliminación gaussiana, la reducción por renglones y la multiplicación matricial. Estoy en deuda con muchas personas que hicieron posible la realización exitosa del proyecto. John Corrigan, quien inició la idea; Peter Divine, que me ayudó en las dos primeras revisiones, y Robert Weinstein, quien me ayudó en las últimas etapas. Reciban mi más sincero agradecimiento. Agradezco a Susan Trussell por el bello y profesional mecanografiado del primer manuscrito. Estoy también muy agradecido con los revisores Ezra Brown, de Virginia Tech; Richard. A Brualdi, de la University of Wisconsin-Madison; Bruce Edwards, de la University of Florida; John Gregory, de la Southern Illinois Uníversity en Carbondale; Robert Hartwing, de la North Carolina State University; Joseph Kitchen, de la Duke University; Stephen Pennel, de la University of Lowell; Clifford Queen, de la Lehigh University, y Kenneth C. Washinger, de la Shippensburg University of Pennsylvania por sus comentarios sinceros. Sus esfuerzos cristalizaron en un mejor manuscrito y una mejor experiencia de aprendizaje para mis alumnos en la segunda y la tercera vez que utilicé el libro para impartir la materia. Quiero mencionar en especial al profesor Kitchen, quien realizó una de las más valiosas, completas y profundas revisiones que un autor podría desear para su libro. Finalmente, quiero dar las más sinceras gracias a mi familia por concederme el tiempo necesario para la preparación del libro.
En un curso de matemáticas, el alumno dispone básicamente de tres recursos: el profesor, el libro y el tiempo que dedique al trabajo duro. Este último es el más importante. Es durante ese tiempo, cuando trata de resolver problemas y utiliza el libro para aprender a resolverlos, cuando obtiene el mayor provecho. Este libro está diseñado para utilizarse estudiando los ejemplos que facilitan el aprendizaje de las técnicas del álgebra lineal. Un buen método consiste en tratar de resolver los ejemplos sin consultar el libro; es ésa quizá la única ocasión en la que un libro es más útil cuando está cerrado. Comparando los apuntes de la clase con el libro, resolviendo los ejemplos, estudiando los enunciados y las demostraciones de los teoremas y resolviendo los problemas, el lector llegará a ver el álgebra lineal como una poderosa herramienta matemática aplicable a la ciencia, la ingeniería y otras áreas. Creo que el álgebra lineal se basa en cinco problemas principales, los cuales se mencionan en el prólogo. También creo que el dominio de las técnicas para la solución de estos problemas es tan esencial para la aplicación exitosa del álgebra lineal como lo es el dominio de la derivación e integración en las aplicaciones del cálculo. Ponga todo su empeño para comprender los cinco problemas básicos del álgebra lineal.
1.1 FUENTES DE LAS ECUACIONES LINEALES En el centro del álgebra lineal, y en gran parte de las matemáticas aplicadas, se halla el problema de la solución de sistemas de ecuaciones lineales. ¿Qué son las ecuaciones lineales? Un ejemplo sencillo de una ecuación lineal es
donde x y y son variables reales y a, b y c son constantes reales. Si a y b no son cero, entonces la gráfica de esta ecuación es una línea recta; ésa es una razón por la cual la ecuación recibe el nombre de lineal (véase la figura 1.1.1). La ecuación (1.1.1) recibe el nombre de ecuación lineal en las dos incógnitas x y y. La ecuación lineal con tres variables reales x, y y z
donde a, b, c y d son números reales, no cero, representa un plano en el sistema coordinado xyz usual. En la figura 1.1.2 se muestra una gráfica de 2x + 2y + 3z = 6. Obviamente, una ecuación puede contener más de tres variables. He aquí un ejemplo no científico: una persona puede tener cinco empleados, cada uno de ellos con un sueldo diferente por hora y cada uno trabajando un número diferente de horas por semana, como se muestra en la tabla 1.1.1. La nómina semanal P está dada por
Ésta es una ecuación lineal en cinco variables.
ÁLGEBRA LINEAL CON APLICACIONES
2
Figura 1.1.1
Figura 1.1.2
Gráfica de ax + by = c (a, b, c todos positivos).
Gráfica de 2x + 2y + 3z = 6; vista en el primer octante.
Tabla 1.1.1
TABULADOR DE SALARIOS
Los anteriores son ejemplos del caso general de n variables, contenido en la definición l . l . l .
DEFINICIÓN
1.1.1 Una ecuación lineal en las n variables forma
donde
1
es toda ecuación de la
son números reales o complejos1.
Véase el apéndice I para un repaso de! conjunto de los números complejos C.
SISTEMAS DE ECUACIONES Y ÁLGEBRA MATRICIAL
3
Un ejemplo de una ecuación lineal con números complejos es
donde h es real e i es la unidad imaginaria (i2 = - 1). Estas ecuaciones surgen en la discretización de una ecuación que contiene al operador de la cantidad de movimiento (momentum) de la mecánica cuántica. Una ecuación que no tenga la forma especificada por la definición 1.1.1 se llama no lineal. Por ejemplo,
son ecuaciones no lineales. Las gráficas de las dos primeras aparecen en la figura 1.1.3a y b, respectivamente. Obsérvese que tales gráficas no son líneas rectas. La "solución" de los sistemas de ecuaciones lineales constituye un problema importante, como se verá en los ejemplos al final de esta sección, pero antes se definirá el concepto de lo que es la solución.
D E F I N I C I Ó N
1.1.2
Figura 1.1.3
Una solución de la ecuación lineal
4
ALGEBRA LINEAL CON APLICACIONES
es una eneada ordenada de números complejos2 que, al ser sustituidos en la ecuación, se obtiene un enunciado matemático verdadero.
EJEMPLO
EJEMPLO
8 tiene varios pares de soluciones. Uno de ellos es x1 Escriy otro más es otro es biéndolos como pares ordenados, se tiene (4, 0), (6, 1) y (-4, -4), respectivamente.
La ecuación
1
Escríbase una solución general de la ecuación 2x1 — 4x2 = 8.
2
Solución Sea x2 = s, donde s representa un número cualquiera. Luego sustitúyase en la ecuación; se tiene entonces
Despejando x1 mediante el álgebra ordinaria se obtiene
La solución puede escribirse
Obsérvese que, dejando que s tome los valores específicos 0, 1 o —4, se obtienen las soluciones mencionadas en el ejemplo 1. Sin embargo, si se hace 5 = 2 + i, entonces x1 = 8 + 2i, x2 = 2 + i y lo que se tiene es una solución compleja. Si de antemano se hubiese impuesto la restricción de que las incógnitas fuesen reales, entonces habría que descartar las soluciones complejas. En el ejemplo 2 se podría haber puesto x1 = s, despejar x2 y hallar que x2 = x 1 /2 -2 = s/2-2.
EJEMPLO
3
Muéstrese que x 1 = 1 + i, x 2 = 1 — i es una solución de
2
Evidentemente, el conjunto podría constar únicamente de números reales, ya que los números reales son un subconjunto del conjunto de los números complejos.
SISTEMAS DE ECUACIONES Y ALGEBRA MATRICIAL
Solución
EJEMPLO
5
La sustitución de los números dados, en la ecuación, da
4
Solución
Resuélvase
Puede utilizarse el sencillo método de sustitución. Despejando x 2 de la segunda ecuación y sustituyendo la expresión resultante para x 2 en la primera ecuación, se halla
Y así la sustitución de x1 = — 1 en la segunda ecuación en (1.1.2) da x2 = 2.
Todos estos son ejemplos de un problema general muy importante:
El sistema (1.1.2) es de la forma (1.1.3):
ALGEBRA LINEAL CON APLICACIONES
6
Nota: Los números
y b1, b2 , . . . , b m en (1.1.3) son números complejos dados 3 . Los subíndices dan la información que se indica a continuación:
El problema de resolver ecuaciones lineales es importante en muchas área;En los ejemplos que siguen, no se deducen las ecuaciones.
EJEMPLO
5
Solución
EJEMPLO
6
(Geometría) Hállese el punto de intersección de las líneas rectas 3x - 2y = 6 y 4x + Ay = 8.
Cualquier punto de intersección debe satisfacer a ambas ecuaciones simultáneamente. Este sistema puede resolverse por sustitución, como en el ejemplo 4. La solución es x = 2, y = 0; por tanto, el punto de intersección es (2, 0). Véase la figura 1.1.4.
(Cadenas de Markov, confiabilidad de los componentes) En ciertas situaciones, lo que ocurre en un tiempo de observación depende sólo de lo que sucede en el tiempo de observación inmediatamente anterior. En un circuito eléctrico, por ejemplo, la falla intermitente de un componente puede tener el comportamiento siguiente, según observaciones experimentales. 1. Si un componente funciona en el tiempo t, entonces funcionará en el si guiente tiempo de observación el 99% de las veces. 2. Si el componente falla en el tiempo t, entonces fallará en el siguiente tiempo de observación el 5% de las veces. Lo anterior se ha representado esquemáticamente en la tabla 1.1.2. 3
De nuevo, al emplear el término números complejos, se permite la posibilidad de que todos los números en consideración sean puramente reales. De hecho, esto sucede con la mayor parte de las aplicaciones.
SISTEMAS DE ECUACIONES Y ÁLGEBRA MATRICIAL
7
Figura 1.1.4
Intersección de
Tabla 1.1.2
TABLA DE LA CONFIABILIDAD DE LOS COMPONENTES
Los métodos de las cadenas de Markov, los cuales se analizarán con más detalle en el capítulo 5, pueden utilizarse para mostrar que (en promedio) la probabilidad de operación exitosa x1 y la probabilidad de falla x2 deben satisfacer las ecuaciones
Para resolver se agrupan términos y se suman las dos primeras ecuaciones, obteniéndose
(¡Una de las ecuaciones era redundante!) Resolviendo por sustitución se llega a
El componente falla aproximadamente el 1.04% de las veces (en promedio).
8
ALGEBRA LINEAL CON APLICACIONES
EJEMPLO
7
Solución
(Planeación óptima, ingeniería industrial) Una compañía jabonera produce dos jabones perfumados, Fragante y Superfragante, en grandes lotes. Un lote de Fragante contiene 1 tonelada de aceite y 16 toneladas de base, mientras que un lote de Superfragante contiene 2 toneladas de aceite y 16 toneladas de base. La compañía tiene en inventario 12 toneladas de aceite y 112 toneladas de base. Suponiendo que la compañía desea utilizar todo lo que hay en inventario, ¿cuántos lotes de cada tipo de jabón debería producir?
Sea x1 el número de lotes de Fragante y x2 el número de lotes de Superfragante. La cantidad de aceite empleada es (toneladas de aceite por lote multiplicado por los lotes) y la cantidad de base de jabón es (toneladas de aceite por lote multiplicado por los lotes) Para utilizar por completo el inventario, debe tenerse
La solución es x1 = 2, x2 = 5. En consecuencia, para utilizar completamente el inventario deberán producirse 2 lotes de Fragante y 5 lotes de Superfragante. Obsérvese que, si las cantidades del inventario en el ejemplo 7 hubiesen sido diferentes, no habría existido una "bonita" solución. Por ejemplo, si en el inventario hubiesen 12 toneladas de aceite y 116 toneladas de base, se tendría como solución x1 = 2.5, x2 = 4.75. Si no es posible producir lotes fraccionarios, podrían aplicarse otros métodos para determinar un programa de producción que emplease la mayor parte del inventario. La observación pertinente es que quizá no sería posible aplicar la solución matemática. Este ejemplo muestra que los problemas que requieran soluciones enteras pueden necesitar otros métodos de solución.
EJEMPLO
8
(Análisis estructural, ingeniería civil) Las fuerzas internas y las deflexiones de los nodos de la estructura de un bastidor pueden determinarse a veces resolviendo sistemas de ecuaciones lineales (un nodo es un punto donde se unen los miembros de una estructura). Los sistemas de ecuaciones pueden llegar a ser muy complicados; sin embargo, como un ejemplo sencillo considérese el marco en la figura 1.1.54. 4
J. J. Azar, Matrix Structural Analysis, Pergamon, Oxford, 1972.
SISTEMAS DE ECUACIONES Y ALGEBRA MATRICIAL
9
Figura 1.1.5
Estructura cargada horizontal y verticalmente en la unión. El nodo (punto de conexión) se mueve de la posición sin carga por las fuerzas dadas.
Las ecuaciones reducidas de rigidez agregada son (para cierta elección del módulo de Young y otros parámetros)
La solución es Estas cantidades representan la deflexión del nodo en las direcciones x y y (x1 y x2), en pulgadas, y el cambio en el ángulo de la estructura (x3) en el nodo, en radianes. Si la solución se redondea a
entonces se tendrá solamente una solución aproximada para el problema. Las ecuaciones reducidas son sólo una parte de las ecuaciones de rigidez agregada total, las cuales tienen nueve incógnitas. Sin embargo, el sistema mayor se resuelve eficientemente cuando se resuelve primero el sistema reducido. Los ejemplos dados no agotan los campos de aplicación de las ecuaciones lineales; son solamente ejemplos. Más adelante se darán muchas más aplicaciones. PROBLEMAS
1.1
1. Clasifíquense las siguientes ecuaciones en lineales o no lineales.
10
ÁLGEBRA LINEAL CON APLICACIONES
2. Los siguientes sistemas de ecuaciones lineales tienen soluciones. Hállelas. Si una ecuación tiene más de una solución, escriba la solución general.
3. Una empacadora de carne vende filetes magros y extramagros. Un lote de carne magra contiene 1.5 lb de grasa y 8.5 Ib de carne roja, mientras que un lote de carne extramagra contiene 1 lb de grasa y 9 lb de carne roja. En la carnicería hay 10 lb de grasa y 80 lb de carne roja. ¿Cuántos lotes de carne molida magra y extramagra debe producir la empacadora para utilizar to da la carne y la grasa (sin desperdicios)? 4. Un panadero vende dos clases de panecillos: regulares y extradulces. Cada lote de masa para panecillos regulares emplea 50 lb de harina y 2 lb de azúcar. Cada lote de masa para panecillos extradulces utiliza 49 lb de harina y 4 lb de azúcar. El panadero dispone de 690 lb de harina y 48 lb de azúcar. ¿Cuán tos lotes de cada tipo de panecillo deberá producir para emplear toda la harina y todo el azúcar? 5. Empléese el método de sustitución y una calculadora para obtener la solu ción de
6. Empléese el método de sustitución y una calculadora para obtener la solución de
7. Hállese el punto de intersección de x — 3y = 7 y 2x + 7y = 9. 8. Hállese el punto de intersección de x + Ay = 3 y y - 2x = 0. 9. Una empresa de asesoría cobra a sus clientes por los conceptos de tiempo de computadora C, viaje en automóvil T y horas de trabajo real H. Las ta-
SISTEMAS DE ECUACIONES Y ÁLGEBRA MATRICIAL
11
rifas son, respectivamente, $400 por hora, $0.35 por milla y $120 por hora. Escriba una ecuación lineal para la factura del servicio B en términos de C, T y H. 10. El ingreso en una gasolinería de autoservicio depende del número de galones vendidos de gasolina de primera, regular con plomo y sin plomo. En diciembre de 1986, los precios promedio por galón fueron, respectivamente, 83.9, 73.9 y 76.9 centavos. Si P, L y U representan el número de galones de gasolina de primera, regular con plomo y sin plomo, respectivamente, vendidos en ese mes, escriba una ecuación lineal para estimar el ingreso obtenido en diciembre de 1986.
1.2 MÉTODO DE ELIMINACIÓN Considérese el problema de resolver el sistema de ecuaciones lineales
mediante el proceso de eliminación de variables. Cuando por lo menos una de las cantidades b1, b2, . . . , bm del "lado derecho" es diferente de cero, el sistema de ecuaciones se llama no homogéneo. Si b1 = b2 = . . . = bm = 0, el sistema de ecuaciones se llama homogéneo. Las ecuaciones lineales no homogéneas pueden tener ninguna solución, exactamente una solución o un número infinito de soluciones. Pueden darse las tres posibilidades aun en el caso simple de dos ecuaciones con dos incógnitas. Por ejemplo, el sistema
tiene solamente la solución x = 1, y = 1 (véase la figura 1.2.1). Pero el sistema
no tiene solución, ya que las líneas representadas por las ecuaciones no se intersecan (véase la figura 1.2.2). El sistema
12
ÁLGEBRA LINEAL CON APLICACIONES
Figura 1.2.1
Figura 1.2.2
Gráficas de las ecuaciones (1.2.1)
Gráficas de las ecuaciones (1.2.2)
Figura 1.2.3
Gráficas de las ecuaciones (1.2.3)
tiene un número infinito de soluciones, ya que cada ecuación representa la misma recta. Cada punto situado sobre dicha recta común es una solución (véase la figura 1.2.3). Las ecuaciones lineales homogéneas tienen exactamente una solución (esto es, llamada solución trivial)5 o un número infinito de soluciones (incluyendo la solución trivial). Por ejemplo, el sistema
5
Una solución es no trivial si cualquiera de las incógnitas es diferente de cero.
SISTEMAS DE ECUACIONES Y ÁLGEBRA MATRICIAL
Figura 1.2.4 a) El plano x — z = 0; vista del primer octante. b) El plano y — z = 0; vista del primer octante. c) Intersección de x-z = 0yy — z = 0; vista del primer octante.
13
ÁLGEBRA LINEAL CON APLICACIONES
14
tiene como única solución x = 0, y = 0, mientras que el sistema
tiene las soluciones x = k, y = - k, para cualquier valor de k (si k = 0 se obtiene la solución trivial). Como un ejemplo en el que hay tres incógnitas considérese
donde se exige que la solución sea real. Cada ecuación representa un plano que pasa por el origen. Geométricamente, la solución es la línea recta definida por la intersección de los planos, que en forma analítica se escribe x = y = z = k, siendo k cualquier número real. Véase la figura 1.2.4. Estos ejemplos son más simples que los que contienen cuatro o más incógnitas, para los cuales la construcción de gráficas puede resultar difícil o imposible. Por ello debe disponerse de otra forma para determinar si existen las soluciones de ecuaciones lineales y hallar dichas soluciones si existen. Se emplea el método llamado comúnmente eliminación gaussiana.6 Se muestra mediante el ejemplo siguiente.
E J E M P L O
1
Solución
Resuélvase
La idea es eliminar primero la variable x. Las operaciones algebraicas elementales que se utilizarán darán por resultado ecuaciones equivalentes. Varios conjuntos de ecuaciones se llaman equivalentes si tienen la misma solución. Las operaciones que utilizaremos son 1. Multiplicación de cualquiera de las ecuaciones por una constante diferente de cero
6
Llamada así en honor de C. F. Gauss (1777-1855), físico, astrónomo y matemático alemán, quien fue pionero en el campo de la estadística y la teoría del magnetismo. Su obra matemática sobre las curvas y las superficies dio por resultado los principios del espacio-tiempo curvado. La unidad de densidad de flujo magnético lleva su nombre. En la Segunda Guerra Mundial se emplearon cinchos desgaussianantes para proteger los barcos de acero que navegaban en aguas donde habían minas magnéticas.
SISTEMAS DE ECUACIONES Y ALGEBRA MATRICIAL
15
2. Intercambio de dos ecuaciones cualesquiera 3. La adición, a una ecuación, del resultado de multiplicar cualquiera de las otras ecuaciones por una constante. Hay muchas formas de eliminar variables para resolver un sistema de ecuaciones lineales. El método que se ha descrito aquí será útil en problemas posteriores del texto. Primero se intercambian la primera y segunda ecuaciones (operación 2), por lo que la aritmética necesaria para eliminar x no presenta dificultad. El resultado es
Luego se suma a la primera ecuación el resultado de multiplicar la primera ecuación por -2 y se obtiene
y se suma a la tercera ecuación el resultado de multiplicar la primera por - 3 (operación 3):
Se obtiene así el sistema equivalente
A continuación se elimina y en la tercera ecuación sumando a la tercera ecuación el resultado de multiplicar la segunda ecuación por - 1 (operación 3):
ÁLGEBRA LINEAL CON APLICACIONES
16
Se obtiene entonces como sistema equivalente
De acuerdo con la última de las ecuaciones, z = 2. Ahora se emplea el método de sustitución en reversa para hallar los valores de x y y. Sustituyendo z = 2 en la segunda ecuación se obtiene 5y — 6 = — 11 y, en consecuencia, y = — 1. Ahora pueden sustituirse estos valores de y y z en la primera ecuación, obteniéndose x + 2 + 2 = 5, y x = 1. Por tanto, la solución es
como puede verificarse sustituyendo en las ecuaciones originales. La clave de la eliminación gaussiana es que las operaciones empleadas lleven a nuevas ecuaciones que sean equivalentes a las anteriores.
TEOREMA 1.2.1
Si se aplica cualquiera de las siguientes operaciones a un conjunto de ecuaciones lineales, entonces el conjunto de ecuaciones que se obtiene posee exactamente la misma solución que el conjunto original de ecuaciones: a) Multiplicación de cualquiera de las ecuaciones por una constante diferente de cero b) Intercambio de dos ecuaciones c) La adición, a una ecuación, del resultado de multiplicar otra de las ecuacio nes por una constante.
Demostración
Las partes a) y b) se dejan al lector. Se demostrará la parte c). Sea (s1 s2, . . . , sn) una solución de
SISTEMAS DE ECUACIONES Y ALGEBRA MATRICIAL
17
Supóngase que a la ecuación (p) se le suma el resultado de multiplicar la ecuación (i) por r. Entonces el nuevo sistema tiene una ecuación (p) diferente:
Como las demás ecuaciones no cambiaron, solución para esas ecuaciones. Sustituyendo ecuación (p) y multiplicando, se tiene
sigue siendo una en la nueva
y así es una solución de la nueva ecuación (p). Supóngase ahora que es cualquier solución del nuevo sistema. Es decir, supóngase que
Multiplíquese la ecuación (i) por — r y súmese el resultado a la ecuación (p) para obtener el sistema original con como una solución.
A fin de facilitar el trabajo, en el ejemplo siguiente se utilizarán abreviaturas para indicar las operaciones algebraicas efectuadas. Por ejemplo,
EJEMPLO
2
Resuélvase
ALGEBRA LINEAL CON APLICACIONES
18
Solución
Ahora se tienen solamente dos ecuaciones con tres incógnitas. En la segunda ecuación puede hacerse x 3 = k, donde k es cualquier número complejo. Así, x 2 = 3 - 2k. Sustituyendo x 3 = k y x 2 = 3 - 2k en la primera ecuación, se obtiene Por tanto, la solución general es
Y puede verse que el sistema tiene un número infinito de soluciones. Pueden obtenerse soluciones particulares dándole valores específicos a k. EJEMPLO
3
Solución
Resuélvase
Como los coeficientes de x1, x2 y x3 son los mismos que en el ejemplo 2, se emplean las mismas operaciones algebraicas. Esta vez, para ahorrar más espacio, no se escribirán las variables incógnitas en cada paso; se procurará mantener los coeficientes alineados verticalmente.
SISTEMAS DE ECUACIONES Y ALGEBRA MATRICIAL
19
La última "ecuación", 0 = 2, no puede cumplirse nunca, independientemente Como el último sistema (equivalente) no de los valores asignados tiene solución, entonces el sistema original de ecuaciones tampoco tiene solución. D E F I N I C I Ó N
1.2.1
E J E M P L O
4
Solución
Una matriz es un arreglo de números, dispuestos en renglones horizontales y columnas verticales. El arreglo de los coeficientes y de las cantidades del lado derecho del sistema en el ejemplo 3 es un ejemplo de una matriz. Se le llama matriz aumentada del sistema. El arreglo que aparece a la izquierda de la línea vertical se llama matriz de coeficientes del sistema. Resuélvase
Se emplea la eliminación gaussiana con la matriz aumentada.
Por tanto,
y haciendo
se llega a
20
ÁLGEBRA LINEAL CON APLICACIONES
Así, se obtiene
EJEMPLO
5
Solución
Resuélvase
Igual que en los casos anteriores, se emplea la eliminación gaussiana con la matriz aumentada del sistema:
En el último renglón se ve que x3 = 0. Sustituyendo esto en la ecuación representada por el segundo renglón, se obtiene x2 = 2x3/5 = 0. Sustituyendo finalmente x2 = 0, x3 = 0 en la ecuación representada por el primer renglón, se halla que x1 = 0. En consecuencia, el sistema tiene sólo la solución trivial. Lo que indican estos ejemplos es lo siguiente: Un sistema de ecuaciones lineales puede no tener soluciones, tener exactamente una solución o un número infinito de soluciones.
Para determinar si un sistema de ecuaciones lineales tiene o no solución, puede emplearse la eliminación gaussiana.
SISTEMAS DE ECUACIONES Y ÁLGEBRA MATRICIAL
21
Aún no se demuestran estos enunciados. Eso se hará más adelante, conforme se desarrolle el álgebra matricial. A continuación se hará un resumen de la eliminación gaussiana, explicándola al mismo tiempo con un ejemplo. ELIMINACIÓN GAUSSIANA
Dado el sistema:
EJEMPLO
Dado el sistema:
1. Represéntese el sistema como una matriz aumentada.
2. Asegúrese de que el número que aparece en el primer renglón y la primera columna es diferente de cero, intercambiando dos renglones si es necesario. (Esto equivale a intercambiar dos ecuaciones.) Este número recibe el nombre de pivote. Si la primera columna contiene solamente ceros, pásese a la segunda columna.
Intercámbiense los renglones 1 y 2.
3. Obténgase un pivote igual a 1 mediante una multiplicación.7
Multiplíquese el renglón 1 por
7
En realidad este paso no es necesario. Sin embargo, simplifica la aritmética en muchos problemas. Más importantes aún es que este paso se empleará cuando se analicen las formas escalonadas de las matrices, definidas más adelante en esta sección.
22
ÁLGEBRA LINEAL CON APLICACIONES
4. Obténgase un cero debajo del pivote en cada uno de los renglones que se hallan debajo del pivote. Para lograr esto en un renglón (llamado el renglón objeto), multiplíquese el renglón pivote por una constante y súmese el resultado al renglón objeto.
Multiplíquese el renglón 1 por - 4 y súmese el resultado al renglón 3. Multiplíquese el renglón 1 por —3 y súmese al renglón 4.
5. Concéntrese la atención en el subarreglo de la matriz aumentada obtenido al ignorar todos los renglones y columnas pivote anteriores. 6. Regrésese al paso 2 y comiéncese a trabajar en el subarreglo, a menos que no tenga pivotes diferentes de cero.
Multiplíquese el renglón 2 por —6 y súmese al renglón 3. Multiplíquese el renglón 2 por 3/2 y súmese al renglón 4.
7. Al finalizar escríbase la solución.
Se tienen dos ecuaciones con cuatro incógnitas. Por tanto, pueden asignarse valores arbitrarios a dos de las incógnitas. Sean Entonces,
8. Compruébese la solución. En términos generales, lo que se pretende es hallar pivotes para hacer ceros debajo de ellos, recorriendo la esquina superior izquierda hacia abajo y a la de-
SISTEMAS DE ECUACIONES Y ALGEBRA MATRICIAL
23
recha. Cuando la eliminación gaussiana es completa, se dice que la matriz aumentada está en la forma escalonada por renglones. Es decir, 1. El primer elemento (de izquierda a derecha) diferente de cero en cada renglón es 1 2. Si el primer 1 del renglón i se halla en la columna j, entonces el primer 1 en el renglón i + 1 debe estar en una columna a la derecha de la columna j 3. Todos los renglones que contengan solamente ceros deben ser los de más abajo.
D E F I N I C I Ó N
1.2.2
La matriz que muestra el paso 6 en la explicación precedente de la eliminación gaussiana se halla en forma escalonada por renglones. Para precisar, son necesarias algunas definiciones. Las operaciones elementales de renglón en una matriz son: a) La multiplicación de un renglón por un número c diferente de cero (es decir, la multiplicación de cada número en ese renglón por c) b) Intercambio de dos renglones c) El reemplazo de un renglón (por ejemplo, el renglón r) por la suma del renglón r y un múltiplo constante de cualquier otro renglón. Las operaciones elementales de renglón corresponden a las operaciones algebraicas, mediante las cuales se obtienen ecuaciones equivalentes a partir de un conjunto dado de ecuaciones (véase el teorema 1.2.1).
D E F I N I C I Ó N
E J E M P L O
1.2.3
6
Dos matrices son equivalentes por renglones si puede obtenerse una de la otra mediante un número finito de operaciones elementales de renglón. Considérense las matrices
La matriz A es equivalente por renglones a B, ya que B se obtiene de A mediante el intercambio de los renglones 1 y 2. La matriz C es equivalente por renglones a B, porque C se obtiene de B mediante la operación de renglones R2 + R1. La matriz A es equivalente por renglones a C, porque C se obtiene de A efectuando en sucesión las operaciones de renglón indicadas.
ÁLGEBRA LINEAL CON APLICACIONES
24
DEFINICIÓN
Una matriz está en la forma escalonada por renglones si
1.2.4
a) Todos los renglones que constan únicamente de ceros se hallan debajo de todos los renglones que tienen por lo menos un elemento diferente de cero. b) El primer elemento (de izquierda a derecha) diferente de cero en un renglón que no conste de ceros solamente es 1. c) Si el primer 1 del renglón i se encuentra en la columna j, entonces en el renglón i + 1 el primer 1 se halla en una columna a la derecha de la columna j. DEFINICIÓN
1.2.5
EJEMPLO
7
Solución
Una matriz está en forma escalonada reducida por renglones (o forma canónica reducida por renglones), si está en forma escalonada por renglones y si cada columna que contiene el primer elemento no cero (o nulo) de un renglón tiene ceros en todas sus demás posiciones. Utilícense las operaciones de renglón para reducir la matriz siguiente a la forma escalonada por renglones:
Empleando las operaciones estándar se obtiene
La matriz anterior está en forma escalonada por renglones. Obsérvese que podría efectuarse una operación de renglón adicional para reducir aún más la matriz a la forma escalonada reducida por renglones:
EJEMPLO
8
Resuélvase
SISTEMAS DE ECUACIONES Y ALGEBRA MATRICIAL
25
llevando la matriz aumentada del sistema a la forma escalonada reducida por renglones. Solución
Es fácil ver que Al proceso de resolver un sistema llevando la matriz aumentada a la forma escalonada reducida por renglones se le llama eliminación de Gauss-Jordán. EJEMPLO
9
Resuélvase
utilizando la eliminación de Gauss-Jordan. Solución
ÁLGEBRA LINEAL CON APLICACIONES
26
El último renglón representa 0 = 1, lo que significa que el sistema no tiene solución. Resolver un sistema de ecuaciones puede parecer una cosa muy sencilla si se utiliza la forma escalonada por renglones de una matriz. ¿Es posible resolver todo sistema de ecuaciones lineales utilizando la forma escalonada por renglones? Es decir, ¿puede afirmarse que toda matriz es equivalente por renglones a una matriz escalonada por renglones? La respuesta a esta importante pregunta es afirmativa y es el contenido del teorema que sigue.
TEOREMA
1.2.2
Demostración
Toda matriz es equivalente por renglones a una matriz en forma escalonada reducida por renglones.
Supóngase que la matriz es
Se efectuará un desarrollo similar al empleado en el resumen de la eliminación gaussiana en la página 12. Puede buscarse en la columna 1 un número diferente de cero. Una vez que se encuentre uno (supóngase que es el se traslada este renglón a la posición del primer renglón por intercambio (en caso de ser necesario). Si no se halla ninguno, se busca en la columna 2 y se procede así hasta lograrlo. (En realidad, si la matriz consta solamente de ceros, la búsqueda fracasa, pero en ese caso la matriz ya tiene la forma escalonada reducida por renglones.) Entonces, ya se tiene la matriz
SISTEMAS DE ECUACIONES Y ÁLGEBRA MATRICIAL
27
Puede multiplicarse el renglón 1 por y luego eliminar todos los números debajo, en la columna 1. Por ejemplo, con el nuevo primer renglón, + R2 eliminará el elemento situado en el renglón 2, columna 1. En consecuencia, se tiene la matriz equivalente por renglones
(Las testas [o elementos testados] indican las nuevas cantidades después de haberse efectuado las operaciones algebraicas.) Se comienza de nuevo el procedimiento con la submatriz
y se continúa. Después de obtenerse una forma escalonada por renglones, puede llegarse a una forma escalonada reducida por renglones mediante la eliminación de las constantes que se hallan arriba del primer 1 en cada renglón. Así, toda matriz es equivalente por renglones a una matriz en forma escalonada reducida por renglones. Una matriz tiene una sola forma escalonada reducida por renglones. Véase el problema 17.
Solución de sistemas con coeficientes complejos Cuando se va a resolver un conjunto de ecuaciones lineales con coeficientes complejos, se puede convertirlo en un sistema con coeficientes reales.
EJEMPLO
10
Expresando por separado las incógnitas en sus partes real e imaginaria, demuéstrese que el sistema
ÁLGEBRA LINEAL CON APLICACIONES
28
es equivalente a un sistema de cuatro ecuaciones en cuatro incógnitas con coeficientes reales. (Recuérdese que éste es el ejemplo 3 de la sección 1.1.)
Solución
Escríbase para obtener
reales, y sustitúyase
lo cual da
Pero los números complejos son iguales si y sólo si sus partes real e imaginaria son iguales. Se tiene entonces como un sistema equivalente
Utilizando la eliminación gaussiana se halla que la solución de este sistema es
En consecuencia, la solución del sistema original es
E J E M P L O
11
Solución
Resuélvase el sistema del ejemplo 10 sin separar las incógnitas en sus partes real e imaginaria, aplicando la eliminación gaussiana al sistema original.
SISTEMAS DE ECUACIONES Y ÁLGEBRA MATRICIAL
29
Por tanto,
y después de hacer una sustitución hacia atrás se obtiene A continuación se hará la demostración del primer teorema sobre la teoría de las ecuaciones lineales. Este teorema se refiere al conjunto solución de las ecuaciones homogéneas. 1.2.3
Si se tiene un sistema homogéneo de ecuaciones lineales en el cual el número de incógnitas es mayor que el número de ecuaciones, entonces el sistema tiene una solución no trivial.
Demostración
Supóngase que el sistema tiene m ecuaciones y n incógnitas, con m < n. Después de obtener la forma escalonada reducida por renglones de la matriz aumentada, se llega a un sistema equivalente con ecuaciones, Es decir, los renglones 1, 2, son los renglones diferentes de cero (no todos sus elementos son cero). Supóngase ahora que el 1 situado más a la izquierda, en el renglón i está en la columna entonces la incógnita aparece con coeficiente diferente de cero solamente en el renglón / y la columna Esto significa que cada puede escribirse en términos de las otras incógnitas, designadas por Esto significa que pueden asignarse arbitrariamente los valores de con lo cual quedan determinados los valores de y existe así una solución no trivial.
TEOREMA
EJEMPLO
12
Aplíquese el teorema 1.2.3 al sistema homogéneo de ecuaciones lineales
Resuélvase el sistema, indicando cuáles son demostración del teorema 1.2.3.
Solución
que aparecen en la
Como se tienen solamente tres ecuaciones en cuatro incógnitas, el teorema 1.2.3 garantiza que existe una solución no trivial. La matriz aumentada se reduce a
ALGEBRA LINEAL CON APLICACIONES
30
Por tanto, valentes
Así, igualando
EJEMPLO
13
Se tienen las ecuaciones equi-
se obtienen las soluciones
(Sistemas vibratorios, ingeniería mecánica) Una aplicación de la cual surgen ecuaciones lineales homogéneas es la de sistemas mecánicos vibratorios. Al calcular los modos normales de vibración del sistema en la figura 1.2.5, surgen las ecuaciones
donde w es el cuadrado de la frecuencia característica. Más adelante se verá cómo calcular valores de w para los cuales el sistema tiene soluciones no triviales (que en esencia indican los desplazamientos de los tranvías con respecto al equilibrio). Resuélvase la ecuación para w — 2. Solución
Haciendo w = 2, se tiene la matriz aumentada y la consiguiente reducción
Las soluciones son En un capítulo posterior se verá que esto significa que el tranvía 2 no se mueve y que los tranvías 1 y 3 se mueven siempre en direcciones opuestas. Figura 1.2.5
Carros de masa m conectados mediante resortes equivalentes.
SISTEMAS DE ECUACIONES Y ÁLGEBRA MATRICIAL
EJEMPLO
14
31
Determínese las condiciones que deben cumplir a, b y c para que
no tenga soluciones o bien para que tenga un número infinito de soluciones. Solución
Realizando las mismas operaciones de renglón que en el ejemplo 3, se llega a la matriz
entonces el sistema no tiene solución. Si tienen dos ecuaciones con tres incógnitas y puede elegirse x3 de manera arbitraria, resolviéndose luego para x1 y x2. Si
PROBLEMAS
1.2
se
1. Utilícese la eliminación gaussiana para determinar si los sistemas siguientes no tienen solución, tienen exactamente una solución o bien un número infinito de soluciones. Calcúlense las soluciones, si existen.
2. Resuélvanse los sistemas de ecuaciones del problema 1 usando la eliminación de Gauss-Jordan. 3. ¿Cuál o cuáles de las matrices siguientes se hallan en forma escalonada reducida por renglones?
32
ÁLGEBRA LINEAL CON APLICACIONES
4. Pónganse las matrices siguientes en las formas escalonada por renglones y escalonada reducida por renglones.
5. Para cada uno de los sistemas siguientes establézcanse condiciones (si es necesario) sobre a, b y c, de manera que el sistema o bien no tenga solución o tenga un número infinito de soluciones.
6. Calcúlense los valores de k (si los hay) para los cuales el sistema (i) tiene una sola solución, (ii) no tiene soluciones y (iii) tiene un número infinito de soluciones.
SISTEMAS DE ECUACIONES Y ALGEBRA MATRICIAL
33
7. Aplíquese la eliminación gaussiana para resolver
donde a, b, c y d son números reales diferentes de cero. Establézcase una condición para ad — be que garantice una solución única. 8. Si ad - bc = 0 en
¿qué condiciones sobre r y s garantizarán que el sistema no tenga soluciones? ¿que tenga un número infinito de soluciones? 9. Aplíquese la eliminación gaussiana para resolver
Establézcanse condiciones sobre a, b, c, d, e, f, g y h que garanticen una solución única. 10. Muéstrese que, si por renglones de
entonces la forma escalonada reducida
11. Si ad — bc = 0, ¿qué puede decirse de la forma escalonada reducida por renglones de la matriz siguiente?
34
ÁLGEBRA LINEAL CON APLICACIONES
12. Resuélvanse los sistemas homogéneos dados a continuación.
13. Supóngase que x = r, y = s es una solución de
y x = u, y = v es una solución de
Muéstrese entonces que segundo conjunto de ecuaciones. 14. Sean
es también una solución del soluciones de
es una solución; Muéstrese que es una solución; donde k es una constante, es una solución, d) Utilice un ejemplo para demostrar que no es necesariamente una solución. 15. Resuélvanse las ecuaciones del ejemplo 13 con 16. Muéstrese que, si la matriz A es equivalente por renglones a B, entonces B es equivalente por renglones a A. Demuéstrese además que, si A es equiva lente por renglones a B y B es equivalente por renglones a C, entonces A es equivalente por renglones a C. 17. En general, es cierto que una matriz con m renglones y n columnas es equivalente por renglones a una sola forma escalonada reducida por
SISTEMAS DE ECUACIONES Y ÁLGEBRA MATRICIAL
35
renglones. Demuestre la veracidad de este enunciado para matrices con dos renglones y dos columnas completando a), b) y c). a) Demuéstrese que una matriz con dos renglones y dos columnas sólo puede tener una de las siguientes formas escalonadas reducidas por renglones:
b) Demuéstrese que ninguna de las cuatro matrices de la parte a) es equivalente por renglones. c) Utilizando a) y b), hágase ver que puede haber solamente una forma escalonada reducida por renglones para las matrices en consideración. 18. La forma escalonada reducida por renglones de
tiene todos los ceros en el último renglón; demuéstrese que lo mismo sucede con
19. ¿Qué puede decirse del último renglón de la forma escalonada reducida por renglones de lo siguiente?
20. Considérese el sistema de ecuaciones
36
ÁLGEBRA LINEAL CON APLICACIONES
Resuélvase este sistema obteniendo el complejo conjugado de ambos lados de la segunda ecuación y sumando para despejar x; luego sustituyase para calcular y. 21. Obténgase la solución de
(Multiplíquese la segunda ecuación por i y luego obténganse conjugados.) 22. Resuélvanse los problemas 20 y 21 resolviendo los sistemas reales asociados. 23. Demuéstrense las partes a) y b) del teorema 1.2.1.
1.3 COMPUTADORAS, ERRORES RELACIONADOS CON ELLAS Y ESTRATEGIA EN LA ELIMINACIÓN GAUSSIANA En la práctica, los sistemas de ecuaciones no se resuelven de modo manual, sino que se utilizan computadoras. Por ello se harán consideraciones acerca de algunos aspectos de los cálculos automáticos. Una computadora es una máquina finita. Aun cuando un ser humano puede representarse un número como (y el concepto en que se funda el número), una computadora que trabaje con números de seis dígitos almacenará
según que se haya usado truncamiento o redondeo para convertir .7777777 ... e n un número de seis dígitos. Ambas representaciones de son inexactas y, cada vez que estos números entren en un cálculo en lugar de se estará introduciendo un error. Por ejemplo, 6.99999 (utilizando seis dígitos y truncamiento). En problemas que requieren miles de cálculos, la acumulación de errores sí puede ser significativa. La solución numérica de un problema matemático con una computadora requiere de varios pasos, uno de los cuales tiene que ver con los errores recién mencionados. Los pasos son los siguientes: 1. Formulación del problema matemático 2. Desarrollo de un método numérico paso por paso, llamado algoritmo, para obtener una aproximación a la solución del problema
SISTEMAS DE ECUACIONES Y ÁLGEBRA MATRICIAL
37
3. Escritura de un programa de computadora que dé al algoritmo una forma que la computadora pueda entender y realizar. 4. Hacer un análisis de errores para evaluar la precisión con la cual la computadora resolvió el problema. El análisis numérico es la rama de las matemáticas relacionada con los puntos del 2 al 4. La atención se centrará en el punto 2. Antes de eso, se analizará con más profundidad cómo almacenan números las computadoras y cómo surgen los errores. Las computadoras almacenan números de punto flotante (reales) en la forma
donde es la base y k es el exponente. El número n recibe el nombre de número de dígitos significativos de la máquina. Como todos los números usados en las computadoras se escriben en la forma (1.3.1), siempre es necesario efectuar un redondeo o un truncamiento. Generalmente se emplea B = 2, 8, 10 o 16. Aquí se utilizará B = 10 para facilitar la explicación. EJEMPLO
1
Supóngase que una computadora almacena números en la forma Es decir, almacena tres dígitos significativos. Con los números siguientes escríbase su versión de almacenamiento, suponiendo redondeo y truncamiento: 3678, .2224, 4.278, -.0667.
Solución
EJEMPLO
2
EJEMPLO
3
Supóngase que la computadora del ejemplo 1 debe sumar 23.4 y .213. Los números se almacenan en la forma .234 x 102 y .213 x 100. Para que puedan sumarse, sus exponentes deben coincidir, por lo que .213 x 10° se cambia a .00213 x 102. Sumando se obtiene (.234 + .00213) x 102 = .23613 x 102, que debe redondearse a .236 x 102 para poder ser almacenado. Por tanto, la máquina indica que la suma es 23.6. Como el valor real de la suma es 23.613, se ha introducido un error de redondeo de .013. Supóngase que la computadora del ejemplo 2, después de sumar 23.4 y .213, debe multiplicar la suma por 100 000. Los cálculos se efectuarían como sigue, teniendo en cuenta que 100 000 se almacena como .1 x 106:
38
ÁLGEBRA LINEAL CON APLICACIONES
La respuesta se indicaría como 240 000. El valor exacto del producto 100 000 (23.4 + .213) es 236 130. El error de redondeo del ejemplo 3 se acumuló debido a su participación en otro cálculo. El ejemplo 3 muestra el hecho de que la multiplicación por un número muy grande (o división entre un número pequeño) puede ocasionar un gran error de redondeo. Otras causas de graves errores de redondeo son la suma de un número grande con uno muy pequeño o la diferencia de dos números casi iguales. Esto se muestra en el ejemplo que sigue: 4
Con la misma computadora que en los ejemplos anteriores, calcúlense a) 3288 - 3286 y b) 2460 + 2.
Solución
En los cálculos que siguen se estarán usando las formas almacenadas de los números.
EJEMPLO
Diferencia como 0.
La diferencia se dará
Suma
La suma se dará como 2460. En ambos casos el error tiene una magnitud de 2. Ya se han dado varios ejemplos de cómo pueden introducirse y propagarse los errores en los cálculos por computadora. A continuación se darán las definiciones de los errores y la medida de los errores. DEFINICIÓN
1.3.1
Todo error debido al redondeo o al truncamiento recibe el nombe de error por redondeo.
DEFINICIÓN
1.3.2
Sea N un número y la aproximación calculada de N. Entonces el error absoluto debido al empleo de es
El error relativo es
SISTEMAS DE ECUACIONES Y ÁLGEBRA MATRICIAL
EJEMPLO
5
39
Determínense los errores absoluto y relativo en el ejemplo 4a.
Solución Como
el error absoluto es — 2 y el error relativo es
Estos ejemplos no deben provocar un pesimismo injustificado ante los cálculos por computadora. Más bien deben considerarse como una señal de alerta ante el problema de la acumulación de errores. Claro está que con las computadoras modernas pueden obtenerse fácilmente 12 dígitos significativos de precisión, si se está dispuesto a pagar el precio. Sin embargo, controlando la propagación de errores pueden esperarse resultados que, aun cuando no estén libres de errores, tengan una precisión aceptable. Una forma de lograrlo es evitar la división entre números pequeños o (equivalentemente) la multiplicación por números grandes (véase el ejemplo 3). Para efectuar la eliminación gaussiana en una computadora es necesario que se mantenga al mínimo la introducción de errores por redondeo. La reducción por renglones implica dividir los elementos del renglón de una matriz entre un número. Por ello siempre es deseable que esta división dé números tan grandes como sea posible. Recuérdese que la división entre números pequeños aumenta el error por redondeo. A continuación se mostrará una estrategia para evitar tales operaciones; el método recibe el nombre de pivoteo parcial. EJEMPLO
6
Supóngase que se va a resolver el sistema
redondeando siem(cuya solución exacta es pre todos los cálculos a cuatro dígitos significativos. Si no se reordenan las ecuaciones, se tiene
La solución calculada para no se parece que tiene la solución a la solución verdadera. Sin embargo, si se cambian los renglones de modo que el primer coeficiente en el primer renglón sea el número mayor en la primera columna, se mejora la situación:
ÁLGEBRA LINEAL CON APLICACIONES
40
La solución calculada en la segunda forma es muy parecida a la solución verdadera. La estrategia de reacomodar renglones, para que el elemento pivote sea el mayor (en valor absoluto), en su columna recibe el nombre de pivoteo parcial. Esta estrategia se muestra en el ejemplo siguiente. (El pivoteo total se explicará un poco más adelante.) EJEMPLO
7
Resuélvase
aplicando el pivoteo parcial. Solución
El sistema tiene la matriz aumentada
Comenzando con la columna situada más a la izquierda, se ve que 4 es el elemento de mayor magnitud, por lo que se intercambian los renglones 1 y 3 y se procede;
Ahora se trabaja con la submatriz
SISTEMAS DE ECUACIONES Y ÁLGEBRA MATRICIAL
41
y se observa que por lo que se intercambian los renglones 2 y 3. Continuando con el proceso de eliminación se halla que
La solución es El método anterior recibe el nombre de pivoteo parcial, para distinguirlo del pivoteo total. En el pivoteo parcial, en cada paso se busca una sola columna para el elemento pivote de mayor magnitud. En el pivoteo total se busca en toda la matriz de coeficientes (o submatriz) el elemento mayor, para tomarlo como elemento pivote. Para mostrar cómo funciona el pivoteo total, se resolverá de nuevo el ejemplo 7.
EJEMPLO
8
Solución
Resuélvase el sistema del ejemplo 7 usando el pivoteo total. El sistema tiene la matriz aumentada
Se busca en la matriz de coeficientes y se halla el 5 como el elemento de mayor valor absoluto. Intercambiando las columnas 1 y 3 y luego los renglones 1 y 3, se tiene
y debe tenerse en cuenta que la columna que correponde a x es ahora la columna 3 y la columna que le corresponde ahora a z es la columna 1. Para recalcar esto se escriben las variables debajo de sus columnas. Continuando con el proceso de eliminación, se tiene
42
ÁLGEBRA LINEAL CON APLICACIONES
Ahora en la parte de coeficientes de la submatriz, es el elemento de mayor magnitud. Para colocarlo en la posición del pivote, es necesario intercambiar las columnas 2 y 3. Obsérvese que este intercambio también afecta a los elementos que están fuera de la submatriz; esto establece una diferencia entre el pivoteo total y el pivoteo parcial. Continuando con la eliminación se llega a
Y de nuevo El ejemplo 8 muestra que el pivoteo total requiere que se guarde más información que el pivoteo parcial, ya que las columnas pueden intercambiarse. Claro que si es una computadora la que lleva el registro de dicha información, entonces no hay problema. Lo que sí es un problema es el tiempo adicional que necesita la computadora para hacer las comparaciones requeridas. En el caso de sistemas grandes, la diferencia en tiempo puede ser importante. Al examinar la figura 1.3.1 puede verse que, para un sistema de 50 x 50, el total de comparaciones requeridas es de 42 875 para el pivoteo total y de sólo 1225 para el pivoteo parcial. Para un sistema de 50 x 50, el pivoteo total requiere un tiempo 35 veces mayor que el pivoteo parcial. Debido a que el tiempo de computadora cuesta dinero, es preferible el pivoteo parcial al pivoteo total, aun cuando sea
SISTEMAS DE ECUACIONES Y ALGEBRA MATRICIAL
43
Figura 1.3.1
Número de comparaciones en los métodos de pivoteo.
Pivoteo total Comparación 1; matriz completa
Pivoteo parcial Comparación 1; columna 1
Comparación 2; primera submatriz
Comparación 2; columna 2
Comparación 3; segunda submatriz
Comparación 3; columna 3
Última comparación
Última comparación
Total:
Total:
mejor en cuanto al control de errores. El control de errores alcanzado con el pivoteo parcial es suficiente en la mayor parte de los problemas. Pueden idearse otras estrategias de pivoteo; en general, no hay manera de distinguir la "mejor" forma de pivoteo. PROBLEMAS
1.3
1. Redondéense los números siguientes a cuatro dígitos significativos.
2. Considérese la lista de números
44
ÁLGEBRA LINEAL CON APLICACIONES
a) Súmese de la parte superior a la inferior, redondeando a cuatro dígitos significativos en cada suma b) Súmese de abajo hacia arriba, redondeando a cuatro dígitos significativos en cada suma c) Súmense los números sin redondear d) Compárense las respuestas en a), b) y c). 3. En álgebra se tiene la siguiente propiedad para los números reales a, b, c y d:
Usando cuatro dígitos significativos y redondeando, muéstrese que si a = — 3 , b = 3 , c = .0003 y d = 2, entonces esta expresión no es válida si se efectúan las operaciones indicadas. 4. Elíjanse valores para a, b y c que, al ser sustituidos en
con cuatro dígitos significativos y redondeo, hagan falsa la ecuación. En los problemas del 5 al 8 se dan sistemas de ecuaciones. Resuélvase cada sistema a) sin pivoteo, b) con pivoteo parcial y c) con pivoteo total. Redondéese después de cada cálculo.
5. (Se retienen sólo cuatro dígitos significativos.) 6.
(Se retienen sólo dos dígitos significativos.) 7.
(Se retienen sólo tres dígitos significativos.) 8. (Se retienen sólo dos dígitos significativos.)
SISTEMAS DE ECUACIONES Y ÁLGEBRA MATRICIAL
45
9. Resuélvase
a) usando aritmética exacta y b) conservando sólo tres dígitos significativos. 10. Empleando cinco dígitos significativos y truncamiento (es decir, .011237 = .01123, etc.), hállense las soluciones de x2 + 20.516x + 2.1123 = 0, utilizando la fórmula cuadrática
Las soluciones verdaderas son - .0102906 • • • y -205.1497 • • • ¿Por qué el error relativo en la solución menor (la de menos valor absoluto) es de casi el 50%? Empléese
para calcular la solución menor, usando de nuevo cinco dígitos significativos y truncamiento. ¿Por qué en esta ocasión la respuesta es más precisa?
1.4 MATRICES En secciones anteriores se utilizó la eliminación gaussiana para resolver sistemas de ecuaciones lineales. Se utilizaron matrices aumentadas para enlistar los coeficientes de las incógnitas y de los valores de la derecha. Las matrices son útiles en muchas áreas de la ciencia y la ingeniería, no sólo para resolver las ecuaciones lineales que surgen en esas disciplinas.
E J E M P L O
1
(Ingeniería química) Las matrices surgen en la ingeniería química en el análisis de absorbedores por etapas.8 En términos generales, las fases líquida y gaseosa de 8
N. R. Amundson, Mathematical Methods in Chemical Engineering, Prentice-Hall, Englewood Cliffs, N. J., 1966.
ÁLGEBRA LINEAL CON APLICACIONES
46
una sustancia química pasan a través de unas columnas con n platos, cada uno de los cuales absorbe parte de la substancia. Para determinar la concentración en cada etapa, la matriz (con n renglones y n columnas)
es parte de un modelo matemático; K, L y G son constantes relacionadas con las especies químicas particulares y los tipos de platos. Puede localizarse un número en una matriz especificando su renglón y su columna. Por ejemplo, en la matriz A (las letras mayúsculas denotan matrices)
el número 5i se halla en el renglón 3 y columna 2. Otra forma de decirlo es: "5i es el elemento de A en la posición 3,2". Esta convención de caracterizar la posición de un elemento por su renglón y su columna es la que se utiliza para almacenar una matriz en una computadora.
EJEMPLO
2
Figura 1.4.1
a) Gráfica con vértices etiquetados, b) Gráfica con bordes etiquetados.
(Teoría de gráficas) Otra área en la que se utilizan matrices es la teoría de gráficas, que puede aplicarse a la física teórica y las redes eléctricas, entre otros campos. La gráfica es un conjunto de vértices, algunos de los cuales se hallan unidos mediante líneas y contornos. En la figura 1.4.1 se da un ejemplo de gráfica, donde las letras indican los vértices y los números indican los contornos
SISTEMAS DE ECUACIONES Y ÁLGEBRA MATRICIAL
(o bordes). La matriz de incidencia mentos son unos y ceros:
47
de la gráfica es una matriz cuyos ele-
si el borde toca al vértice en cualquier otro caso Para la gráfica de la figura 1.4.1.
DEFINICIÓN
1.4.1
Una matriz se llama m x n (léase "m por n") o de orden m x n, si tiene m renglones y n columnas. Si se desea indicar el tamaño de una matriz se escribe Una matriz es cuadrada si es de Sean A y B estas dos matrices de m x n:
y todo para todo Se dice que A y B son iguales, Es decir, los elementos de A y B que ocupen las mismas posiciones son iguales. Así,
pero
En el último caso las matrices no son iguales ya que no tienen el mismo tamaño.
ALGEBRA LINEAL CON APLICACIONES
48
Hay tres operaciones matriciales básicas y todas se relacionan con la solución de ecuaciones lineales. Dichas operaciones son la suma de matrices, la multiplicación por un escalar y la multiplicación matricial. DEFINICIÓN
1.4.2
El múltiplo escalar cA de la matriz A, donde c es un número complejo (un escalar), es la matriz definida por
es decir, multiplica por c.
EJEMPLO
3
En otras palabras: cada elemento de A se
Sea
Calcúlense 2A, - 3 A, 0A, 1A = i A. Solución
Usando la definición se tiene
Del mismo modo,
Obsérvese que 1A = A. La operación de multiplicación por un escalar es equivalente a multiplicar todo un sistema de ecuaciones por una constante. Por ejemplo, si se fuese a resolver en forma manual,
SISTEMAS DE ECUACIONES Y ALGEBRA MATRICIAL
49
podrían multiplicarse ambas ecuaciones por 8, con el objeto de "eliminar las fracciones del sistema", para obtener
La operación correspondiente en la matriz aumentada para (1.4.1) sería la multiplicación por el escalar 8:
DEFINICIÓN
1.4.3
Si A y B son de m x n, se dice entonces que son conformables para la adición y ésta se define por
Es decir, la adición se realiza elemento por elemento.
EJEMPLO
4
Para los siguientes pares de matrices, hállense la suma y la diferencia, si existen.
ÁLGEBRA LINEAL CON APLICACIONES
50
Solución
a) Las matrices A y B son ambas de 2 x 3 y, por tanto, conformables para la adición y sustracción.
b) La matriz A es de 2 x 2 y la matriz B es de 2 x 3. Como A y B no tienen el mismo tamaño, no son conformables para la adición o sustracción. c) Las matrices A y B son conformables para la adición y sustracción, puesto que tienen el mismo tamaño.
d) Las matrices A y B no son conformables para la adición o sustracción, ya que A es de 1 x 2 y B es de 2 x 1. La operación de la adición corresponde a la suma de sistemas de ecuaciones. Por ejemplo, si se desea resolver el sistema
se podría sumar la primera ecuación a la segunda y conservar el resultado. Esto corresponde a la suma del sistema
al sistema (1.4.2). Sumando las matrices aumentadas
se ve que 2x = 6 o x = 3. Luego se halla y = 1 empleando la primera ecuación. La operación básica más importante con dos matrices es su producto. Puede utilizarse en ingeniería eléctrica para describir el comportamiento de ciertas cajas negras que contienen circuitos y partes eléctricas. En la figura 1.4.2 se muestra una caja negra de cuatro terminales en particular. Se ve que la caja tiene cuatro terminales y que hay cuatro cantidades (los dos voltajes y las
SISTEMAS DE ECUACIONES V ÁLGEBRA MATRICIAL
51
Figura 1.4.2 Caja negra con entradas a la izquierda y salidas a la derecha.
y como salidos corrientes asociadas con la caja como entradas Cuando la caja tiene lo que se denomina operación lineal, existen das (que dependen de lo que haya dentro de la caja) taconstantes les que
Puede pensarse que los lados derechos de estas ecuaciones se generan del modo siguiente:
Esto sugiere pensar en un producto renglón-columna. DEFINICIÓN
1.4.4
Sean A de m x n y B de n x p. El producto renglón-columna del renglón i de con la columna j de B, que es
se denota por
y se define como
(Véase la figura 1.4.3)
ÁLGEBRA LINEALCON APLICACIONES
52
Figura 1.4.3
Producto renglóncolumna.
EJEMPLO
5
Sean
denota el producto renglón-columna del renglón 1 de A y la columna 2
Solución de B:
Ahora se ve que el tipo de caja negra mencionado antes puede dibujarse como en la figura 1.4.4. Pueden conectarse dos cajas con cuatro terminales cada una como en la figura 1.4.5. Si se desea escribir la acción combinada de las dos cajas, puede calcularse primero la acción de la caja B y luego la acción de la caja A. Haciendo esto, se tiene (véase la figura 1.4.5)
Sustituyendo las expresiones de
en las dos últimas ecuaciones, se obtiene
Por tanto, la caja combinada se caracteriza mediante los cuatro coeficientes a la derecha de las dos últimas ecuaciones. Para calcular esos coeficientes más fácilmente se define la matriz producto.
SISTEMAS DE ECUACIONES Y ALGEBRA MATRICIAL
53
Figura 1.4.4 Caja negra con coeficientes. La caja puede representarse mediante la matriz
Figura 1.4.5 Cajas negras conectadas. Juntas pueden considerarse como una sola caja negra con entradas y salidas
DEFINICIÓN
1.4.5
EJEMPLO
6
Sean Entonces A y B son conformables para el producto matricial AB. El producto es de m x p y el elemento situado en el renglón y columna Si el producto se representa por tonces
Sean
Calcúlese AB. ¿Existe el producto AB?
Solución
El producto BA no está definido:
54
ÁLGEBRA LINEAL CON APLICACIONES
EJEMPLO
7
Sean
Calcúlense AB y BA.
Solución
Obsérvese que, aun cuando AB y BA están definidas, El que AB sea igual a BA depende de las matrices A y B. Dada la definición del producto matricial, se ve que la acción del par de cajas negras en la figura 1.4.5 se expresa en términos del producto A B de las matrices que representan las cajas individuales. Esta aplicación del producto matricial permite ver por qué, en general, AB puede no ser igual a BA: si la posición de las cajas negras en el circuito se invierte, la acción del circuito puede no ser la misma. Un caso en el que A B es igual a BA es cuando A = B; en términos de cajas negras, esto significa que, si se intercambian cajas negras idénticas adyacentes, no se modifica la acción del circuito completo. Otra aplicación importante del producto matricial se halla en la escritura compacta de los sistemas de ecuaciones lineales. Si la matriz de coeficientes del sistema es A y la columna del lado derecho es B, entonces A será de m x n si hay m ecuaciones y n incógnitas y B será de m x 1. Si se escriben las incógnitas como
entonces el sistema puede escribirse como
Con esta convención, puede reenunciarse el teorema 1.2.3 si se define
SISTEMAS DE ECUACIONES Y ÁLGEBRA MATRICIAL
TEOREMA
1.4.1
55
Si m < n, entonces el sistema
tiene una solución no trivial. Después de un breve estudio del álgebra matricial, será posible escribir en forma concisa sistemas de ecuaciones lineales y demostrar otros teoremas acerca de ellos. PROBLEMAS
1.4
1. Se dan una matriz y un elemento de la matriz. Dígase a qué renglón y columna corresponde el elemento.
2. A continuación se dan una matriz y un renglón y una columna de la matriz en forma de par ordenado. Dígase cuál es el elemento correspondiente.
3. Escríbanse las matrices aumentadas para los sistemas en el problema 1 de la sección 1.2. Dígase cuál es el tamaño, m x n, de la matriz.
56
ÁLGEBRA LINEAL CON APLICACIONES
4. Sean
Efectúese el cálculo matricial indicado para cada uno de los incisos siguientes. Si alguna operación no puede realizarse, dígase por qué:
5. Muéstrese un ejemplo de
tales que
6. Muéstrese un ejemplo de
tales que
7. Sean
Muéstrese que A B = A C aun cuando 8. a) Sea A una matriz. Muéstrese que 1A = A. b) Sea A una matriz. Muéstrese que 0A es una matriz cuyos elementos son cero. 9. Supóngase que se tienen dos matrices compatibles para el producto, cuyos elementos son complejos; ¿deben necesariamente ser complejos los elementos de la matriz producto? Si la respuesta es negativa, muéstrese con un ejemplo. 10. Si a es un número real, entonces Si una matriz A tiene elementos reales diferentes de cero, ¿debe AA tener elementos positivos? Si la respuesta es negativa, muéstrese con un ejemplo. 11. Muéstrese que la matriz del ejemplo 1 puede escribirse en la forma
SISTEMAS DE ECUACIONES Y ALGEBRA MATRICIAL
57
12. Hállense matrices de incidencia para las siguientes gráficas (véase el ejemplo 2).
13. Sean A y B compatibles para la suma. Si A + B = A, ¿qué puede decirse de B? 14. Sean A y B compatibles para el producto A B. Si cada elemento de B vale cero, ¿qué puede decirse de los elementos de AB? 15. Si A, B y C son todas de n x n y AB = BA y BC = CB, ¿debe AC = CAÍ Si no, muéstrese con un ejemplo. 16. En algunas aplicaciones son útiles varias clases de productos matriciales. Por ejemplo, un banco puede haber otorgado préstamos comerciales y préstamos personales a diferentes tasas de interés y la información puede estar almacenada en forma de matrices (p y q representan los principales): Comerciales Personales
Tasas de interés correspondientes
58
ÁLGEBRA LINEAL CON APLICACIONES
Para determinar el interés total al final de los préstamos, se calcula
Esto equivale a multiplicar las matrices elemento por elemento y luego sumar los resultados. Con este producto, pueden multiplicarse dos matrices y obtenerse un número real, como en el ejemplo que sigue:
Empleando este producto, multiplíquense los siguientes pares de matrices, si es posible:
17. Con respecto al problema 16, si el banco desea conocer la cantidad debida al interés de cada préstamo, los productos no deben sumarse, sino que deben colocarse en una tercera matriz:
Así, en esta clase de producto,
Enúnciese la regla que define a este producto. Usando esa definición, multiplíquense los pares siguientes de matrices, si es posible:
SISTEMAS DE ECUACIONES Y ALGEBRA MATRICI AL
59
18. Las matrices de espín de Pauli
se usan en el estudio del espín del electrón. Calcúlense AB, BA, BB, AC, CA y A + iB.
1.5
ÁLGEBRA MATRICIAL En la sección anterior se definieron la adición, la sustracción, la multiplicación por un escalar y el producto de matrices. Los cálculos con matrices y estas operaciones están gobernados por ciertas reglas, que se analizarán en esta sección. La estructura resultante recibe el nombre de álgebra matricial. Muchas de las propiedades que se deduzcan serán similares a las de los números reales. Sin embargo, algunas definiciones y conceptos serán nuevos. Por ejemplo, la primera propiedad enunciada será la propiedad conmutativa de la adición, es decir, A + B = B + A. Esto es exactamente igual a la propiedad conmutativa de la adición para los números reales, excepto que las letras A y B representan matrices, en vez de números reales. Sin embargo, como se verá más adelante, el importante concepto de la transpuesta de una matriz, al reducirse al caso de los números reales, no aporta nada nuevo. Las reglas básicas del álgebra matricial están contenidas en el teorema siguiente.
T E O R E M A
1.5.1
En cada uno de los enunciados del a) al h), supóngase que el orden de las matrices es el adecuado para las operaciones definidas y sean r y s números complejos. Los enunciados del a) al h) son verdaderos. La adición es conmutativa. La adición es asociativa. La multiplicación es distributiva sobre la audición. El producto es asociativo. La multiplicación por un escalar se distribuye sobre la suma.
60
ÁLGEBRA LINEAL CON APLICACIONES
Antes de demostrar este teorema, es conveniente decir algo acerca de las demostraciones. El lector puede aceptar sin vacilar la validez de un teorema, aun cuando no se dé la demostración correspondiente. Sin embargo, el estudio de la demostración de un teorema proporciona información adicional acerca del concepto o del método que se esté considerando. Es más, el estudio de varias demostraciones puede revelar una técnica o método común que ayude a resolver problemas o bien a decidir qué cosas son válidas en situaciones nuevas o más generales. Es claro que una demostración debe ser convincente y, además, correcta. En un libro de texto el grado de detalle es necesariamente limitado. En consecuencia, debe haber un balance entre los cálculos técnicos, los resultados previos y los casos en los que se dice: "el resto se deja al lector". Muchos de los teoremas del álgebra lineal son proposiciones que tienen que ver con los enteros positivos y pueden demostrarse utilizando el principio de la inducción matemática (véase el apéndice II). Sin embargo, en tales demostraciones puede quedar oculta la parte importante. Considérese, por ejemplo, la proposición siguiente: Para n = 2, 3, . . . la suma de los primeros n enteros positivos es Otra forma de escribir esto es
A continuación se darán dos demostraciones.
Demostración 1 (por inducción)
La proposición es válida para n = 2, ya que
Supóngase que [ésta es la hipótesis de inducción (HI)]
y demuéstrese que
SISTEMAS DE ECUACIONES Y ÁLGEBRA M ATRICIAL
61
Súmese k + 1 a ambos lados de la HI para obtener
Así, debido al principio de la inducción matemática, la proposición es verdadera.
Demostración 2
Supóngase que n es par. Los términos de la suma pueden agruparse
de tal modo que se tengan n/2 pares de números, cada par sumándose a n + 1. En consecuencia, la suma total es n(n + l)/2. Si n es impar, entonces se agrupa como sigue:
Como n — 1 es par, la suma es
Aun cuando la segunda demostración podría no ser aceptada por algunos, tiene la virtud de mostrar por qué la proposición es verdadera. A veces se darán demostraciones de este tipo y a veces se empleará la inducción. El propósito es hacer las demostraciones tan ejemplificativas como sea posible. Ahora se demostrará el teorema 1.5.1.
Demostración del teorema 1.5.1
La demostración de cada uno de los enunciados se reduce a las propiedades de los números complejos, estudiando el comportamiento de un elemento cualquiera de las matrices. Por ejemplo, para demostrar el teorema 1.5.1f, supónEntonces el miembro izquierdo de f) es gase que A
ÁLGEBRA LINEAL CON APLICACIONES
62
El miembro derecho es
Como ambos miembros de f) se reducen a la misma matriz, entonces son iguales. Las otras partes se resuelven en la misma forma. Para la parte a), pueden estudiarse de nuevo los dos miembros:
Como
EJEMPLO
1
Solución
son números complejos, entonces
Dése un ejemplo que ilustre el teorema 1.5.1c. Para mostrar A(B + C) = AB + AC pueden utilizarse matrices pequeñas para reducir el número de cálculos; con matrices de 2 x 2 será suficiente. Sean
Se tiene
SISTEMAS DE ECUACIONES Y ÁLGEBRA MATRICIAL
63
El conjunto de los números complejos contiene algunos números, como el O y el 1, que tienen propiedades especiales. Por ejemplo, 0 para todo a, a + 0 = a para todo a para todo a. Análogamente, se tienen algunas
matrices con propiedades especiales. La matriz cero tiene todos sus elementos iguales a cero:
La matriz identidad elementos son cero:
tiene
Otra forma de expresar esto es usar la Por tanto, y es igual a cero si La matriz escalar tiene mentos son cero:
y todos los demás
que es igual a
1 si
y todos los demás ele-
Algunas de las propiedades de estas matrices especiales están contenidas en el teorema 1.5.2.
TEOREMA
1.5.2
En cada uno de los enunciados del a) al h), supóngase que el orden de las matrices es el adecuado para las operaciones definidas, y sea r un número. Los enunciados siguientes son verdaderos:
ALGEBRA LINEAL CON APLICACIONES
64
Demostración Se demostrará la parte e) y se dejará el resto al lector. Sea A tonces
El elemento decir,
de AI es el i-ésimo renglón de A por la j-ésima columna de I, es
Por tanto, el elemento
EJEMPLO
2
Ejemplos del teorema a) Sea
Entonces
b) Sea
En-
el elemento.
SISTEMAS DE ECUACIONES Y ÁLGEBRA MATRICIAL
65
Entonces
c) Sean
Entonces
Obsérvese que en este ejemplo no está definida la matriz 0A, ya que ese producto no está definido. e) Sean
Entonces
Obsérvese que en este ejemplo no está definida IA, ya que ese producto no está definido.
Otras matrices especiales importantes en las aplicaciones son las matrices diagonal, tridiagonal, triangular y simétrica.
ÁLGEBRA LINEAL CON APLICACIONES
66
DEFIN1CIÓN
1.5.1
E J E M P L O
3
Es decir, Una matriz, diagonal es una matriz cuadrada los elementos que no están sobre la diagonal principal de A deben ser cero.
Los siguientes son ejemplos de matrices diagonales:
La diagonal principal es la diagonal que va de la esquina superior izquierda a la esquina inferior derecha de cada matriz.
D E F I N I C I Ó N
EJEMPLO
1.5.2
4
Una matriz cuadrada cuando Es decir, si el número de renglón y el número de columna de un elemento difieren por 2 o más, el elemento debe ser cero. No hay restricción sobre los demás elementos.
De acuerdo con la definición anterior, en una matriz tridiagonal de 4 x 4
los elementos gonales de 4 x 4 son
deben ser cero. Algunas matrices tridia-
Toda matriz diagonal es también tridiagonal.
En el ejemplo 1 de la sección anterior se dio un ejemplo de matriz tridiagonal utilizada en la ingeniería química. La matriz era de la forma
SISTEMAS DE ECUACIONES Y ÁLGEBRA MATRICIAL
67
A las matrices tridiagonales como ésta se les llama matrices de Jacobi.
DEFINICIÓN
EJEMPLO
1.5.3
5
Una matriz cuadrada es triangular superior si Es para todo decir, si está debajo de la diagonal principal, entonces Una matriz cuadrada es triangular inferior si para todo Algunas matrices triangulares superiores son
Las matrices siguientes son triangulares inferiores:
Una de las razones por las que las matrices triangulares son importantes es que, al aplicar una eliminación gaussiana a un sistema n x n, el sistema resultante tiene una matriz de coeficientes triangular superior. En la eliminación de Gauss-Jordan, el sistema tiene a veces una matriz diagonal de coeficientes. Un conjunto de matrices sumamente importante es el conjunto de matrices cuadradas que no cambian al intercambiar los renglones y las columnas. Éstas reciben el nombre de matrices simétricas; para definirlas se necesita la idea de la transpuesta de una matriz.
DEFINICIÓN
1.5.4
La transpuesta de una matriz A de m x n es la matriz sea igual al elemento de A. elemento
tal que el
ÁLGEBRA LINEAL CON APLICACIONES
68
EJEMPLO
6
Solución
Calcúlese
para las matrices siguientes:
se calcula tomando el primer renglón de A como la primera columna de el segundo renglón de A como la segunda columna de etc. Por ejemplo, para la parte a),
por lo cual
Obsérvese que A es de 2 x 3 y
DEFINICIÓN
EJEMPLO
1.5.5
7
es de 3 x 2.
Una matriz cuadrada es simétrica si para todo i y todo j. Muéstrese que
es simétrica.
Es decir,
es simétrica si y
SISTEMAS DE ECUACIONES Y ÁLGEBRA MATRICIAL
Solución Hay que mostrar que
69
Se tiene que
y es igual a A. Obsérvese que A tiene la propiedad de "reflexión de espejo": si la matriz se dobla a lo largo de su diagonal principal, los números en posiciones simétricas son iguales.
Las matrices simétricas se utilizan en el método lineal de mínimos cuadrados (véase el apéndice III), que a su vez se emplean para predecir tendencias y estimar parámetros en problemas ingenieriles. Las propiedades importantes de la operación de transposición y de las matrices simétricas y triangulares están contenidas en el teorema 1.5.3.
T E O R E M A
1.5.3
Sean A y B matrices del tamaño adecuado para que las proposiciones de la a) a la h) tengan significado. Los enunciados siguientes son verdaderos:
(La transpuesta de un producto es igual al producto de las transpuestas con el orden invertido.) Si A es triangular superior (inferior), Si A es diagonal (tridiagonal),
es triangular inferior (superior).
es diagonal (tridiagonal).
Si A y B son simétricas y AB = BA, entonces AB es simétrica. Si A y B son triangulares superiores (inferiores), entonces AB es triangular superior (inferior). Antes de demostrar este teorema, se darán algunos ejemplos de las partes b) y d).
ÁLGEBRA LINEAL CON APLICACIONES
70
EJEMPLO
8
Solución
Muéstrese el teorema 1.5.3b y d; es decir,
b) Sean
Entonces
d) Sean
Entonces
Demostración del teorema 1.5.3b y d
Para la parte b), sean A y B de m x n. El elemento elemento elemento mento elemento
elemento
elemento ele-
Para d), sean elemento
elemento elemento
elemento
elemento Las demostraciones de las demás partes del teorema se dejan para la sección de problemas.
SISTEMAS DE ECUACIONES Y ÁLGEBRA MATRICIAL
E J E M P L O
9
Solución
71
Muéstrese un ejemplo de dos matrices simétricas A y B para las cuales AB no sea simétrica. Sean
Entonces
Nótese que En el ejemplo anterior se vio el caso de dos matrices A y B para las cuales AB y BA está definido, pero Esto prueba que, en general, la multiplicación matricial es no conmutativa. Esto constituye una diferencia importante entre la multiplicación de números complejos (que sí es conmutativa) y la multiplicación de matrices. En seguida se definirá la potencia de una matriz cuadrada, que es importante en el estudio de las cadenas de Markov (las cuales fueron mencionadas en la sección 1.1).
D E F I N I C I Ó N
1.5.6
La enésima potencia de una matriz cuadrada A (n es un entero positivo) se escribe A" y se define como sigue: Si
E J E M P L O
10
Solución
Sea
Calcúlense A2, A3 y A6.
Para calcular A6 puede intentarse A3A3, esperando que las leyes de los exponentes sean válidas para las potencias de las matrices (y lo son, como se verá más adelante):
ÁLGEBRA LINEAL CON APLICACIONES
72
Nótese que A es triangular superior y que las potencias calculadas son todas triangulares superiores. Una propiedad importante de la potencia de una matriz es que para todo entero positivo Esto puede verse utilizando la asociatividad de la multiplicación y escribiendo
De manera similar se demuestra que para enteros positivos m y n. Si una matriz A tiene elementos no reales, al tomar el conjugado complejo de sus elementos se obtiene una nueva matriz, llamada la matriz conjugada de A o simplemente la conjugada de A.
I) E F I N I í I Ó N
1.5.7
Sea
La conjugada de A se escribe
y se define mediante
donde La transpuesta-conjugada de A se escribe A* (léase "A estrella") y está definida por
EJEMPLO
11
Solución
Para las matrices siguientes, calcúlense la conjugada y la transpuesta-conjugada.
SISTEMAS DE ECUACIONES Y ÁLGEBRA MATRICIAL
73
Obsérvese en el ejemplo 11 que A* = A. Las matrices para las cuales esto es válido reciben el nombre de hermitianas. Para una matriz hermitiana,
EJEMPLO
12
(Mecánica) El álgebra matricial es útil para representar el tensor de esfuerzos que se emplea en los problemas de mecánica. El tensor de esfuerzos se repre senta mediante una matriz de 3 x 3:
y en ocasiones se necesita calcular la matriz
donde
y los
vienen de las matrices
La fórmula para es difícil de recordar tal como está escrita. Empero, utilizando productos matriciales, se tiene
la cual es más fácil de recordar y de programar en una computadora. Ahora ya es posible establecer más teoremas de la teoría de ecuaciones. Como de costumbre, una X denotará la matriz columna de las incógnitas.
TEOREMA
1.5.4
Demostración
Si A es de n x n y el sistema AX = 0 no tiene solución no trivial, entonces A es equivalente por renglones a I. Sea B la forma escalonada por renglones reducida de A. Entonces ne una solución no trivial. Así, por el teorema 1.4.1, si r es el numero de renglopor oirá parle, como B es de n nes diferentes de cero de B, debe tenerse (véase el problema 35). En consecuencia, se sabe que
ÁLGEBRA LINEAL CON APLICACIONES
74
Si AX = B y A Y = 0, entonces A(X + Y) = B. Es decir, si X es una solución de la ecuación no homogénea y Y es una solución de la ecuación homogénea, su suma es una solución de la ecuación no homogénea. Es más, toda solución de AX = B es de esta forma.
TEOREMA 1.5.5
Demostración
Para mostrar que X + Y es una solución, se calcula
Sea Z cualquier solución de la ecuación no homogénea, es decir, AZ = B. Puede escribirse Z = (Z - Y) y Z - Y es solución del problema no homogéneo ya que A(Z - Y) = AZ - AY = B - 0 = B. 1.5.6
Si A es de n x n y AX - 0 no tiene solución no trivial, entonces AX = B tiene una solución única.
Demostración
Según el teorema 1.5.4, A es equivalente por renglones a I. Es decir, la matriz aumentada es equivalente por renglones a
TEOREMA
y el sistema
EJEMPLO
13
es equivalente a AX = B. Por tanto, la única solución a
(Demostración del teorema 1.5.4) En el ejemplo 5 de la sección 1.2 se vio que el sistema
no tiene solución no trivial. Siguiendo la reducción por renglones de ese ejempío, con las operaciones de renglón que I es la forma escalonada por renglones reducida de A. EJEMPLO
14
(Demostración del teorema 1.5.5) Considérese el sistema
SISTEMAS DE ECUACIONES Y ÁLGEBRA M ATRICI AL
75
del ejemplo 2 de la sección 1.2. Se halló la solución
donde k es arbitraria. Lo anterior puede escribirse como
donde se ve que el segundo término de la suma da AX = 0 y el primer término da AX = B. Este "desdoblamiento" de la solución no se ha obtenido haciendo magia; AX = 0 se obtiene por eliminación (véase el ejemplo 4, sección 1.2).
PROBLEMAS
1.5
Nota para el estudiante: algunos de los problemas que siguen no "tienen la respuesta en sí mismos". Por ejemplo, en el problema 4 se pregunta, ¿es la suma de matrices tridiagonales también tridiagonal? Si la respuesta es negativa, deberá darse un ejemplo para probar. Independientemente de esto, una forma de comenzar a buscar la respuesta es encontrar ejemplos; si para varios ejemplos la respuesta es positiva, entonces habrá que tratar de desarrollar una prueba o demostración general. En los primeros ejemplos será conveniente emplear matrices especiales que satisfagan los requerimientos del problema: pueden probarse I, la matriz cero, matrices escalares o matrices diagonales. Si alguno de esos ejemplos muestra que la respuesta es negativa, entonces puede utilizarse para ejemplificar la respuesta. 1. Sean
Úsense estas matrices, junto con números reales, para mostrar el teorema 1.5.1a al h. 2. Demuéstrese el teorema 1.5.2a y b. 3. ¿Es también diagonal la suma de matrices diagonales? 4. ¿Es la suma de matrices tridiagonales también tridiagonal? 5. ¿Es la suma de matrices simétricas también simétrica? 6. ¿Es la suma de matrices triangulares superiores también triangular supe rior?
76
ÁLGEBRA LINEAL CON APLICACIONES
7. Resuélvanse los problemas del 3 al 6 con la palabra suma sustituida por la palabra producto. 8. Demuéstrese el teorema 1.53a, c, e, f y h. 9. Usando A y B del problema 1, calcúlense a) (A + B)2 y b) A2 + 2AB + B2. 10. a) Muéstrese que, si A y B son matrices de n x n, entonces (A + B)2 = A2 + AB + BA + B2 b) Dedúzcase que (A + B)2 = A2 + 2AB + B2, si y sólo si AB = BA. 11. Una matriz se llama antisimétrica si AT = -A. a) Proporciónese un ejemplo de una matriz antisimétrica. b) ¿Es también antisimétrica la suma de matrices antisimétricas? c) ¿Es también antisimétrico el cuadrado de una matriz antisimétrica? d) ¿Es también antisimétrico el cubo de una matriz antisimétrica? e) ¿Qué puede decirse del producto de una matriz simétrica y una matriz antisimétrica? f) ¿Qué puede decirse de la diagonal principal de una matriz antisimétrica? 12. Demuéstrese el teorema 1.5.2c, d, f, g y h. 13. ¿Es (A + B)(A -B) igual a A2 - B2? 14. Muéstrese que
para n un entero positivo.
15. Sean
Muéstrese que BA = A, aun cuando 16. Si A y B son matrices diagonales de n x n, ¿debe AB ser igual a BA? 17. Si A es de n x n y D es una matriz diagonal de n x n, ¿debe AD ser igual a DA? ¿Qué pasa si D es una matriz escalar? 18. Calcúlense A y A*.
19. Demuéstrese que, si iodos los elementos de una matriz son reales, entonces A = A.
SISTEMAS DE ECUACIONES Y ÁLGEBRA MATRICI AL
77
20. Descomposición de sistemas complejos. Supóngase que debe resolverse donde son matrices complejas. Muéstrese que escribiendo Z = X + iY e igualando partes reales e imaginarias de las ecuaciones, el sistema complejo de n x n es equivalente al sistema real de 2n x 2n
donde D = R + iS. Muéstrese además que el sistema puede escribirse como
Estas últimas matrices reciben el nombre de matrices particionadas (véase el problema 32). 21. Recuérdese el ejemplo 10 de la sección 1.2.
Empléese el resultado del problema 20 para obtener el sistema real
22. Demuéstrese que
23. Demuéstrese que
24. Muéstrese que 25. Muéstrese que A* A es hermitiana. 26. Muéstrese que si A y B son de n x n y AB es simétrica y A y B son simétricas, entonces AB - BA. 27. Sea A una matriz cuadrada. Muéstrese que A + A T es simétrica. 28. Sea A una matriz cuadrada. Muéstrese que A - A T es antisimétrica.
78
ÁLGEBRA LINEAL CON APLICACIONES
29. Muéstrese que cualquier matriz cuadrada puede escribirse como la suma de una matriz simétrica y una matriz antisimétrica. 30. ¿Qué puede decirse acerca de los elementos de la diagonal de una matriz hermitiana? Si A es hermitiana, ¿puede iA ser hermitiana? 31. a) Sea
Muéstrese que A2 = 0. b) Sea
Muéstrese que A3 = 0. c) Sea A de n x n con puede decirse de An?
¿Qué
32. Matrices particionadas. Una matriz que tiene bloques separados por líneas punteadas o sólidas recibe el nombre de matriz particionada. Las matrices aumentadas de la sección 1.2 son matrices particionadas. La matriz
es una matriz particionada; está dividida para separar los ceros. Los productos de matrices particionadas pueden calcularse mediante la multiplicación ordinaria de matrices, tratando los bloques como si fuesen elementos, siempre y cuando los bloques que se estén multiplicando sean compatibles. Suponiendo que la matriz anterior es
y que
SISTEMAS DE ECUACIONES Y ALGEBRA MATRICIAL
79
puede escribirse
Multiplíquense las matrices siguientes, particionándolas primero.
33. Una matriz de Seifert, utilizada en la teoría matemática de nudos, es una matriz cuadrada V que satisface
donde F es una matriz dada. Para las F siguientes hállese V (si existe):
34. Para que la ecuación matricial tenga una solución, ¿qué condición deben cumplir los elementos de la diagonal de F?. ¿Y qué condición debe haber sobre la simetría de F? 35. Muéstrele que, si una matriz de n x n está en la forma escalonada reducida por renglones y no tiene renglones nulos, entonces la matriz es 36. Proporciónese una definición razonable de "matriz antihermitiana". 37. Las matrices de espín de Pauli, empleadas en el estudio del espín del electrón, se definieron en el problema 18 de la sección 1.4. ¿Cuáles de ellas son simétricas, antisimétricas o hermitianas? 38. Demuéstrese que, si r es un escalar y A es una matriz cuadrada, entonces para n un entero positivo. 39. Muéstrese que si r es un escalar y A y B son matrices cuadradas con AB =
BA, entonces teros positivos.
donde m y n son en-
ALGEBRA LINEAL CON APLICACIONES
80
1.6 DETERMINANTES Y REGLA DE CRAMER PARA ECUACIONES LINEALES El determinante de una matriz cuadrada es un número muy útil en la teoría de las ecuaciones y se puede calcular de manera directa.
D E F I N I C I Ó N
El determinante de la matriz de 2 x 2
1.6.1
es el número
E J E M P L O
1
La notación para el determinante de A es det A.
Calcúlese el determinante de las matrices siguientes:
Solución
Nuestra definición de det A para una matriz de 2 x 2 permite calcular det reduciendo el problema al cálculo de varios determinantes de matrices de 2 x 2. Junto con la definición se muestra un ejemplo. D E F I N I C I Ó N
1.6.2
Para una matriz A de n x n, det A es el número que puede calcularse en la forma siguiente: 1. Elíjase cualquier renglón de A; por ejemplo, (renglón i, donde i se elige arbitrariamente.)
Considérese
1. Elíjase el renglón 2:
SISTEMAS DE ECUACIONES Y ÁLGEBRA MATRICIAL
2. Sea
la matriz de obtenida de A al eliminar el i-ésimo renglón y la j-ésima columna de A.
3. det
81
2.
3. det
o bien el número puede calcularse en la forma alternativa: 1. Elíjase cualquier columna de A, por ejemplo
1. Elíjase la columna 3:
(columna j, j arbitrario). 2. Sea elegida igual que en el paso 2 anterior.
2.
3. det
3. det
Nótese que el determinante de una matriz de n x n se define como una suma de ± 1 por los determinantes de matrices de (n — 1) x (n - 1). Cada uno de esos determinantes se calcula como una suma de ± 1 por los determinantes de matrices de (n - 2) x (n - 2). Continuando este proceso se llega hasta los determinantes de matrices de 2 x 2, los cuales ya se sabe calcular. No es obvio (pero
ÁLGEBRA LINEAL CON APLICACIONES
82
es cierto) que det A sea independiente del renglón o la columna elegidos para su cálculo. El determinante no está definido para matrices que no sean cuadradas.
E J E M P L O
2
Calcúlese
a) eligiendo un renglón y b) eligiendo una columna. Solución
Primero se dará una forma simple para recordar si debe escribirse un + 1 o un - 1 al usar la definición. Para a11, (- 1)1 +1 = + 1; al moverse hacia la derecha o hacia abajo, se tendrá un signo de - 1 ya que ( - 1 ) 2 + 1= - l y ( — l) 1 + 2 = — 1. Es decir, el signo cambia al moverse un renglón hacia abajo o hacia arri ba, o una columna hacia la der echa o hacia la izquierda. Así, para una matriz de 3 x 3 los signos son
a) Empléese el segundo renglón. Eso es preferible al renglón 1, porque el elemento cero se multiplicará por otro determinante, que dará un cero. Usando el segundo renglón (véase la figura 1.6.1) se obtiene
Figura 1.6.1
Eliminación de renglones y columnas para generar submatrices.
SISTEMAS DE ECUACIONES Y ÁLGEBRA MATRICIAL
b) Empléese la columna 3 ya que es la que tiene más ceros.
EJEMPLO
3
Solución
Calcúlese
Se elige la columna 4 porque es la que tiene más ceros. Los signos son
Por tanto,
83
84
ÁLGEBRA LINEAL CON APLICACIONES
EJEMPLO
4
Solución
Hállese
Elíjase el renglón 3, por ser el que tiene más ceros.
Este ejemplo muestra el hecho de que, si una matriz tiene un renglón (o una columna) cuyos elementos sean todos cero, entonces su determinante vale cero. EJEMPLO
5
Solución
Evalúese
Se elige la columna 1 porque es la que tiene más ceros.
Repasando el ejemplo 5 se puede ver que el determinante de la matriz dada es el producto de los elementos de la diagonal. Aunque esto no es cierto para todas las matrices, sí lo es para las matrices triangulares, sean superiores o inferiores.
SISTEMAS DE ECUACIONES Y ÁLGEBRA MATRICIAL
TEOREMA 1.6.1
Demostración
Si
85
es triangular superior (o inferior), entonces det
es la siSe utilizará el principio de inducción matemática. La proposición guiente: una matriz triangular superior A de n x n tiene el determinante Primero se comprobará para
Cuando
Por tanto, la proposición es válida para y, por definición, det A Para la hipótesis de inducción supóngase que es cierta. Es decir, supóngase que, si es triangular superior, entonces
Para completar la demostración, debe probarse que det se tiene Escribiendo
Se calcula det
utilizando el renglón k + 1 para hallar
Así, por el principio de inducción matemática, la proposición es válida para toda n. Demostración (alternativa)
Sea
ÁLGEBRA LINEAL CON APLICACIONES
86
Empléese la primera columna para calcular
Empléese la primera columna de nuevo:
Usando siempre la primera columna se llega a
Ambas demostraciones son casi lo mismo para matrices triangulares inferiores. Eso se deja para los problemas.
Por tanto, si A es triangular superior o inferior, su determinante es fácil de culcular. Para aprovechar esto puede convertirse una matriz, reduciéndola por renglones, en una forma triangular (superior o inferior), calcularse el determinante de la matriz que resulte y luego relacionarse ese determinante con el de la matriz original. En la figura 1.6.2 se describe este proceso en forma de diagrama. En los teoremas que siguen se indica cuál es la relación entre el determinante de una matriz y el determinante de su versión reducida por renglones. Estos teoremas se enuncian en términos de operaciones de renglón, pero también son válidos para operaciones de columna.
Reducción por renglones Figura 1.6.2
Cálculo de det A mediante la reducción por renglones.
Empleando la definición (esto puede (Teoremas 1.6.2, 1.6.3 y 1.6.4)
(Matriz triangular) (Calcular el determinante) (Producto de elementos diagonales)
SISTEMAS DE ECUACIONES Y ÁLGEBRA MATRICIAL
87
1.6.2
Sea A una matriz de n x n. Si se intercambian dos renglones adyacentes de A, el determinante de la nueva matriz es — det A.
Demostración
Sea B el resultado de intercambiar dos renglones adyacentes de A, de modo que
TEOREMA
Ahora se calcula det A usando el renglón i y se calcula det B usando el renglón i + 1:
Obsérvese que los determinantes de las submatrices (o subdeterminantes) son los mismos. Las únicas diferencias entre det A y det B son los signos. En particular,
TEOREMA
1.6.3
Demostración
Si se intercambian dos renglones cualesquiera de A, el determinante de la nueva matriz es — det A.
El intercambio de dos renglones siempre se puede efectuar mediante un número impar de intercambios de renglones adyacentes. Supóngase que desea intercambiarse el renglón i con el renglón i + m. Pasar el renglón i al renglón i + m requiere m intercambios adyacentes. Luego para pasar el renglón i + m (que está ahora un renglón más arriba de donde estaba) al renglón m requiere m — 1 intercambios adyacentes. Todos los demás renglones se encuentran en sus posiciones originales. El número total de intercambios es m + m — 1 = 2m — 1, el cual es un número impar. Cada intercambio adyacente cambia el signo del determinante. Un número impar de cambios de signo altera el signo del determinante original. (El hecho de que el intercambio de dos renglones se pueda efectuar con sólo un número impar de intercambios de renglones adyacentes es consecuencia del estudio de la paridad de una permutación, la cual no se verá en este texto.)
88
ÁLGEBRA LINEAL CON APLICACIONES
COROLARIO
Demostración
Si dos renglones de A son idénticos, entonces det A = 0. Si se intercambian los renglones idénticos, el determinante de la nueva matriz es —det A. Pero la nueva matriz es igual a A. Así,
Esto sólo es cierto si det A = 0.
TEOREMA
1.6.4
Sea A una matriz de n x n. a) Si un renglón de A se multiplica por un número k, el determinante de la nueva matriz es k det A. b) Si el resultado de multiplicar un renglón de A por una constante se suma a otro renglón de A, el determinante de la nueva matriz es igual a det A.
Demostración
a) Sea
que es la matriz A con el renglón i multiplicado por k. Ahora se halla det B usando el renglón i.
b) Supóngase que se ha sumado r veces el renglón i de A al renglón m, para obtener una matriz B;
SISTEMAS DE ECUACIONES Y ÁLGEBRA MATRICIAL
69
Se emplea el renglón m para calcular det B:
Por el corolario el primer determinante vale cero, ya que dos renglones son idénticos. Por tanto, det B = det A. Ahora se emplearán estos resultados para calcular algunos determinantes. EJEMPLO
6
Sea
Hállese det A.
Solución
Se reduce por renglones,
ALGEBRA LINEAL CON APLICACIONES
90
Por los teoremas 1.6.4b y 1.6.1,
EJEMPLO
7
Sea
Hállese det A.
Solución
Se puede ver que la columna 3 es exactamente - 2 veces la columna 1. Por tanto,
Como la última matriz tiene una columna de ceros, su determinante vale cero por definición. Recuérdese que los teoremas son válidos también si "renglón" se sustituye por "columna".
La regla de Cramer es una aplicación interesante de los determinantes y se enuncia a continuación. Esta regla puede emplearse para calcular soluciones de
cuando A es cuadrada. Para calcular soluciones es útil fundamentalmente cuando A es de tamaño pequeño. No se demostrará la regla de Cramer. Sea A una matriz de n x n. El sistema de ecuaciones
SISTEMAS OE ECUACIONES Y ÁLGEBRA MATRICIAL
91
En tal caso, la solución puede tiene una solución única, si y sólo si det calcularse como sigue: sea Ak la matriz obtenida al reemplazar la columna k de A por la matriz columna B. Entonces
EJEMPLO
8
Resuélvase
usando la regla de Cramer. Solución
Primero se halla det A: det A = det
Ahora se sustituye
en la columna 1 y se calcula
ÁLGEBRA LINEAL CON APLICACIONES
92
De manera similar,
La respuesta es correcta, como puede comprobarse por sustitución directa.
Este teorema será útil más adelante.
TEOREMA
1.6.5
Para todas las matrices A y B de n x n, a) det A T = det A y b) det (AB) = det A det B.
La demostración de la parte a) se deja para los problemas; la demostración de b) se dará cuando se hayan estudiado las matrices elementales en la sección que sigue. EJEMPLO
9
Solución
Explíquese el teorema 1.6.56 empleando las matrices de los ejemplos 3 y 5. Sean
Entonces
SISTEMAS DE ECUACIONES Y ALGEBRA MATRICIAL
93
Las operaciones 7R3 + R2 y R3 + R1 muestran que
det (AB) = det
Aplicando -C1 + C3, 10C3 + C1 y -3R3 + R1 en ese orden, se tiene
Para otra parte, (det A)(det B) = (-34)(-36) = 1224. PROBLEMAS
1.6
1. Calcúlense los determinantes de las matrices siguientes empleando la definición.
2. Calcúlense los determinantes de las matrices siguientes utilizando reducción por renglones.
3. Evalúense los determinantes de las siguientes matrices empleando teoremas, corolarios o la estructura especial de las matrices.
94
ÁLGEBRA LINEAL CON APLICACIONES
4. Una regla para calcular el determinante de la matriz de 3 x 3
puede mostrarse como
De esta manera, para calcular
se escribe
y se tiene
Empléese este método para evaluar los determinantes en los problemas 1b, 2a, 2b y 3c. 5. Aplíquese la regla de Cramer para resolver los sistemas siguientes:
SISTEMAS DE ECUACIONES Y ÁLGEBRA MATRICIAL
95
6. Demuéstrese el teorema 1.6.1 para el caso de matrices triangulares infe riores. 7. Úsese el teorema 1.6.5 para mostrar que det AB = det BA. 8. Muéstrese que para la matriz
9. Usando
muéstrese que det AB = det A det B 10. Encuéntrense valores de k tales que el determinante de la matriz sea cero.
11. Demuéstrese el teorema 1.6.5a. (Sugerencia: empléense renglones para det A y columnas para det AT.) 12. Muéstrese que det 13. Muéstrese que det A* 14. Muéstrese que det 15. Muéstrese que det 16. Muéstrese que si
entonces det {A CB) = det C (C es de n
17. Si A2 = A, entonces A se llama idempotente. Muéstrese que si A es idempotente, entonces el determinante de A vale 1 o 0. 18. Si A2 = I, entonces A se llama involutoria. Muéstrese que si A es involutoria, entonces el valor absoluto del determinante de A es igual a 1. 19. Si An = 0 para algún entero positivo n, entonces A se llama nilpotente de orden (o exponente) n. ¿Qué puede decirse del determinante de una matriz nilpotente? 20. ¿Es posible que una matriz A de n x n con elementos reales satisfaga la ecuación A2 = — I cuando n es impar? ¿Cuándo n es par?
96
ÁLGEBRA LINEAL CON APLICACIONES
21. Si det
¿debe A ser igual a Bl
22. Muéstrese que det 23. Si A es antisimétrica, ¿qué puede decirse acerca de det A? 24. Úsese el problema 13 para mostrar que si A es hermitiana, entonces det A es real. 25. Sea
1.7
donde
Calcúlese det
para
MÉTODO DE LA INVERSA MATRICIAL Para resolver la ecuación
donde a y b son números reales o complejos, puede simplemente dividirse ambos lados de (1.7.1) entre a para hallar Hay un método similar para resolver
donde A y B son matrices. Este método se llama método de la inversión matricial. Aunque este método no se emplea usualmente para cálculos numéricos, encuentra una aplicación teórica en el desarrollo de otros métodos numéricos, como se verá en la siguiente sección. No es posible "dividir" ambos lados de (1.7.2) entre A. Para saber qué es lo que se necesita, se recordará lo que es la inversa multiplicativa de un número real a. Si se multiplican ambos lados de (1.7.1) por se tiene
Si se quiere adaptar este método para A X = B, es necesario definir la inversa multiplicativa de una matriz cuadrada A.
D E F I N I C I Ó N
E J E M P L O
1.7.1
1
Una inversa multiplicativa de
Muéstrese que
es toda matriz
para la cual
SISTEMAS DE ECUACIONES Y ÁLGEBRA MATRICIAL
97
es una inversa multiplicativa de
Solución
Como
se sabe que
y trátese de hallar una inversa multiplicativa
No es necesario que una matriz cuadrada tenga una inversa multiplicativa. Considérese, por ejemplo,
es una inversa multiplicativa de
Como AM tiene que ser igual a I, debe cumplirse que
o bien
es decir,
Como no es posible satisfacer esta última ecuación, no existen a, b, c y d tales que AM = I.
98
ÁLGEBRA LINEAL CON APLICACIONES
Se ve entonces que algunas matrices tienen inversas multiplicativas y otras no. A continuación se demostrará que, si A tiene una inversa multiplicativa, entonces esa inversa es única.
T E O R E M A
tiene una inversa multiplicativa, la inversa es única.
1.7.1
Demostración
Se mostrará que si dos matrices son inversas de A, en realidad son la misma. Supóngase que son inversas de A, de manera que
y multiplicando por la derecha por M2 para obtener
por la ley asociativa, se tiene
Pero
por lo que
Como la inversa multiplicativa de A es única, se empleará un símbolo especial para representarla:
Para resolver AX = B puede ahora emplearse la inversa matricial, si existe: 1. Hállese
(si existe).
2. Multiplíquese por la izquierda por 3. La solución es
EJEMPLO
2
Resuélvase
con el método de la inversa matricial.
para obtener
SISTEMAS DE ECUACIONES Y ÁLGEBRA MATRICIAL
Solución
99
Como
se sabe que
(Véase el ejemplo 1.) Por lo tanto,
Aunque ya se ha visto que el método de la inversa funciona, hay todavía dos preguntas muy importantes a las que no se ha dado una respuesta: 1. Dada A, ¿cómo puede determinarse si existe 2. Si existe
¿cómo hallarla?
Para dar una idea de cómo contestar estas preguntas, puede estudiarse el caso de las matrices de 2 x 2. Sea
una matriz de 2 x 2 cualquiera; se intenta hallar una matriz de 2 x 2
tal que
Si esto puede lograrse, entonces
100
ÁLGEBRA LINEAL CON APLICACIONES
es Desarrollando el lado izquierdo de (1.7.3) e igualando los elementos correspondientes de las matrices, se obtiene
Esto puede reescribirse como dos sistemas:
Según la regla de Cramer, puede resolverse en forma única para x, y, z y w, si y sólo si
es decir, si det En consecuencia, existe para una matriz A de 2 x 2, si y sólo si det De hecho, esto es cierto para matrices de n x n y la demostración implica escribir conjuntos de ecuaciones como el de arriba y el empleo de la regla de Cramer.
T E O R E M A
1.7.2
EJEMPLO
3
Solución
La matriz A tiene una inversa multiplicativa, si y sólo si det
¿Cuáles de las siguientes matrices tienen una inversa multiplicativa?
a) El determinante es — 1, que es diferente de cero; la matriz tiene inversa. b) El determinante vale 0. La matriz no tiene inversa. c) El determinante es — 10, que es diferente de cero; la matriz tiene inversa. d) El determinante es
la matriz tiene inversa.
Ahora se mostrará cómo hallar resolviendo las ecuaciones en (1.7.4) para x, y, z y w. En forma aumentada se tiene
SISTEMAS DE ECUACIONES Y ÁLGEBRA MATRICIAL
101
Si se eliminan variables mediante la eliminación de Gauss-Jordan, se hallarán x, y, z y w leyendo en el lado derecho. Por ejemplo, puede considerarse
Las ecuaciones (1.7.5) son
Así,
Como se usaron las mismas operaciones de renglón en ambos casos en (1.7.6), pueden ahorrarse tiempo y espacio juntando las matrices aumentadas para obtener
entonces ha cambiado a Obsérvese que cuando A se ha reducido a De hecho, esto sucede con matrices cuadradas de cualquier orden.
TEOREMA
1.7.3
Sea A una matriz de n x n que tiene una inversa multiplicativa. Entonces puede hallarse mediante el proceso
Puede darse una demostración de este teorema empleando matrices elementales, las que se estudiarán más adelante en esta sección.
EJEMPLO
4
Resuélvase
102
ÁLGEBRA LINEAL CON APLICACIONES
mediante la inversión matricial. Solución Por tanto, existe
Para calcularla, se efectúan las operaciones de renglón
Así,
Si una matriz cuadrada A tiene una inversa multiplicativa, A se llama invertible o no singular. Si no existe, entonces A es singular. Cuando se quiere hallar para una matriz dada A, no es necesario calcular det A antes de comenzar las operaciones de renglón sobre Si en la sucesión de operaciones de renglón se halla un renglón de ceros en la forma reducida por renglones de A, se sabe entonces que no existe det Se sabe que det A = 0, porque el determinante de una reducción por renglones de A difiere de det A sólo por un múltiplo diferente de cero. En el siguiente teorema se enuncian algunas propiedades de cesitarán más adelante. TEOREMA
1.7.4
que se ne-
Sean A y B matrices invertibles de n x n. Entonces los enunciados siguientes son ciertos. La matriz A B es invertible y Para
La matriz
es invertible y
Si r es un escalar diferente de cero, entonces rA es invertible y La matriz
es invertible y
SISTEMAS DE ECUACIONES V ÁLGEBRA MATHICIAL
Demostración
103
a) Esta parte se demostrará mediante la multiplicación directa por el término considerándolo como inversa de AB.
Como estos productos son iguales a I, la matriz A B es invertible y la inversa de AB.
es
Continuando este proceso se obtiene finalmente
Esto significa que (det A) c) Como La invertibilidad de A implica que det por lo que puede dividirse entre det A para hallar
Las demostraciones de d), e) y f) se piden en los problemas.
Ahora se analizarán las matrices elementales. Una matriz elemental es cualquier matriz obtenida de mediante operaciones elementales de renglón. Así,
son matrices elementales que resultan de las operaciones 2R1 + R3, — 3R2 y La importancia de las matrices elementales está en que el resultado de una operación de renglón sobre una matriz A puede obtenerse multiplicando A por la matriz elemental adecuada. Sea A una matriz de n x n y E la matriz elemental correspondiente a una operación de renglón. Si la operación de renglón sobre A da como resultado la matriz B, entonces
104
ÁLGEBRA LINEAL CON APLICACIONES
Por ejemplo, en el caso 3 x 3, sea la operación de renglón - 3R1 + R3. La matriz elemental asociada es
Pero si
entonces
Por supuesto, una sucesión de m operaciones de renglón lleva a una sucesión de matrices elementales y el resultado de las operaciones de renglón sobre
Por ejemplo, si
y se efectúan las operaciones de renglón
se generan
SISTEMAS DE ECUACIONES Y ÁLGEBRA MATRICIAL
105
Multiplicando, se tiene
Lo más importante de las matrices elementales es que son invertibles. Esto se debe a que es invertida por es invertida por
(recuérdese,
es invertida por Así, por ejemplo, en el caso 3 x 3 -3R1 + R3 da por resultado
y 3R1 + R3 da por resultado
El producto es
Si A es invertible, su forma escalonada por renglones reducida será I, ya que por las propiedades de los determinantes det A será simplemente una constante multiplicada por el determinante de la forma escalonada reducida por En consecuencia, si las matrices elementales renglones de A y det correspondientes a las operaciones de renglón que reducen A a I se denotan se tiene por
ALGEBRA LINEAL CON APLICACIONES
106
Pero la inversa de un producto es el producto de las inversas con el orden invertido, por lo cual
Esto muestra que se puede construir aplicando las operaciones de renglón que reducen A a I en la matriz identidad. Queda así demostrado el teorema 1.7.3.
EJEMPLO
5
Determínese si
es invertible. Si lo es, hállese Solución
Considérese (A | I) y redúzcase por renglones:
Como el tercer renglón de la reducción de A consta solamente de ceros, det A = 0 y, por tanto, no existe. La matriz A es singular.
SISTEMAS DE ECUACIONES Y ÁLGEBRA MATRICIAL
EJEMPLO
6
107
La teoría de la estadística se utiliza para estimar parámetros en problemas de ingeniería. En el caso de errores autorregresivos,9 es necesario invertir la matriz triangular inferior de n x n
donde es un número real relacionado con los errores de medición en el proceso estudiado. Hállese
Solución Para tener una idea de cómo debe ser
se tratará primero el caso 3 x 3 :
Así
Si se trabaja el caso 4 x 4, se halla que
9
J. V. Beck y K. J. Arnold, Parameter Estimation in Engineering and Science, John Wiley & Sons, Nueva York, 1977.
ÁLGEBRA LINEAL CON APLICACIONES
108
Una suposición razonable es que en el caso n x n
La multiplicación directa muestra que Como la inversa de una la suposición es correcta. matriz es única y Los importantes resultados de esta sección permiten enunciar el resultado básico de la teoría de las ecuaciones lineales. TE ORE MA
1.7.5
Sea A una matriz de n x n y B una matriz de n x 1. Las proposiciones que siguen son todas equivalentes. a) AX = B tiene una solución única. b) A es equivalente por renglones a I. c) A es invertible. d) det A
Demostración
Se mostrará que a) implica b), b) implica c), c) implica d) y d) implica a). a) implica b): después de una reducción por renglones de (A \ B) la forma escalonada por renglones reducida de la matriz aumentada, (R \ S), debe representar un sistema equivalente. Por equivalencia, el sistema reducido tiene una sola solución. De esto se deduce que R debe ser entonces A es equivalente por renglones a b) implica c): si A es equivalente por renglones a /, det A es algún múltiplo diferente de cero de det I. Por tanto, det Por el teorema es invertible. c) implica d): si A es invertible, entonces det Por tanto, ni det A ni det son cero. d) implica a): esto sigue de la regla de Cramer. El teorema 1.7.5 implica un resultado que se usará a menudo. Sea A una matriz de n x n. La ecuación homogénea
tiene una solución no trivial, si y sólo si det
SISTEMAS DE ECUACIONES Y ÁLGEBRA MATRICIAL
109
Finalmente, como se prometió en la sección anterior, se dará una demostración de del AB = (det A)(det B). Primero se observa que si E es una matriz elemental, entonces det EA = (det E)(det A). Esto se ve fácilmente al considerar tres casos correspondientes a cada una de las tres operaciones elementales de renglón que puede representar E. En el caso general, supóngase que se conocen las formas escalonadas reducidas por renglones de A y B. La forma reducida será I o bien
Supóngase que en el primer caso A tiene la forma escalonada reducida por renglones de I. Entonces se tiene
Como las Ei son las matrices elementales, también sus inversas son elementales. Usando la primera observación hecha en este párrafo se tiene
En el segundo caso, supóngase que A tiene la segunda forma escalonada reducida por renglones posible. Entonces det A = 0 y (det A)(del B) = 0. Además, det (AB) = 0 porque A B no tiene inversa (si la tuviese, la inversa tendría que ser no existe). Por tanto, det (AB) = 0 = (det A)(det B). pero
PROBLEMAS
1.7
1. Para las matrices A siguientes, determínese si cúlese.
existe. Si
existe, cal-
2. Resuélvanse los sistemas siguientes empleando el método de la inversa.
110
ÁLGEBRA LINEAL CON APLICACIONES
3. Sí
es la inversa multiplicativa de A, ¿cuál es la inversa de 3A? 4. Si
son invertibles, ¿es A + B invertible?
5. Demuéstrese el teorema 1.7.4 con ejemplos. 6. Sea n un entero positivo mayor que o igual que 2. Sea
donde A es una matriz no singular. Si
calcúlense 7. Supóngase que A es invertible y que B no lo es. Demuéstrese que A B no es invertible. (Sugerencia: considérese det AB.) 8. Resuélvase
en los casos siguientes:
9. Sea A no singular y supóngase que AB = AC. Demuéstrese que B = C. 10. Supóngase que A, B y C son matrices y que C-1 existe. Demuéstrese que C -1 AC = B implica det A = det B. 11. Para
demuéstrese que 12. Demuéstrese que, si A es invertible y (Sugerencia: recuérdese que det
entonces det
SISTEMAS DE ECUACIONES Y ÁLGEBRA MATRICIAL
111
13. a) Demuéstrese que, si A es invertible y A-1 = A*, entonces + 1. (Sugerencia: recuérdese que para números complejos zz b) Considérese
Muéstrese que A*A = I. La matriz A es una matriz de espín de Pauli. Se emplea para estudiar el espín del electrón en la mecánica cuántica. 14. Si A es una matriz simétrica no singular, ¿es simétrica misma pregunta en el caso de matrices antisimétricas.
Contéstese la
15. ¿Es posible que una matriz de 3 x 3 sea no singular y antisimétrica? Generalícese el resultado. 16. Demuéstrese el teorema 17. Muéstrese que toda matriz nilpotente debe ser singular. 18. Si A y A B son de n x n e invertibles, ¿debe ser invertible B? 19. Sean A y B de n x n. Si A B y BA son invertibles, ¿deben A y B ser invertibles? 20. Si A = By
existe, ¿es necesario que
21. Sean A y B de n x n. Si
¿debe A = B?
22. Si A es triangular superior y no singular, ¿es
triangular superior?
recibe el nombre de 23. Sea matriz de Hilbert. En el problema 25 de la sección 1.6 se calcularon los deSi es así, calcú¿Son invertibles terminantes de lense los determinantes de las inversas. 24. Sea
definida como en el problema 23.
a) Calcúlese b) Empléese
para resolver
reteniendo solamente tres dígitos significativos y redonc) Calcúlese deando en cada cálculo. Reténganse sólo tres dígitos significativos en los elementos de B. Resuélvase de nuevo la ecuación en b).
ÁLGEBRA LINEAL CON APLICACIONES
112
1.8 OTROS DOS MÉTODOS DE CALCULO: DESCOMPOSICIÓN LU E ITERACIÓN DE GAUSSSEIDEL El álgebra matricial permite desarrollar dos importantes métodos de cálculo para la resolución de sistemas de ecuaciones lineales. Se analizará primero la descomposición LU. Si la matriz cuadrada A se puede escribir como LU, donde L es una matriz triangular inferior y U es una matriz triangular superior y el sistema AX - B tiene una sola solución, entonces las ecuaciones pueden resolverse en dos pasos. Como AX = LUX, puede tomarse UX igual a Y (Y aún se desconoce) y 1. Se resuelve LY = B para Y. 2. Se resuelve UX = Y para X. A primera vista, esto parece requerir más trabajo que la solución de las ecuaciones originales. Pero obsérvese que resolver L Y = B y UX = Y es fácil, ya que L y U son matrices triangulares. EJEMPLO
1
Si
aplíquese el procedimiento de dos pasos descrito líneas arriba para resolver
Solución
Primero se resuelve
El sistema en forma de matriz aumentada es
SISTEMAS DE ECUACIONES Y ALGEBRA MATRICIAL
113
Para resolver esto se usa la sustitución hacia adelante. La primera ecuación da inmediatamente Sustituyendo esto en la segunda ecuación, se halla Finalmente, haciendo en la tercera ecuación se tiene El paso 2 requiere resolver
Este sistema está representado por
que ya se sabe que se puede resolver mediante la sustitución en reversa: con lo que Finalmente, que implica 1 y la solución es
Aunque la descomposición LU da un método para resolver AX = B, no se ha mostrado cómo hallar L y U ni cómo determinar si existen para una matriz dada A. Esto se hará en seguida, pero antes se mencionarán algunas situaciones en que el método de la descomposición LU es útil. 1. Es útil al resolver AX = B cuando B es variable. Las matrices L y U pueden almacenarse en una computadora y el proceso
requiere solamente la sustitución hacia adelante y en reversa, lo que es rápido desde el punto de vista del cálculo. Así, AX = B1, AX = B2, . . . , AX = Bn, pueden resolverse con mucha rapidez. 2. Si A es tridiagonal, como sucede a menudo en las aplicaciones de problemas con valores en la frontera de las ecuaciones diferenciales, la descomposición LU de A se puede hallar fácilmente y con una mínima propagación de errores. Por tanto, es el método que se elige usualmente con sistemas tridiagonales. 3. Si A es simétrica y positivamente definida (A es positivamente definida si entonces resulta muy sencillo obtener cierta para toda descomposición LU. Ésta es
ÁLGEBRA LINEAL CON APLICACIONES
114
y necesita menos espacio de almacenamiento que la descomposición LU general. El método de solución correspondiente se conoce como método de Cholesky. Una condición necesaria y suficiente para que una matriz simétrica sea positivamente definida se da más adelante en esta sección. Para hallar L y U en una descomposición LU de puede intentarse la reducción por renglones. Para mostrar esto, se emplearán matrices elementales. Después de obtener una forma triangular superior R para A utilizando m operadores de renglón, de la forma (esto es posible sólo donde cuando se obtienen pivotes diferentes de cero después de cada operación de renglón), se tiene
Ahora R es triangular superior y es triangular inferior, También es triangular inferior, por lo que
Por tanto, Dada una matriz A de n x n, A puede escribirse como LU suponiendo que sólo se obtienen pivotes diferentes de cero al reducir A ala. forma triangular superior, usando solamente operaciones de renglón de la forma
E J E M P L O
2
Hállese una descomposición LU para la matriz del ejemplo 1.
Calculando
se tiene
SISTEMAS DE ECUACIONES Y ÁLGEBRA MATRICIAL
115
Obsérvese que los negativos de los multiplicadores en cada operación de renglón son elementos de L. De hecho, si se usa entonces —a va en la posición jk de L. Esto se usa en el ejemplo que sigue. Comprobando el resultado, se tiene
EJEMPLO
3
Solución
Calcúlese una descomposición LU para
La reducción por renglones da
Primera columna de L debajo ele la diagonal formada por los negalivos de ésios
Segunda columna de L debajo de la diagonal formada por los negativos de éstos
Tercera columna de L debajo de la diagonal formada por los negativos de éstos
ÁLGEBRA LINEAL CON APLICACIONES
116
Cuarta columna de L debajo de la diagonal formada por los negativos de éstos
Por tanto,
EJEMPLO
4
Solución
Resuélvase el ejemplo 6 de la sección 1.3 aplicando la descomposición LU. En todos los cálculos redondéese a cuatro cifras significativas.
Se procede como en el ejemplo 3:
En consecuencia,
Se observa que el error de redondeo ya está afectando al problema, porque LU no es exactamente igual a A. Ahora se resuelve
SISTEMAS DE ECUACIONES Y ÁLGEBRA MATRICIAL
117
Para L Y = B se tiene
y para UX = Y,
que da la misma respuesta que antes. El ejemplo 4 muestra también que en la descomposición LU puede ser necesaria una modificación en favor de una estrategia de pivoteo; el lector interesado puede consultar Computer Solution of Linear Algebraic Systems, de G.E. Forsythe y C.B. Moler (Prentice-Hall, Englewood Cliffs, N.J., 1967). En general, para resolver un solo sistema AX = B, donde A no tenga muchos elementos iguales a cero, la eliminación gaussiana con pivoteo parcial es el método más adecuado. Es el "más adecuado" en el sentido de que se obtiene un buen control de errores sin gastar demasiado tiempo de computadora. Si A es especial (tridiagonal o positiva definida y simétrica), entonces la descomposición LU es más rápida que la eliminación y no acumula tantos errores. Si se va a resolver AX = B para varias B y A tiene una descomposición LU, entonces éste es el método más adecuado, ya que es más rápido hallar L y U una sola vez y luego aplicar el proceso de dos pasos para cada B. Matrices mal acondicionadas Hay ciertas matrices a las que se les denomina mal acondicionadas. Si A es una de ellas, resolver
es difícil porque los errores pequeños en los elementos redondeados de B se incrementan muchas veces. Por ejemplo,
tiene la solución x = 0, y = 0.1. Si se introduce un error de 0.01 en los lados derechos y se resuelve
se halla que (usando aritmética exacta)
118
ÁLGEBRA LINEAL CON APLICACIONES
Se ve que el error de 0.01 en el lado derecho de (1.8.1) dio por resultado un error de 0.17 (17 veces el error contenido en B) en el cálculo de y. Hay algunas técnicas especiales para resolver sistemas con matrices mal acondicionadas. Sin embargo, están fuera del ámbito de este libro. Comprobación de la respuesta de la computadora Para saber si una solución puede obtenida con la computada es una buena solución para calcularse el vector residual definido por
es pequeña, es de y calcularse su magnitud esté cercana a la solución real. Después de todo, si esperarse que (es decir, si entonces
(Recuérdese que = significa "aproximadamente igual a"). En general, calcular el residual y determinar sí es pequeña (por es un buen medio de hacer que la computadora veriejemplo, fique su propia respuesta. Sin embargo, si A es mal acondicionada, no esté cercana a la soluB (el residual) puede ser pequeño aun cuando ción. Por ejemplo, si la solución x se propone como la solución para (1.8.1), el residual es
Obsérvese que es pequeño,
Así, aun cuando el residual no es cercano a
De hecho,
El ejemplo precedente y su análisis apoyan este consejo: al resolver AX = B, si A es mal acondicionada, es una actitud sana tomar con precaución la respuesta de la computadora. El tratamiento detallado de los sistemas mal acondicionados se puede hallar en textos sobre análisis numéricos o en textos como
SISTEMAS DE ECUACIONES V ÁLGEBRA MATRICIAL
119
Computational Methods of Linear Algebra de D.K. Fadeev y V.N. Fadeeva (Freeman, San Francisco, 1963). Iteración de Gauss-Seidel En algunas aplicaciones de física e ingeniería, debe resolverse un sistema AX = B en el que A es esparcida. Una matriz es esparcida si la mayor parte de sus elementos son ceros. Por ejemplo,
es una matriz esparcida. Aunque no se intenta cuantificar la expresión "la mayor parte", es evidente que más de dos tercios de los elementos de A deberán ser cero para que A sea esparcida. La eliminación gaussiana es un desperdicio de recursos en sistemas que tienen una A esparcida. La mayor parte de las operaciones de renglón no eliminan variables, pero de cualquier manera la computadora efectúa las operaciones. Es por ello que se han desarrollado otros métodos, aparte de los presentados en las dos secciones anteriores, para los sistemas esparcidos. El método de Gauss-Seidel es uno de ellos. La idea en que se basa el método de Gauss-Seidel es la iteración, es decir, la realización de una sucesión de cálculos similares cuyos resultados se acercan más y más a un número deseado. Por ejemplo, si se define
y se toma
se obtiene
De hecho, eso Y se ve que la sucesión de valores calculados parece tender a es cierto (es el método del cálculo de Newton) y la demostración de convergencia se halla en la mayor parte de los libros sobre análisis numérico. El concepto del método de Gauss-Seidel es similar.
ÁLGEBRA LINEAL CON APLICACIONES
120
En el método de Gauss-Seidel se procede como sigue: sea
es invertible, mediante el intercambio de rencon (véanse los problemas). glones siempre puede lograrse que 1. Se escribe
2. Se expresa AX = B como (N — P)X = B y se reescribe como
3. Sea X1 cualquier matriz columna de n x 1 y defínase el paso de iteración o repetición como
Es decir, resuélvase (1.8.3) para una vez que se ha calculado Como N es invertible, siempre podrá resolverse (1.8.3). Obsérvese que aquí se aplican los hechos de que det y el teorema 1.7.5, para justificar la existencia de y la solución única de NX = Y. En otras palabras, los resultados teóricos de la sección 1.7 son muy útiles para el desarrollo de un método numérico. 4. Se observa el comportamiento de la sucesión E J E M P L O
5
Solución
Empléese el método de Gauss-Seidel para resolver
Por el paso 1,
SISTEMAS DE ECUACIONES Y ÁLGEBRA MATRICIAL
Sea
y aplíquese el paso iterativo (1.8.3) para obtener
Resolviendo la ecuación
por sustitución hacia adelante se obtiene
Teniendo
se resuelve ahora para
La solución es
Continuando de esta manera, se halla que
121
122
ÁLGEBRA LINEAL CON APLICACIONES
Corno la solución real es
se ve que las soluciones sucesivas solución real.
se acercan cada vez más a la
Un resultado básico del método de Gauss-Seidel es el siguiente: Sea A simétrica, definida positiva, con todos sus elementos diagonales positivos. Con N y P elegidos en la forma indicada anteriormente, la sudefinida por el paso de iteración (1.8.3) cesión B, para cualquier elección de (Es converge en la solución de tienden a cero.) decir, conforme m aumenta, los números
El teorema establece que, si A es simétrica y definida positiva, con entonces la sucesión de aproximaciones de Gauss-Seidel converge a la solución de para cualquier elección de Sin embargo, mientras más cercano esté a la solución, más rápido convergirá la sucesión a la solución. Por ejemplo, si en el ejemplo 1 se elige
tendría que calcularse para tener una solución aproximada comparable a la anterior. De hecho, en este caso se tendría
SISTEMAS DE ECUACIONES Y ÁLGEBRA M ATRICI AL
123
Como muchas de las matrices esparcidas que aparecen en las aplicaciones satisfacen la hipótesis de este teorema, éste es un resultado importante. La demostración requiere métodos que aún no se desarrollan en este texto. Una condición necesaria y suficiente para que una matriz de n x n sea definida positiva es que
EJEMPLO
6
Muéstrese que
es definida positiva. Nótese que A es simétrica. Solución
Como
la matriz A es definida positiva. Como A es simétrica y definida positiva con elementos diagonales positivos, puede decirse que las aproximaciones de GaussSeidel en el ejemplo 5 tienen garantizada la convergencia. Existen otros métodos iterativos que modifican el método de Gauss-Seidel para hacer que la sucesión se aproxime a la solución más rápidamente que el solo método de Gauss-Seidel. Un método que es particularmente eficaz es el método de la sobrerrelajación sucesiva (MSS). El MSS se explica en la mayor parte de los textos sobre análisis numérico. PROBLEMAS
1.8
1. Para las matrices de coeficientes de los problemas 5, 6 y 7 de la sección 1.3, calcúlense sus descomposiciones LU.
124
ÁLGEBRA LINEAL CON APLICACIONES
2. Resuélvanse los sistemas de los problemas 5, 6 y 7 de la sección 1.3 empleando la descomposición LU. 3. Puede demostrarse que, si una matriz tiene una diagonal estrictamente dominante sobre los renglones, entonces el método de Gauss-Seidel convergirá. Se dice que una matriz tiene una diagonal estrictamente dominante sobre los renglones (DEDR) si el valor absoluto del elemento sobre la diagonal en cada renglón es mayor que la suma de los valores absolutos de los otros elementos en el mismo renglón. Por ejemplo,
es DEDR porque
Determínese cuáles de las matrices siguientes son DEDR:
c) Cualquier matriz antisimétrica
4. ¿Es la suma de matrices DEDR una matriz DEDR? 5. ¿Es el producto de matrices DEDR una matriz DEDR? 6. ¿Es la inversa de una matriz DEDR otra matriz DEDR? 7. Muéstrese que
tiene una descomposición LU. (Observación: A es singular.)
SISTEMAS DE ECUACIONES Y ÁLGEBRA MATRICIAL
125
8. Aplíquese el método de Gauss-Seidel a los sistemas siguientes:
Tómese (Ésta es una versión en escala pequeña de los problemas que surgen en las ecuaciones diferenciales parciales.)
La matriz A definitivamente no es DEDR. No obstante, A es definida positiva con elementos diagonales positivos. 9. Se sabe que el método de Gauss-Seidel funcionará para AX = B si A es DEDR o si A es simétrica positivamente definida con elementos diagonales positivos. a) Muéstrense ejemplos de matrices d e 2 x 2 y d e 3 x 3 que sean DEDR, pero que no sean positivamente definidas con elementos diagonales po sitivos. b) Muéstrense ejemplos de matrices de 2 x 2 y de 3 x 3 que no sean DEDR, pero que sean positivamente definidas con elementos diagona les positivos. renglones B, con todos diferentes de cero, donde B se obtiene de/I totalmente mediante intercambios de renglones. (Sugerencia: si no hay ningún intercambio de renglón que pueda hacer para alguna k, ¿qué puede decirse de la columna k y det Al) 11. Proporciónense, por simple observación, dos descomposiciones LU diferentes para I, mostrando así que la descomposición LU de una matriz no es única a menos que se impongan restricciones adicionales a los elementos de L o de U. RESUMEN
El primero y más fundamental de los problemas de álgebra lineal es la solución de sistemas de ecuaciones lineales. La eliminación de variables es un método para resolver ecuaciones lineales que puede aplicarse manualmente o adaptarse a una computadora. Cuando se resuelve un sistema de ecuaciones usando una computadora, se encuentra el fenómeno del error por redondeo. La estrategia del pivoteo parcial ayuda a reducir la acumulación de este tipo de errores en el cálculo de soluciones por eliminación de variables. Otros dos métodos numéricos emplean la descomposición L U y la iteración de Gauss-Seidel. Las matrices fueron empleadas para almacenar coeficientes y miembros derechos de sistemas de ecuaciones lineales, con objeto de realizar la eliminación
126
ÁLGEBRA LINEAL CON APLICACIONES
de variables en forma ordenada. La eliminación gaussiana llevó a las formas escalonadas por renglones de las matrices y la eliminación de Gauss-Jordan a las formas escalonadas reducidas por renglones. Las formas escalonadas y las ecuaciones equivalentes que representan dieron por resultado varios teoremas acerca de la solución de ecuaciones lineales. Sin embargo, el camino conducente a estos teoremas se vio facilitado por los conceptos y resultados de álgebra matricial. En particular, las ideas de la multiplicación matricial, los determinantes y las inversas de las matrices fueron de importancia extrema. Además, se introdujeron matrices especiales como las matrices identidad, cero, triangular y simétrica. La teoría de las ecuaciones lineales desarrollada en esta forma puede resumirse como sigue: 1. Sean es decir, A es cuadrada. Entonces tiene una solución única, si y sólo si existe; tiene una sola solución, si y sólo si det tiene una sola solución, si y sólo si A es equivalente por renglones a I. 2. Sea entonces AX = 0 tiene una solución no t r i entonces AX = 0 tiene una soluciónvial, si y sólo si det no trivial. El lector se dará cuenta, conforme avance en la lectura del texto, que la habilidad de resolver sistemas de ecuaciones lineales, sean homogéneos o no homogéneos, es absolutamente necesaria para resolver los problemas más avanzados de álgebra lineal. Las matrices jugarán un papel importante como representantes de ciertas funciones (lineales) que aparecen en las matemáticas aplicadas. En el capítulo 2 se dará una muestra de estos desarrollos, donde se trabajará en el plano o en el espacio, dejando los desarrollos más avanzados para el capítulo 3. PROBLEMAS ADICIONALES
1. Dado un sistema de ecuaciones lineales que tiene una solución única, ¿es posible siempre añadir otra ecuación, de tal manera que el sistema resultante no tenga solución? 2. Dado un sistema de ecuaciones lineales que tiene una solución única, ¿es siempre posible añadir otra ecuación, de tal manera que el sistema resultante tenga un número infinito de soluciones? 3. Si un sistema de ecuaciones lineales consistente tiene A y B con todos sus elementos reales, ¿debe X tener también sólo elementos reales? 4. Si el sistema consistente del problema 3 tiene A y B con todos sus elementos complejos con partes imaginarias diferentes de cero, ¿debe X tener elementos con partes imaginarias diferentes de cero? 5. Si A y B son invertibles, ¿es A + iB invertible? ¿Qué pasa si A y B son reales? 6. Una matriz
domina a ¿es cierto que
para todo y se escribe ¿Qué pasa si se pide que B
SISTEMAS DE ECUACIONES Y ÁLGEBRA MATRICIAL
7. Si
¿es det A
127
det B?
8. Se dice que una matriz cuadrada A tiene una raíz cuadrada real, si existe una matriz real B tal que A = B2. Por ejemplo, I y -I son raíces cuadradas de I. Dé un ejemplo de una matriz real que no tenga raíz cuadrada real. Si una matriz tiene una matriz cuadrada real, ¿qué puede decirse de su determinante? Si una matriz tiene todos sus elementos positivos, ¿tiene una raíz cuadrada real? 9. Sea A de n x n. Muéstrese que conmutan 10. Jerarquización de los competidores. Supóngase que hay cierto número de competidores por un premio. Se puede usar una matriz A para representar las ventajas relativas por parejas haciendo si el competidor i le lleva ventaja al competidor Se toma La matriz A recibe el nombre de matriz, de dominancia. Así, si hay tres competidores, con 1 aventajando a 2, 3 aventajando a 1 y 2 aventajando a 3, se tiene la siguiente matriz de dominancia:
En general, si para n competidores se forma
entonces la suma del renglón i de S se llama fuerza del competidor i. Para los competidores anteriores se tiene S = A+ A2. Muéstrese que la fuerza de cada uno de ellos es igual a 2 (ningún competidor domina). Supóngase ahora que se tienen tres competidores con 1 aventajando a 2, 1 aventajando a 3 y 3 aventajando a 2. Calcúlese la fuerza de cada competidor. 11. Cuatro atletas van a competir en el campeonato mundial de categoría libre. La matriz de dominancia se determina con base en competencias an teriores; 1 aventaja a 2 o 3, 2 aventaja a 4, 3 aventaja a 2 y 4 aventaja a 1 o 3. Calcúlese la fuerza de cada competidor y pronostíquese un ganador. 12. Para el circuito con el resistor de R1 ohms en la figura P1.12a la matriz es
Figura P 1.12a
128
ÁLGEBRA LINEAL CON APLICACIONES
Para el circuito en la figura P 1.12b la matriz es
Si estos circuitos se conectan en el orden A luego B, de izquierda a derecha, como se ve en la figura P 1.12c, la matriz representativa del circuito combinado es AB.
Figura P1.12c
Calcúlese AB. Es la matriz del circuito mostrado en la figura P1 .12d.
Figura P1.12d
13. Con respecto al problema 12, supóngase que las cajas se conectan en el or den B luego A, de izquierda a derecha. La matriz representativa para este circuito es BA. ¿Es AB = BA? ¿Qué nos dice esto de los dos circuitos combinados? ¿Son equivalentes? 14. A la transmisión de microondas está asociada una matriz llamada matriz de dispersión S. Es de la forma
Los elementos de A están determinados por corrientes y voltajes en una unión de microondas y A es simétrica. Muéstrese que S es simétrica.
SISTEMAS DE ECUACIONES Y ÁLGEBRA MATRICIAL
129
15. Si unas cajas negras, cuyas matrices representativas son de 2 x 2, se conectan en paralelo como en la figura P1.15, entonces la matriz del circuito combinado es A + B. Calcúlese la matriz del circuito, usando A y B del problema 12. ¿Qué puede inferirse de la conmutatividad de la suma matricial sobre la construcción de circuitos en paralelo?
Figura P1.15
2.1 VECTORES En ingeniería química se desea conocer las concentraciones de una especie química a diferentes niveles de una columna de absorción (véase la figura 2.1.1). Para registrar las concentraciones en un momento dado, se puede escribir
donde es la concentración en el k-ésimo nivel. A C se le llama vector de concentración, que es simplemente una matriz de 1 x n. D E F I N I C I Ó N
2.1.1
Un n-vector es una matriz de 1 x n.
Figura 2.1.1
Columna de absorción Plato n; concentración
Plato 2; concentración Plato 1; concentración
ALGEBRA LINEAL CON APLICACIONES
132
Figura 2.1.2
Los vectores (0, 1),
Antes de desarrollar el álgebra de los n-vectores en el capítulo 3, se estudiarán los vectores bidimensionales y tridimensionales ya que su estructura puede visualizarse geométricamente. DEFINICIÓN
2.1.2
Un vector en el plano (o vector bidimensional) es una matriz de 1 x 2 con elementos reales. Un vector en el espacio (o tridimensional) es una matriz de 1 x 3 con elementos reales. El conjunto de todos los vectores en el plano se denota el conjunto de todos los vectores en el espacio tridimensional, por Los elementos de la matriz se llaman las componentes del vector. Dos vectores son iguales si las matrices que los representan son iguales.
EJEMPLO
EJEMPLO
1
Los siguientes son vectores en el plano: (0, 1) Se escriben comas entre las componentes para recalcar el hecho de que los vectores en el plano están asociados con puntos en el plano xy usual (véase la figura 2.1.2). Si se conecta el punto con el origen mediante una flecha (véase la figura 2.1.2), a la flecha se le llama la representación geométrica del vector. Los siguientes son vectores en el espacio tridimensional: (1, 1, - 1), (2, 0, 1), (— 1, 1, 1). Estos vectores se asocian con puntos en el sistema coordenado xyz usual, como puede apreciarse en la figura 2.1.3.
2
Un vector (a, b) en el plano también está asociado con cualquier flecha en y termine en el plano xy que comience en un punto En la figura 2.1.4 se han dibujado varias flechas asociadas con el vector (1, 2). En general, al escribir un vector (a, b), se supondrá que el punto inicial del vector asociado es (0, 0), a menos que se indique otra cosa.
EJEMPLO
3
Hállese el vector asociado con la flecha cuyo punto inicial es (-2, 4) y cuyo punto final es ( - 7, 3).
.VECTORES EN EL PLANO Y EN EL ESPACIO
Figura 2.1.3 Los vectores
Solución
133
Figura 2.1.4 Copias del mismo vector (1, 2).
Como (-2, 4), se tiene (-7, 3) debe ser igual a que (-7, 3) = (-2 + a, 4 + b). Por tanto, a = -5, b = - 1 y (a, b) = (-5, 1). La forma fácil de resolver este problema consiste en "restar puntos": punto terminal - punto inicial. Así pues (restando matrices),
Véase la figura 2.1.5. Para vectores en el espacio se tienen métodos e interpretaciones similares en el sistema coordenado xyz. EJEMP LO
4
Figura 2.1.5 Una versión del vector
Trácese la flecha correspondiente al vector (1, —1,2) con punto inicial (0, 0, 0) y punto terminal (1,2, - 1).
134
ÁLGEBRA LINEALCON APLICACIONES
Figura 2.1.6
Vectores del ejemplo 4.
Solución
Se dibujan los ejes x, y y z, se localizan (0, 0, 0) y (1, - 1, 2) y se dibuja una flecha desde (0, 0, 0) hasta (1, — 1 , 2 ) ; véase la figura 2.1.6. Para el segundo caso se localiza el punto ( 1, 2, — 1) como en punto inicial. Sea (a, b, c) el punto final; entonces el vector (1, — 1 , 2 ) satisface
Esto significa que el punto terminal es (2, 1, 1). La longitud de la flecha que representa a un vector se define como la longitud, o magnitud, del vector. Considerando de nuevo la figura 2.1.4 y aplicando el teorema de Pitágoras para triángulos rectángulos, se halla que la longitud Se tiene así la definición siguiente. DEFINICION
2.1.3
La longitud (o magnitud) del vector se define mediante
Para vectores tridimensionales
EJEMP LO
5
Solución
Calcúlense
(a, b) se denota con
VECTORES EN EL PLANO Y EN EL ESPACIO
DEFINICIÓN
2.1.4
135
La suma de los vectores (a, b) y (c, d) se define mediante La suma de los vectores (a, b, c) y (d, e, f) se define mediante
EJEMPLO
6
Sean Calcúlense
Solución
La definición de suma corresponde a la "suma" de las fuerzas representadas por los vectores. En la figura 2.1.7 se muestra la representación de dos fuerzas que actúan sobre un punto en el origen; la suma de los dos vectores se llama la fuerza resultante. La longitud de cada vector corresponde a la magnitud de la fuerza, y la dirección corresponde a la dirección de aplicación de la fuerza. El vector resultante es simplemente la diagonal (teniendo su punto inicial en común con las dos fuerzas) del paralelogramo generado por las dos fuerzas.
Figura 2.1.7 Diagrama de fuerzas.
ÁLGEBRA LINEAL CON APLICACIONES
136
Como los vectores representan fuerzas, algunos otros conceptos relacionados con las fuerzas pueden expresarse en términos de operaciones con vectores. Por ejemplo, si un objeto se jala "dos veces más intensamente", se está pensando en duplicar la fuerza aplicada. Si la fuerza original es (a, b), la fuerza duplicada es entonces (2a, 2b). Esto lleva a la definición de múltiplo escalar.
D E F I N I C I Ó N
2.1.5
Sea r un número real y (a, b) un vector. El múltiplo escalar1 r(a, b) se define como
Es conveniente que el lector escriba una definición de un múltiplo escalar de (a, b, c). Obsérvese que esta multiplicación es la misma que la multiplicación de una matriz por un escalar. La idea de invertir una fuerza o de cambiarla a la dirección opuesta lleva a la definición del negativo de un vector. D E F I N I C I Ó N
2.1.6
EJEMPLO
7
El negativo de un vector se escribe y se define como de dos vectores se define por cia
Sean
La diferen-
Calcúlense
Solución
o simplemente Finalmente,
EJEMPLO
8
Solución
Represéntese geométricamente el vector diferencia Se tiene que En la figura 2.1.8 se muestra la resultante de, Como el vector puede trasladarse siempre que no se cambien la dirección o la longitud, puede calcularse geométricamente dibujando una flecha desde la punta de hasta la punta de tienen el mismo punto inicial). Véase la figura 2.1.9. 1
En este capítulo, la palabra escalar se reserva para los "números reales".
VECTORES EN EL PLANO Y EN EL ESPACIO
Figura 2.1.8 Significado geométrico de A — B.
137
Figura 2.1.9 A — B como el tercer lado de un triángulo.
Para estudiar el resultado de varias fuerzas que actúan sobre un cuerpo, es posible usar las interpretaciones geométricas de la suma vectorial. Esta clase de problemas se considera en el estudio de la mecánica, y no se ahondará en ellos en este texto. Hasta aquí, se tienen formas para sumar y restar vectores, así como una manera de multiplicar un vector por un escalar. Como los vectores son simplemente matrices y sus operaciones son operaciones matriciales, todas las propiedades enunciadas en el capítulo 1 son válidas para vectores. Se repetirán a continuación. TEOREMA 2.1.1
Sean vectores en el plano o en el espacio. Sea 0 = (0, 0) o 0 = (0, 0, Sean r y s números reales. Entonces, 0) según el tamaño de
Los vectores i, j, k Una forma común de representar vectores tridimensionales en ingeniería es utilizar los vectores.
138
ÁLGEBRA LINEAL CON APLICACIONES
En particular, al aplicar los resultados del álgebra matricial se tiene
En el caso de los dos-vectores, i y j se definen como i = (1, 0) y j = (0, 1); así, (a, b) = ai + bj. En cualquier caso, los vectores i, j y k reciben el nombre de vectores de la base canónica (el porqué de este nombre se verá en el capítulo 3), y los coeficientes de i, j y k se llaman coordenadas canónicas del vector. DEFINICIÓN
2.1.7
Sea
un vector tridimensional. La matriz columna
se llama la matriz de coordenadas canónicas de v. Si v = ai + bj es un vector bidimensional, su matriz de coordenadas canónica es
EJEMPLO
9
Muéstrese que, si v y w son los tres-vectores es igual a la entonces la matriz de coordenadas canónicas de suma de las matrices de coordenadas canónicas de v y w. Es decir, muéstrese que
Solución Los vectores
EJEMPLO
10
por lo tanto
Muéstrese que la multiplicación de la matriz de coordenadas de un vector bidimensional v por
da por resultado la matriz de coordenadas canónicas de 3v.
VECTORES EN EL PLANO Y EN EL ESPACIO
Solución Sea
139
Entonces
es la matriz de coordenadas canónicas de v. Pero
por lo que
es la matriz de coordenadas canónicas de 3v.
EJEMPLO
n
Sea A una matriz de 2 X 2 y v un vector bidimensional. Muéstrese que
Solución Para cualquier vector
por lo que
(a, b) se tiene
Por lo tanto,
La introducción de matrices coordenadas canónicas permite "poner de pie" (a, b, c) como
La intención es permitir la multiplicación de un vector por la izquierda por una (a, h, c), entonces el producto Av no está definimatriz. Si A es de 3 x 3 y En la sección 2.3 se empleará esta multiplicación. Nótese que do pero representa a v e n forma natural. v, pero
PROBLEMAS 2.1
1. Dibújense flechas con punto inicial (0, 0), correspondientes a los vectores dados a continuación:
140
ÁLGEBRA LINEAL CON APLICACIONES
2. Dibújense los vectores del problema 1 de tal modo que su punto inicial sea
3. A continuación se dan parejas de puntos; hállese el vector que comienza en el primer punto y termina en el segundo.
4. Dibújense las flechas que corresponden a los vectores siguientes: a) (1,
5. Calcúlese la longitud de los vectores en el problema 1. 6. Calcúlese la longitud de los vectores en el problema 4. 7. ¿Qué valor debe tener k para que 8. Sean = (0, 1). Calcúlense:
9. Sean
10. Sean que 11. Muéstrese que si
Calcúlese y grafíquese el vector:
¿Existen valores reales de k tales
entonces el vector
tiene longitud 1.
no es necesariamente igual a 12. Muéstrese mediante un ejemplo que Usando el diagrama geométrico para la suma vectorial, justifíquese la desigualdad 13. Muéstrese que si v es un vector bidimensional o tridimensional y r es un número real, entonces 14. Muéstrese que si v y w son vectores tridimensionales, entonces 15. Muéstrese que si A es una matriz de 3 x 3 y v es un vector tridimensional, entonces
VECTORES EN EL PLANO Y EN EL ESPACIO
141
2.2 ÁNGULO ENTRE VECTORES; PROYECCIONES Uno de los problemas más importantes del análisis vectorial es el problema del ángulo: Dados dos vectores la figura 2.2.1.
hallar el ángulo
entre A y B. Véase
Si se puede resolver este problema, entonces se puede saber si A es paralelo a B es perpendicular a La solución de este problema, para vectores en el plano, puede obtenerse aplicando la ley de los cosenos: para un triángulo con lados de longitudes a, b y c como se muestra
se cumple la ecuación
De la ecuación (2.2.1) se tiene
Figura 2.2.1
Triángulo vectorial.
Figura 2.2.2
Triángulo vectorial.
ÁLGEBRA LINEAL CON APLICACIONES
142
Es decir, para un triángulo con longitudes de los lados conocidos, puede calcularse el coseno de cualquiera de los ángulos, y esto es equivalente a hallar en particular para saber si es igual a A fin de resolver el problema del ángulo, considérese el triángulo formado por (véase la figura 2.2.2) y aplíquese la ley de los cosenos. De (2.2.2) se tiene
Supóngase ahora que
Entonces
Esto significa que
y así queda resuelto el problema del ángulo para dos vectores. EJEMPLO
1
Hállese el coseno del ángulo entre Dado que
EJEMP LO
2
Solución
Hállese el coseno del ángulo entre tores. ¿Son perpendiculares? Se tiene que
12, entonces
(— 2, 2). Dibújense los vec-
VECTORES EN EL PLANO Y EN EL ESPACIO
143
Figura 2.2.3 Vectores del ejemplo 2.
Los vectores pueden verse en la figura 2.2.3. Como cos cual los vectores son perpendiculares.
por lo
Si se observa la ecuación (2.2.4), se verá que el numerador del lado dees en realidad (en términos de la multiplicación matricial) recho,
Entonces la ecuación (2.2.4) puede escribirse
Solución al problema del ángulo
Esta fórmula también es aplicable a los vectores tridimensionales. E J E M P L O
3
Hállese el coseno del ángulo De acuerdo a 2.2.5,
Solución Por tanto, estos vectores son perpendiculares.
ALGEBRA LINEAL CON APLICACIONES
144
Como el producto matricial se emplea para resolver el problema del ángulo para vectores, se le da el nombre especial de producto punto.
D E F I N I C I O N
2 .2 .1
EJEMPLO
4
Solución
Dados los dos vectores en el plano o en el espacio, el producto punto Como es un número real, se define como Por tanto, Esto significa que el producto punto es conmutativo. Calcúlense, en
Sean los casos en los que sea posible, Ahora bien
no puede calcularse ya que Por tanto, no existe.
es de
es de
Ahora pueden enunciarse varias propiedades del producto punto. TEOREMA 2.2.1
Sean
vectores del mismo orden, y sean r y s números reales.
donde
es el ángulo entre
Entonces
si y sólo si
(desigualdad de Cauchy-Schwarz)
VECTORES EN EL PLANO Y EN EL ESPACIO
Demostración
145
a) Esto es sólo una forma diferente de expresar la ecuación (2.2.5). b) Se tiene que habiéndose empleado las propiedades de la transpuesta y de la multiplicación matricial en la última igualdad. El último término es simplemente por la definición de producto punto. c) d) y e) son consecuencia de las propiedades de las matrices y se demuestran de manera similar a como se demostró b). f) Considérese el caso de los vectores tridimensionales. Sean Entonces que es simplemente vectores bidimensionales el argumento es el mismo.
Para
g) Primero se demostrará que si entonces entonces Ahora se demostrará que si entonces debe ser el vector nulo. Sea Como son todos mayores que o iguales a cero, la única forma de lograr que esa suma sea cero es que cada uno de los términos sea cero; es decir, deberá tenerse Por tanto, h) De en que tanto, i) De
Como sea igual a cero es haciendo es perpendicular a
la única manera Es decir Por
Como
En los problemas se piden las demostraciones de j) y k). Las proyecciones son una idea geométrica importante, las cuales se estudiarán a continuación usando el producto punto. En la figura 2.2.4 se muestra geométricamente la proyección de un vector B sobre un vector A. En un lenguaje figurado, puede decirse que la proyección de B sobre A es la sombra que B proyecta sobre A debido a rayos de luz que llegan a A, siendo los rayos de luz perpendiculares a A. En mecánica, la proyección es la componente de la fuerza B en la dirección de A, y B ▪ A es el trabajo hecho por la fuerza B en la dirección de A. La proyección vectorial de B sobre A, denotada con BproyA, se puede determinar calculando su longitud; su dirección es la misma que la de A. Una vez que se ha encontrado | BproyA | , se multiplica
ÁLGEBRA LINEAL CON APLICACIONES
146
Proyección del vector B sobre A.
Figura 2.2.4 Proyección de un vector.
por
Figura 2.2.5 Longitud de la proyección.
(el vector unitario en la dirección de A) para obtener se obtiene usando la trigonometría. De la figura 2.2.5 se ve que siendo el triángulo entre A y B. Por tanto, ya que
se sabe entonces que
y de ese modo
A veces, a
EJEMP LO
5
Sean
se le llama la proyección escalar de B sobre A.
Hállese
Solución Un producto entre vectores de importancia en la mecánica en tres dimensiones es el producto cruz. Este producto es específico para vectores tridimensionales y no se generaliza en forma natural para dimensiones mayores. Debido a esto, el tratamiento del producto cruz será breve. DEFINICI O N
2.2.2
Sean escrito
Entonces el producto cruz de es el vector definido por
VECTORES EN EL PLANO V EN EL ESPACIO
EJEMPLO 6
Calcúlese
147
para
Una forma de hacer esto es utilizar el determinante simbólico
es el renglón 2 es el renglón 3 y haciendo el desarrollo a lo largo del primer renglón:
Obsérvese que A x B es perpendicular a A y B porque
De hecho, esto siempre se cumple.
TEOREMA
2.2.2
Sean A y B vectores no nulos. Entonces Para
se tiene
Geométricamente A x B es el vector de longitud perpendicular a A y B y que apunta en la dirección indicada por la regla de la mano derecha: usando la mano derecha, se curvan los dedos de A hacia B; A x B apunta en la dirección en la que apunta el pulgar (véase la figura 2.2.6). Esto se puede demostrar rigurosamente, pero no se incluirá la demostración. es fácil ver que A partir del significado geométrico de es paralelo a (las direcciones pueden ser opuestas).
148
ALGEBRA LINEAL CON APLICACIONES
Figura 2.2.6
Producto cruz.
PROBLEMAS 2.2
1. Calcúlese
2. Hállese el ángulo entre A y B.
3. Calcúlese el coseno del ángulo entre los vectores en el problema 1. 4. Para los vectores en el problema 1, compruébese la desigualdad de CauchySchwarz 5. Hállese la proyección de B sobre A para los vectores en el problema 1. 6. Calcúlese A x B para los vectores en el problema 1c y d. 7. Muéstrese que para el conjunto de vectores {i, j, k}, cualquiera de ellos es perpendicular a los otros dos vectores del conjunto. 8. a) Hállese un vector perpendicular a (1, 2). b) Hállese un vector de longitud 1 perpendicular a (1, 2). c) ¿Cuántas respuestas correctas existen para la parte b)? 9. Calcúlese el ángulo entre la diagonal de un cubo y uno de sus lados. Muéstrese que el ángulo entre 10. Sean es menor que el ángulo entre A y B. Sugerencia: los cosenos de los ángulos son
VECTORES EN EL PLANO Y EN EL ESPACIO
como
149
Muéstrese que
empleando 11. Identidad del paralelogramo. Considérese el paralelogramo Figura P2.2.11
Por la ley de los cosenos,
Utilícese esto para mostrar que
En palabras, b) indica que la suma de los cuadrados de los lados de un paralelogramo es igual al promedio de los cuadrados de las longitudes de las diagonales. 12. Empleando la definición 2.2.2, demuéstrese que 13. Muéstrese que
es perpendicular a
2.3 MATRICES COMO TRANSFORMADORES DEL ESPACIO El análisis de funciones es la esencia de las matemáticas aplicadas. En cálculo se estudian funciones con diversos dominios y rangos (recorridos); en la tabla 2.3.1 se da un resumen. En álgebra lineal se analizan ciertas funciones cuyos Dichas fundominios y rangos son, en cierta forma, parecidos a
ÁLGEBRA LINEAL CON APLICACIONES
150
Tabla 2.3.1
CALCULO
ciones reciben el nombre de transformaciones lineales y sus dominios y rangos se llaman espacios vectoriales, los cuales serán estudiados en detalle en los capítulos 3, 4 y 5. En esta sección se dará un avance de esos temas, refiriéndonos concretamente a Sea una función/cuyo dominio es esta función es lineal si, para toda x y y en el dominio de f y todo número real r,
El primer ejemplo de funciones lineales que veremos se tomó de la mecánica. Figura 2.3.1
Corte, k es pequeño.
VECTORES EN ELPLANO Y EN EL ESPACIO
151
Figura 2.3.2 Vectores superpuestos al corte.
EJEMPLO
1
Imagínese una vista lateral de un cubo de gelatina sostenido entre las mano(véase la figura 2.3.1a). Si la parte inferior de la mano se mantiene fija y la parte superior se coloca como se ve en la figura 2.3 .1b, el cubo sufrirá una deformación especial, la cual estará relacionada con algo llamado corte. Como aproximación, en la figura 2.3.1 se supone que la altura no cambia; esto es razonable si k es pequeña. En la figura 2.3.2 puede verse que el corte transforma i en i, y j en ki + j (el origen se halla en la esquina inferior izquierda de la cara del cubo). En términos de las matrices de coordenadas canónicas, el corte transforma
se puede representar en términos de las matrices de coorLa función corte denadas canónicas
mediante
Se observa que con esta definición
ÁLGEBRA LINEAL CON APLICACIONES
152
lo que concuerda con la acción que se observa en la figura 2.3.2. Tal como está definida, la función corte es lineal ya que, por las leyes de álgebra matricial,
El corte, como función lineal representable por una matriz, es sólo una de muchas aplicaciones importantes. Por ello, es importante estudiar funciones representables mediante matrices que multiplican las matrices de coordenadas canónicas de los vectores. Se analizarán varios ejemplos, y para ahorrar palabras, llamaremos simplemente vectores a las matrices de coordenadas canónicas.2 Como la función está definida en cada ejemplo mediante la multiplicación matricial, la linealidad es consecuencia de las leyes de álgebra matricial:
EJEMPLO
2
(Producción, ingeniería industrial) Supóngase que un fabricante hace dos clases de colchones: suaves y firmes. El trabajo por colchón se divide de acuerdo a la tabla siguiente:
Si se producen xr colchones suaves y x2 colchones firmes, las horas de trabajo empleadas para resortes (S) y almohadilla (P) son 2
Esto es un pequeño abuso de la terminología. Un vector tridimensional es de 1 x 3 y su matriz de coordenadas canónicas es de 3 x 1. No obstante, es fácil hacer la conexión entre
y su vector (a, b, c).
VECTORES EN EL PLANO Y EN EL ESPACIO
153
Estas ecuaciones permiten planear la producción cuando se conoce la cantidad de trabajo disponible para resortes y almohadillas. Esto puede escribirse como
En esta última forma, la "matriz de trabajo"
representa a una función que actúa sobre un "vector de producción"
y da un "vector de trabajo"
EJEMPLO
3
Considérese la función lineal
Para esta función, la acción de f sobre
se expresa mediante la multiplicación de por la matriz Es deseable describir el efecto de f sobre
ÁLGEBRA LINEAL CON APLICACIONES
154
en términos geométricos. Ese es de hecho el objetivo principal de esta sección.
Problema del análisis geométrico Dada una función lineal f
describir geométricamente cómo transforma f los vectores.
EJEMPLO 4
Solución
Resuélvase el problema del análisis geométrico (PAG) para la función del ejemplo 3:
En este caso el problema no es tan difícil como lo será mas adelante. Así, por calculo directo,
Por tanto, la acción de f sobre un vector consiste en extenderlo al doble de su longitud original, dejando inalterada su dirección (véase la figura 2 3 3) En el ejemplo anterior no hay nada especial en la constante 2 Si f se define por
donde k > 0, entonces
y la acción de f es extender (k > 1), reducir (0 < k < 1) o dejar inalterado (k = 1) el vector original y, en cualquiera de los tres casos, no cambiar la dirección Debido a esto se introduce la terminología siguiente
VECTORES EN EL PLANO Y EN EL ESPACIO
155
Figura 2.3.3 Acción de f del ejemplo 4.
Si f se define mediante la matriz escalar
entonces recibe el nombre de Una dilatación, La función ide Una concentración, La función cero,
Ahora se considerará una función ligeramente más complicada.
EJEMPLO
5
Solución
Resuélvase el PAG para la función P definida por
Como en el ejemplo anterior, se calcula
El efecto de P es eliminar la segunda componente y preservar la primera. Para ver qué significa esto geométricamente, se consideran algunos vectores en la figura 2.3.4. Se ve que
156
ALGEBRA LINEAL CON APLICACIONES
Figura 2.3.4 Acciones de P, del ejemplo 5.
es la proyección de
sobre el eje x. Por tanto,
Si
entonces f es una proyección sobre el eje x. De manera análoga, si
entonces f es una proyección sobre el eje y.
Ahora se puede analizar una función ligeramente más complicada. Considérese
y calcúlese
VECTORES EN EL PLANO Y EN EL ESPACIO
157
En este caso el vector original se proyecta primero sobre el eje x, y luego se duplica su longitud. Es decir, geométricamente esta función es una proyección sobre el eje x, seguida de una dilatación con constante 2. Pero también podría pensarse que primero ocurrió la dilatación y luego la proyección. En términos de las matrices que definen a las funciones, esto significa que
pero como también se tiene
se puede escribir
Este último ejemplo muestra el siguiente principio general:
Para resolver el problema del análisis geométrico, divídase la función f en una sucesión de funciones simples como dilataciones, contracciones, proyecciones y otras.
Para aplicar este principio se describirá otra función lineal simple, la rotación.
EJEMPLO
6
Para f definida por
calcúlese
156
ÁLGEBRA LINEAL CON APLICACIONES
Solución
Se calcula
y se gráfica como se ve en la figura 2.3.5a. Además,
La gráfica se muestra en la figura 2.3.5b. En el ejemplo 6, la función dio en cada caso un vector de la misma longitud pero rotado radianes en sentido antihorario con respecto al vector original. Esto, por supuesto, no demuestra que la función sea una rotación do vector. Sin embargo, puede mostrarse que esta función no cambia la longitud del vector y que
Como
se tiene entonces
Figura 2.3.5 a)) Acción de f, del ejemplo 6. b) Acción de f, del ejemplo 6.
VECTORES EN EL PLANO Y EN EL ESPACIO
159
La última ecuación dice simplemente que es perpendicular a Esta ecuación no afirma que el ángulo recto sea un resultado de la rotación. Sin embargo, en trigonometría se demuestra que una rotación antihoraria de las coordenadas x, y por un ángulo está definida por
que puede escribirse matricialmente como
la matriz es
que es exactamente la matriz con la que hemos trabajado. En consecuencia, el resultado de trigonometría dice lo siguiente:
Una función de la forma
es una rotación antihoraria por un ángulo
EJEMPLO
7
Identifíquese el ángulo antihorario de rotación para las funciones siguientes:
ÁLGEBRA LINEAL CON APLICACIONES
160
Solución
En general, se sabe que una matriz de rotación es
Para determinar se toma y se resuelve para Esto puede resolverse con la ayuda de una tabla de funciones, de una calculadora o, en los casos más simples, con ayuda de la memoria. por lo que Se tiene función es la función identidad.
Esto es razonable ya que la
por lo que
Esto tiene sentido porque
Se tiene
es simplemente el inverso de
En este caso y se halla que se halla que Como es el ángulo de rotación.
Usando luego es la solución común, ése
Trabajando como en c), se tiene Además, lo que implica que el ángulo de rotación es (antihorario).
por lo que Por tanto,
Ahora podemos resolver el PAG para algunas funciones más complicadas. Considérese, por ejemplo,
VECTORES EN EL PLANO Y EN EL ESPACIO
161
Ésta es una función interesante ya que la composición de f consigo misma es
Es decir, si f se aplica dos veces (o más), se obtiene únicamente el vector cero (obsérvese que la matriz es nilpotente). Para analizar esta función se nota la primera componente de
se cambia por f a la segunda componente. Como esto podría efectuarse mediante una rotación de es de esperarse que esa rotación tenga un papel en esto. Además, como f duplica es de esperarse también la presencia de una dilatación con constante 2. También se ve que f aniquila a por lo que es posible que f contenga una proyección sobre el eje A continuación se intentará reunir esta información representando con matrices las funciones individuales: Proyección sobre el eje Dilatación con constante 2 Rotación de
Puede variarse el orden en el que se apliquen a
Por ejemplo,
lo cual da
162
ÁLGEBRA LINEAL CON APLICACIONES
Por tanto, éste no es el orden correcto. Pero
Esto quiere decir que f consiste, primero, en una dilatación con constante 2; segundo, en una proyección sobre el eje x; y tercero, en una rotación de Véase la figura 2.3.6. Obsérvese que la matriz que representa a f satisface
Es decir, la dilatación y la proyección pueden aplicarse en orden inverso. Como la multiplicación matricial no es conmutativa en general, sólo cierto orden Figura 2.3.6 Análisis geométrico de
VECTORES EN EL PLANO Y EN EL ESPACIO
163
de las operaciones geométricas dará por resultado la acción de f. En este último ejemplo, hay seis formas posibles de ordenar las operaciones:
En esta lista se ve que la rotación debe ocurrir al final. EJEMPLO
8
Solución
Interprétese la función lineal.
Obsérvese que
por lo que
Como f puede descomponerse en la suma de las funciones lineales g y h, se sabe que f puede analizarse analizando g y h. Ya se ha visto que g es una proyección sobre el eje x seguida por una dilatación con constante 2. La función h es similar: es una proyección sobre el eje y seguida por una dilatación con constante 3. Por tanto, la acción de f es la suma vectorial de 1) proyección sobre x seguida por una dilatación, constante 2, y 2) proyección sobre y seguida por una dilatación, constante 3. En la figura 2.3.7 se EJEMPLO
9
(Gráficas por computadora) Un objeto plano puede proyectarse sobre la pantalla de una terminal de computadora, ya que es posible asignar un sistema de coordenadas a la pantalla. Es decir, puede elegirse un punto de la pantalla como el origen y pueden definirse los ejes x y y con sus escalas respectivas. Quizá
ÁLGEBRA LINEAL CON APLICACIONES
164
Figura 2.3.7
Acción de
sea necesario dilatar, contraer o girar el objeto que aparece en al pantalla. Esto se puede lograr multiplicando los vectores que representan los puntos sobre el objeto por la matriz que representa la acción deseada, almacenando los nuevos vectores y, finalmente, proyectando los nuevos puntos (que son, por supuesto, los puntos terminales de los vectores). Una acción que no se puede representar sólo mediante la multiplicación por una matriz es la traslación:
La traslación es no lineal porque
Los ejemplos dados hasta aquí han sido solamente funciones lineales con dominio En la tabla 2.3.2 se dan algunos ejemplos sencillos de funciones lineales con dominio Con el objeto de analizar funciones lineales más complicadas generadas por matrices o generadas por matrices de tamaño mayor, se necesitan técnicas más complejas que serán expuestas más adelante en el texto. Esto se hará en el capitulo 5 resolviendo el problema de los valores característicos.
VECTORES EN EL PLANO Y EN EL ESPACIO
Tabla 2.3.2
165
MATRICES M PARA LAS FUNCIONES
Proyección sobre el eje x, eje y, eje z, respectivamente
Proyección sobre el plano xy, plano plano xz yz, respectivamente
Rotación antihoraria con z fija
Dilatación Identidad Contracción Función cero
PROBLEMAS 2.3
1. Resuélvase el PAG para las funciones siguientes:
2. Resuélvase el PAG para las funciones siguientes:
3. Resuélvase el PAG para las funciones siguientes:
4. Resuélvase el PAG para las funciones siguientes:
166
ÁLGEBRA LINEAL CON APLICACIONES
5. Para funciones lineales de la forma
para las cuales
existe, se dice que f es invertible y que
es la función inversa de f. Muéstrese que a) la inversa de la dilatación es la contracción, b) la inversa de la rotación por un ángulo es la rotación por un ángulo y c) que la proyección sobre el eje x no es invertible. 6. Muéstrese geométricamente que
representa una reflexión con respecto al eje y. ¿Qué representa
7. Analícese
aun cuando no sea una función lineal. (Sugerencia: considérense casos tales como etcétera. ¿Es f "lineal por tramos"?) 8. Analícese
aun cuando no sea una función lineal. (Sugerencia: investíguese cuál es la acción de f sobre círculos de radios diferentes.)
VECTORES EN EL PLANO Y EN EL ESPACIO
167
2.4 APLICACIONES A LA GEOMETRÍA ANALÍTICA Los vectores pueden emplearse para deducir las ecuaciones de rectas y planos en el espacio tridimensional. Además, los vectores también pueden facilitar la solución de algunos problemas geométricos. Si se piensa que la parte superior de un escritorio es un plano y se coloca verticalmente un lápiz (sin punta) sobre él, entonces el lápiz apunta en una dirección perpendicular a cualquiera de las rectas que se puedan trazar sobre el escritorio (véase la figura 2.4.1). Un vector de este tipo recibe el nombre de vector normal. D E F I N I C I Ó N
2.4.1
Un vector N que es perpendicular a todos los vectores en un plano P se llama vector normal al plano. Se dice que un vector normal a un plano es perpendicular a él. Un plano se puede especificar dando una normal al plano y un punto sobre el plano. Esto se asemeja al caso de las rectas en un plano, para las cuales dos cantidades especifican o caracterizan a una recta: la pendiente y un punto. En el espacio tridimensional el vector normal tiene la función de la pendiente en el espacio bidimensional. Debe quedar claro que dos planos son paralelos, si sus normales son paralelas. el punto sobre Para hallar la ecuación de un plano la normal al plano. Si (x, y, z) es cualquier otro punto sobre P (véaestá sobre se la figura 2.4.2), entonces el vector ya que N es perpendicular a todos los vectores sobre P. Al desarrollar el producto punto se tiene
Figura 2.4.1 Un lápiz como un vector normal.
Figura 2.4.2 Vector normal.
168
ALGEBRA LINEAL CON APLICACIONES
Por tanto,
Una ecuación del plano que contenga a
con normal (a, b, c) es
Esta forma de la ecuación se llama forma punto-normal, ya que aparecen explícitamente las coordenadas del punto y las componentes de la normal. La ecuación
recibe el nombre de forma vectorial de la ecuación para el plano.
EJEMPLO
1
Solución
Hállese la forma punto-normal de la ecuación para el plano que pasa por (1, — 2, 4) y que tiene el vector normal (2, 3, — 1).
La forma vectorial es
Desarrollando el producto punto, se halla que
EJEMPLO
2
Un plano P tiene la ecuación
Hállense un vector normal a P y un punto sobre P. Solución
Como la ecuación está en la forma punto-normal, la información pedida se lee directamente:
La ecuación hallada en el ejemplo 1 podría simplificarse a
169
VECTORES EN EL PLANO Y EN EL ESPACIO
Esta ecuación tiene la forma general
El vector normal puede leerse directamente aun de la forma general. Como la ecuación es lineal, un plano recibe el nombre de estructura lineal en el espacio tridimensional. EJEMPLO
3
Un plano P tiene la ecuación
Hállese un vector normal y dos puntos sobre el plano. Solución
Una normal es (2, -3, 4). Cualquier múltiplo diferente de cero de este vector es también una normal. Para hallar puntos sobre el plano, hay que obtener valores para x, y y z que satisfagan la ecuación. Con este fin pueden darse valores a dos de las variables y despejar la tercera. Si se toma x = 2 y y = 0, se obtiene z = — 4, por lo que (2, 0, —4) está sobre el plano. Si se supone y = 0, z = 0, entonces x = -6 y se obtiene ( — 6, 0, 0) como otro punto sobre el A veces puede emplearse el producto cruz para hallar una normal.
EJEMPLO
4
Solución
Un plano P contiene los puntos Hállense un vector normal a y una ecuación para P. Restando puntos se obtienen como vectores en P los siguientes: (0, -3, 4) — es perpendicular a 2.4.3). Se tiene
Una ecuación vectorial es
que es equivalente a
o bien
y por tanto es normal a P (véase la figura
ÁLGEBRA LINEAL CON APLICACIONES
170
Figura 2.4.3
A x B como un vector normal.
Figura 2.4.4 Recta en el espacio.
Una línea recta (o simplemente una recta) que pasa por el punto es el conjunto de todos los puntos (x, y, z) tales que el vector que va de es un múltiplo de un vector dado V (véase la figura 2.4.4.). De la figura 2.4.4 se ve que
donde k puede tomar cualquier valor real y esto significa que (ecuaciones paramétricas) o lo que es lo mismo,
(excepto si cualquiera a, b o c vale cero).
EJEMPLO
5
Hállense las ecuaciones de la recta que pasa por (1, - 1, 2) y (7, 0, 5). ¿Está (-5, -2, -1) sobre está recta? ¿Y el punto ( 1 3 , 1, 14)?
VECTORES EN EL PLANO Y EN EL ESPACIO
Solución
171
Se tiene un punto (de hecho, dos) y se necesita un vector en la dirección de la recta. Para ello es bueno un vector sobre la recta. En consecuencia, se restan los dos puntos para obtener
Usando (1, — 1 , 2 ) como punto sobre la recta se ve que
es una ecuación vectorial para la recta. Las ecuaciones paramétricas son
Para saber si (-5, -2, - 1) está sobre la recta, se trata de hallar un valor de k (el parámetro) que dé x = -5, y = -2, z = - 1. Empleando las últimas ecuaciones, se trata de resolver
La primera ecuación da k = - 1. Éste es el mismo valor de k que se obtiene de la segunda y la tercera ecuaciones, por lo que puede concluirse que ( — 5, —2, — 1) está sobre la recta. Finalmente se analiza el punto (13, 1, 14). En este caso se tiene
y la primera ecuación implica que k = 2. Este valor de k satisface la segunda ecuación pero no así la tercera. Por tanto, (13, 1, 14) no está sobre la recta. La intersección de planos genera rectas. En general, dos planos pueden intersecarse a lo largo de una línea recta, no intersecarse o bien pueden ser el mismo plano. E J E MP LO
6
Solución
Determínese la recta de intersección de Las ecuaciones se resuelven simultáneamente:
ÁLGEBRA LINEAL CON APLICACIONES
172
Se tienen dos ecuaciones con tres incógnitas. Sea z = t, de tal modo que
En consecuencia, las ecuaciones paramétricas de la recta de intersección son
EJEMPLO 7 Muéstrese que los planos
no se interse-
can. Solución
De nuevo se resuelven las ecuaciones simultáneamente:
Como el sistema reducido es inconsistente, no hay puntos que se encuentren en ambos planos (son paralelos, ya que sus normales apuntan en la misma dirección) y, por tanto, no hay una recta de intersección de estos planos.
Nótese que, si en el ejemplo 7 el segundo plano hubiese tenido la ecuación
entonces los planos habrían sido no sólo paralelos sino incluso coincidentes y no habría una solución única para la recta de intersección. El empleo de los vectores en el estudio de la geometría analítica es un método muy eficaz. Los lectores interesados podrán hallar información adicional en textos sobre geometría vectorial.
PROLEMAS 2.4
1. Hállense las formas vectorial y general de las ecuaciones de los planos dados. Dibújense los planos. a) Punto: ( 1 , -2, 1), normal: (1, 2, 3) b) Punto: (0, 0, 0), normal: (3, -1, 0)
VECTORES EN EL PLANO Y EN EL ESPACIO
173
c) Punto: (-2, -3, 4), normal: (1, 0, 0) d) Punto: (1, 0, 0), normal: (-1, -1, -1) 2. En los planos dados a continuación obténganse un vector normal al plano, una normal unitaria al plano y dos puntos sobre el plano. Dibújese el plano.
3. Se dan tres puntos. Hállense formas vectoriales y formas generales para las ecuaciones de los planos que pasan por los puntos dados. Dibújense los planos.
4. Escríbanse las ecuaciones de la recta que es paralela a V y que pasa por el punto P. Dibújese la recta.
5. Escríbanse ecuaciones de las rectas que pasan por los puntos dados. Dibújense las rectas.
6. Sea I la recta que pasa por (1, - 1, 4) y (2, 4, -2). ¿Cuáles de los puntos siguientes se hallan sobre I?
7. Escríbanse ecuaciones para los planos (especiales): los planos xy, xz y yz. 8. Determínese si los siguientes pares de planos se intersecan. Si así ocurre y no son el mismo plano, hállese una ecuación para la recta de intersección. Dibújense los planos.
ÁLGEBRA LINEAL CON APLICACIONES
174
9. Muéstrese que la recta
es paralela a
mostrando a) que la normal al plano es perpendicular a la recta y b) que los puntos de la forma ( I ) no satisfacen a la ecuación (2) para ninguna t. 10. Muéstrese que la recta
interseca el plano
sustituyendo las expresiones de (3) y (4) y despejando t. Determínense los puntos de intersección. Dibújense la recta y el plano.
RESUMEN
Se han repasado y se ha reafirmado el conocimiento que el lector tiene del análisis vectorial elemental; también se ha introducido la idea de una función lineal generada por una matriz. Se dieron definiciones analíticas, así como una interpretación geométrica, de la suma y diferencia de vectores. Se desarrolló el producto punto y la idea asociada de la perpendicularidad. En el espacio y en el plano, se tiene a la geometría para reforzar los resultados analíticos acerca de rectas, planos y funciones lineales. En el primer párrafo del capítulo se hace la observación de que es necesario abandonar esta posición agradable y hacer la transición a dimensiones más altas. Aunque con la nueva situación se pierde algo de visión geométrica y lo que se ganan son problemas, las aplicaciones son ricas y significativas. El punto de partida en el capítulo 3 se halla en la generalización de nuestras ideas sobre los vectores bidimensionales y tridimensionales. Esto nos dará nuevos dominios para las funciones lineales de las matemáticas aplicadas.
VECTORES EN EL PLANO Y EN EL ESPACIO
175
Se expuso la idea del análisis geométrico de una función lineal, y se dieron ejemplos. La idea de estudiar geométricamente las funciones no es nueva para el lector; desde los cursos de álgebra en preparatoria se aprende a graficar funciones con dominio o imagen sobre los números reales. Una gráfica es simplemente una representación geométrica de una función. En este capítulo no se "graficaron" las funciones lineales en los ejemplos. En vez de eso, se describió su acción en términos de operaciones geométricas definidas. Siempre que se esté trabajando en el plano o en el espacio tridimensional, las ideas de proyección, rotación, dilatación, contracción y reflexión tendrán un significado geométrico y visual definido. Cuando se trabaje con las dimensiones más altas mencionadas antes, aún podrán utilizarse los conceptos de proyección, dilatación, etc., a pesar de que ya no sea posible "ver" lo que está sucediendo (en cinco dimensiones, por ejemplo). Por ello es importante desarrollar las herramientas necesarias para estudiar las nociones extendidas de proyecciones, dilataciones, etc.
PROBLEMAS ADICIONALES
1. Considérese el diagrama de fuerzas coplanares aplicadas en el origen en la figura AP2.1. Como las fuerzas están en equilibrio, A + B + C = 0. Calcúlese el vector C.
Figura AP2.1
2. Si dos fuerzas coplanares actúan sobre un punto en el plano, ¿es siempre posible añadir una tercera fuerza para crear el equilibrio? Es decir, ¿es siempre posible hacer que el vector resultante sea cero? 3. El principio de un sube y baja es, según se ve en la figura AP2.2, que éste Este principio se aplica también a los pesos se equilibrará si suspendidos que se ven en la figura AP2.3: estarán equilibrados si En el sistema (más complicado) de pesos suspendidos de la figura AP2.4, las ecuaciones de equilibrio, por el mismo principio, son
176
ÁLGEBRA LINEAL CON APLICACIONES
Figura AP2.2
Figura AP2.3
Figura AP2.4 Reescríbanse las ecuaciones como un sistema homogéneo. Resuélvase el sistema. ¿Qué puede decirse sobre la elección de los pesos para hacer que el sistema físico se equilibre? 4. Con respecto a los pesos suspendidos del problema 3, supóngase que 5 lb. ¿Cuáles serían los valores de 5. Para el sistema de pesos en la figura AP2.5, las ecuaciones de equilibrio son
VECTORES EN EL PLANO Y EN EL ESPACIO
177
Figura AP2.5
¿Qué valor de k garantiza una solución no trivial y, por tanto, un conjunto de pesos que equilibren al sistema? 6. Muéstrese que si se duplica cada una de las fuerzas coplanares que actúan en un punto, entonces la resultante también se duplica. Empléese una matriz para representar la dilatación. 7. Muéstrese que si cada una de las componentes de fuerzas coplanares que actúan sobre un punto se gira por un ángulo 0, entonces la resultante se gira por el mismo ángulo. 8. Muéstrese que si cada una de las fuerzas coplanares que actúan en un punto se refleja con respecto al eje x, entonces la resultante también se refleja con respecto al eje x. 9. Muéstrese que si se contrae (es decir, se multiplica por k, 0 0 y, por tanto, 5. Ley asociativa para la multiplicación escalar. Sean Entonces
Por las leyes de los exponentes,
Entonces
6,7. Leyes distributivas. Sean
8. Sea
En consecuencia,
Entonces
Por lo anterior, V con las operaciones definidas es un espacio vectorial.
EJE MPLO8
Sea
y sean la suma y la multiplicación escalar definidas
como sigue: 1. Adición. Sean
entonces
ÁLGEBRA LINEAL CON APLICACIONES
192
2. Multiplicación escalar. Sean
Se define
Muéstrese que V no es un espacio vectorial. Solución
EJEMPLO9
Para mostrar que la estructura no es un espacio vectorial, lo único que hay que hacer es demostrar que no se cumple por lo menos uno de los axiomas. En este caso no se cumple la multiplicación escalar, ya que si r < 0, rx = r.x < 0 y De nuevo se ve que la validez de los axiomas depende de V v de las operaciones. Considerando el aparato masa-resorte de la figura 3.2.1 y el análisis relacionado con él,
con la definición usual de la adición y multiplicación de funciones en un espacio vectorial. Solución
Cerradura. Sea tiene
que están en V. Las propiedades conmutativa y asociativa se cumplen. El vector cero es 0 cos wt + 0 sen wt, que es la función idénticamente cero. El inverso aditivo de f es
Se deja al lector la comprobación de las otras propiedades. Espacios vectoriales complejos Si en la definición de espacio vectorial real se sustituyen números reales por números complejos, se tiene la definición de un espacio vectorial complejo. Los espacios vectoriales complejos más empleados en este texto son los cuales se definen a continuación
D E F I N I C I Ó N 3.2.2
es el espacio vectorial que consiste en las encadas El espacio vectorial de números complejos, con las operaciones
ESPACIOS VECTORIALES
donde complejo.
D E F I N I C I ÓN 3.2.3
193
es una eneada compleja y c es cualquier número
es el espacio vectorial complejo de las matrices de m x n cuyos elementos son números complejos, junto con las operaciones matriciales usuales de suma y multiplicación escalar. Los vectores cero para son, respectivamente, los mismos que los vectores cero para como se puede comprobar directamente. En lo que resta del texto, el término espacio vectorial se referirá al espacio vectorial real, a menos que se esté trabajando específicamente con un espacio vectorial complejo. Cuando se trabaja con espacios vectoriales complejos, es importante recordar que los vectores pueden construirse usando números complejos y que los escalares de la multiplicación escalar pueden ser cualquier número complejo.
E J E M P L O 10
Solución
P R O B L E M A S 3.2
Sea V = {matrices hermitianas de n x n }, con las operaciones matriciales ordinarias. ¿Es V un espacio vectorial? Como no hay restricción sobre los elementos de las matrices, lo que se quiere verificar es si V junto con estas operaciones es un espacio vectorial complejo. Recuérdese que los elementos de la diagonal principal de una matriz hermitiana son números reales. Por ello, en general si A es hermitiana, el múltiplo escalar iA no es hermitiano. Por tanto, V es cerrado ante la multiplicación escalar y no es un espacio vectorial.
En los problemas del 1 al 20 se dan un conjunto V y las operaciones de multiplicación escalar y suma vectorial. Determínese si V es un espacio vectorial. Si V no es un espacio vectorial, menciónese uno de los axiomas que no se cumplen. En un problema dado, si los objetos en V se pueden construir empleando los números complejos, el problema consiste en determinar si V es un espacio vectorial complejo. 1. Sea V= {ternas ordenadas
las operaciones como en
2. Sea V = {ternas ordenadas
las operaciones como en
3. Sea V = {pares ordenados
con los operaciones
4. Sea V = {pares ordenados
con las operaciones
194
ÁLGEBRA LINEAL CON APLICACIONES
5. Sea
con las operaciones ordinarias de la suma y la multiplicación
6. Sea V = {matrices de n x n con elementos reales positivos} con las operaciones matriciales ordinarias. 7. Sea V = {matrices simétricas reales de n x n} con las operaciones matriciales usuales. 8. Sea V = {matrices antisimétricas reales de n x n} con las operaciones matriciales usuales. 9. Sea V = {matrices triangulares superiores de n x n } con las operaciones matriciales ordinarias. 10. Sea V = {matrices diagonales de n x n} con las operaciones matriciales ordinarias. 11. Sea V = {funciones definidas para toda xen ciones
con f(0) = 0} con las opera-
12. Sea V = {funciones definidas para toda x, con ciones definidas como en el problema anterior.
con las opera-
13. Ses V = {matrices no singulares de n x n} con las operaciones matriciales usuales. 14. Sea V = {matrices singulares de n x n} con las operaciones matriciales ordinarias. 15. Sea V = {matrices nilpotentes de n x n} con las operaciones matriciales usuales. 16. Sea V = {matrices idempotentes de n x n} con las operaciones matriciales usuales. 17. Sea V = {matrices A de n x n tales que ciales usuales.
con las operaciones matri-
18. Sea V = {funciones de valor real definido sobre x}, con las operaciones ordinarias.
para toda
19. Sea V como en el problema 18, pero con las operaciones siendo r un número real. 20. Sea V = {matrices de n x n con la suma de los elementos de la diagonal principal igual a cero} con las operaciones matriciales ordinarias. 21. Sea C una matriz constante de n x n. Sea Con las operaciones matriciales usuales, ¿es V un espacio vectorial? 22. Demuéstrese que en un espacio vectorial real V, para iodo (Sugerencia: cópiese la demostración del teorema 3.2.2.)
ESPACIOS VECTORIALES
195
23. Demuéstrese que en un espacio vectorial real para todo (Sugerencia: cópiese la demostración del teorema 3.2.2.) 24. Demuéstrese que en un espacio vectorial real entonces 25. Sea V = {Z} (un conjunto que contiene sólo un elemento) y defínase
¿Es V un espacio vectorial real? 26. Resuélvase el problema 25 con la segunda operación definida como para todo ¿Es V un espacio vectorial complejo? (Compruébense los axiomas de espacio vectorial.) 27. En la lista de propiedades de las operaciones de un espacio vectorial, ¿podría invertirse el orden de 3 y 4? Expliqúese. 28. Sea
con las operaciones ¿Se
satisfacen los axiomas de cerradura? ¿Es V un espacio vectorial real?
3.3 EL PROBLEMA DEL SUBESPACIO En ciertas aplicaciones es necesario emplear subconjuntos de espacios vectoriales, siendo los subconjuntos a su vez espacios vectoriales Al final de esta sección se verá un ejemplo tomado de la teoría de códigos. Otro ejemplo es el de todas las matrices simétricas de n X n (empleadas en probleconjunto mas de mínimos cuadrados; véase el apéndice III) con las operaciones matries un espacio vectorial ciales ordinarias, el cual es un subconjunto de es un subes(véase el problema 7 de la sección 3.2). En ese caso se dice que pacio de D E F I N I C I Ó N 3.3.1
Sea V un espacio vectorial real o complejo, y sea W un subconjunto de V, teniendo W las mismas operaciones que V. Se dice entonces que W es un subespacio de V si W con las mismas operaciones es un espacio vectorial. Dado un subconjunto de un espacio vectorial real o complejo, a menudo es necesario saber si ese subconjunto es un subespacio. Se tiene lo siguiente. Problemas del subespacio. Dado un subconjunto W de un espacio vectorial V, teniendo W las mismas operaciones que V, determinar si W es un subespacio de V.
196
ALGEBRA LINEAL CON APLICACIONES
E J E M P L O 1
Solución
Sea V pació para V y W.
Resuélvase el problema del subes-
Por su definición W es un subconjunto de V; debe determinarse si W con las operaciones heredadas de E? es un espacio vectorial. Cerradura. Sean Se verificará si Se tiene
Como la tercera componente es cero, lar
Para la multiplicación esca-
y como la tercera componente es 1. Conmutatividad de la adición. Sean
Entonces
2. Asociatividad de la adición. Ésta es similar a 1; véanse los problemas. 3. Existencia del cero. Sea hay que ver si hay algún vector en W que actúe como una identidad aditiva. Como (0, 0, 0) (la última componente es cero) y (0, 0, 0) actúa como el cero para W. 4. Inverso aditivo. Sea
se sabe entonces que
Como
está también en W y
está en W.
5-8. Éstas son directas y se dejan como ejercicios.
Un examen detenido del ejemplo 1 mostrará que la mayor parte de los axiomas se cumplen "por herencia". Por ejemplo, al demostrar que x + y = y + x, el hecho de que x y y fuesen elementos de W no era lo importante; dado que son elementos de V y la conmutatividad se cumple para cualquier x y y elementos de V, la conmutatividad es válida en cualquier subconjunto de V. En consecuencias, son las propiedades de la cerradura y la existencia del cero y del inverso aditivo en W lo que debe comprobarse. Sin embargo, puede demostrarse que la cerradura implica la existencia del cero y del inverso aditivo en W.
T E O R E M A 3.3.1
Sea V un espacio vectorial real y sea W un subconjunto no vacío de V. Entonces W es un subespacio de V si y sólo si 1) x, y en W implica que x + y está y x en W implica que rx está en W. W y 2) r en
ESPACIOS VECTORIALES
197
En este teorema se halla la solución al problema del subespacio. Debe recalcarse que el teorema es válido para espacios vectoriales complejos reemplazando por Antes de demostrar este teorema, se darán algunos ejemplos.
EJEMPLO2
, donde a y b pueden ser dos números reales cualesquiera. ¿Es W un subespacio de V?
Sea
Solución Sean
y considérese
Se tiene
Por tanto, x + y está en la forma de un elemento de W; es decir, Considérese ahora 3). Entonces y por el teorema 3.3.1, W es un subespacio de V. E J E M P LO 3
Sean
y considérese
La última componente de no es igual a 1; así, cia, W no es un subespacio de V. EJEMPLO4
Solución
Sea
matrices hermitianas de
y en consecuen-
¿Es W un subespacio de
Conforme a la solución del ejemplo 10 de la sección 3.2, se sabe que si A es hermitiana entonces iA no es necesariamente hermitiana. Por ejemplo,
es hermitiana, pero
no lo es. Por tanto, W no es cerrado ante la multiplicación escalar y no es un subespacio de Demostración del teorema 3.3.1
Éste es un teorema "si y sólo si": p es válida si y sólo si q es válida. Para demostrarlo, hay que probar dos cosas: 1. Si p es válida, entonces q es válida. 2. Si q es válida, entonces p es válida.
ÁLGEBRA LINEAL CON APLICACIONES
198
Primera parte. Si W es un subespacio, entonces para todo Si W es un subespacio de V, entonces W es un espacio vectorial y todos los axiomas se cumplen. En particular, se cumple la cerradura. En consecuencia r por la cerradura para la multiplicación escalar, por la cerradura para la suma vectorial. para todo Segunda parte. Si entonces W es un subespacio de V. Hay que comprobar todos los axiomas de espacio vectorial para W tenienpara todo do en cuenta todo el tiempo la hipótesis de que Tal como se dijo antes, todos los axiomas son válidos por herencia, excepto los relativos a la cerradura, el cero y el inverso aditivo. La cerradura consiste simplemente en reenunciar la hipótesis para este teoreasí que ma. Sea Pero por hipótesis,
Por tanto, (Obsérvese que como el teorema 3.2.2 es válido para cualquier espacio vectorial, puede aplicarse a W.) Para demostrar que los inversos aditivos están en Se tiene
Por tanto, los inversos aditivos están en W.
EJEMPLO5
Sea V un espacio vectorial cualquiera. Entonces V mismo es un subespacio.
EJEMPLO6
Sea V un espacio vectorial cualquiera, y Entonces W es un subespacio porque para r real o complejo. Como cualquier espacio vectorial V tiene a V y como subespacios, éstos reciben el nombre de subespacios triviales de V. Los demás subespacios de V se llaman subespacios propios o subespacios no triviales de V.
EJEMPLO7
de tal forma que x y y esEn el caso real: sean donde pueden ser dos números retén en V. Sea W ales o complejos cualesquiera). Muéstrese que W es un subespacio de V.
199
ESPACIOS VECTORIALES
Solución
de tal forma que x y y es-
En el caso real: sean x ten en W. Considérense
La cerradura para la multiplicación escalar es parecida. Por el teorema 3.3.1, W es un subespacio de V. E J E M P L O 8
Sea
bespacio de EJEMPLO9
Sea
tiene componentes puramente imaginarias). V no es un suya que el cual no está en ¡matrices invertibles de 2 x 2). Determínese si W es un
subespacio de Solución 1 Si W fuese un subespacio,
tendría que estar en W. Pero
no es invertible y no puede estar en W. Por tanto, W no es un subespacio. Solución 2
Sean
invertibles, y considérese
la cual es invertible si sólo si su determinante es diferente de cero, es decir, si y sólo si
No es evidente que la suma en el lado izquierdo sea diferente de cero. Esta solución muestra que comprobar x + y puede ser tedioso. En este caso es preferible la primera solución.
200 '
ALGEBRA LINEAL CON APLICACIONES
E J E M P L O 10
Solución
Sea
Muéstrese que el conjunto es un subespacio de
de todas las soluciones de
Sean soluciones de la ecuación homogénea Para comprobar las cerraduras, sea y calcúlese
En consecuencia U + V y rU son soluciones en W; W es un subespacio.
E J E M P L O 11
Solución
definido por Sea W el subconjunto de ¿Es W un subespacio de (Nótese que W no es porque los "escalares" para la multiplicación escalar se toman ahora de Primero se verifica la cerradura para la adición. Supóngase que Y y Z están en W. Se tiene
por lo que W es cerrado ante la adición. Ahora se verifica la multiplicación tomando Debe verse si Como Se tiene que a menos que c sea real, la cerradura no se cumple y W no es un subespacio. La idea de subespacio tiene aplicaciones importantes. De hecho, los subespacios se emplean para definir ciertos conceptos en la teoría de códigos.
E J E M P L O 12
Tabla 3.3.1
(Códigos lineales) Este ejemplo se refiere a un espacio vectorial poco común en el cual los subespacios tienen aplicaciones en la teoría de códigos. Primero, considérese F = {0, 1} con las operaciones de adición y multiplicación das como en los reales, excepto que se define 1 + 1 = 0 (véase la tabla 3.3.1). El conjunto F junto con estas operaciones recibe el nombre de cuerpo conmutativo. Esto significa solamente que posee las propiedades del sistema de los números reales. Para el espacio vectorial sea Fn el conjunto de eneadas de elementos de F con las operaciones
201
ESPACIOS VECTORIALES
Nótese que y r pueden asumir solamente los valores 0 o 1. Fn con estas operaciones es un espacio vectorial. ¿Cómo se emplea en la teoría de códigos? Pues bien, en este caso se tiene lo que se llama canal binario, ya que las compo nentes de los vectores en Fn pueden escogerse de un conjunto con únicamente dos símbolos. Un subconjunto de Fn se llama código lineal si y sólo si es un subespacio de Fn. Por ejemplo, F3 contiene ocho vectores posibles. El subconjunto V = {(0, 0, 0), (1, 0, 0)} es un código lineal porque tiene la cerradura: sólo es necesario comprobar todas las sumas y productos escalares posibles. Obsérvese que (1, 0, 0) + (1, 0, 0) = (0, 0, 0).
P R O B L E M A 3.3
En los problemas del 1 al 14 se dan un espacio V y un subconjunto W. Determínese si W es un subespacio. con elementos no negativos}. {matrices simétricas de n x n}. (La traza de una matriz A de n x n se define como son constantes}. {matrices no invertibles}.
es perpendicular a (a, b, c)\ {matrices d e n x n con elementos reales} {eneadas con elementos reales}
Considérese el sistema de ecuaciones AX = 0, donde A está en Muéstrese que el conjunto de todas las soluciones de AX = 0 es un espacio vectorial bajo las operaciones usuales. en el sistema de ecuaciones AX - B donde A es de n x n, Si muéstrese que el conjunto de soluciones no puede ser un espacio vectorial, con las operaciones matriciales ordinarias.
202
ALGEBRA LINEAL CON APLICACIONES
17. Sean A y B matrices cuadradas. Muéstrese que tr (A + B) - tr A + trfí, tr (rA) = /-(tr A), tr (AB) = tr (BA). (Véase el problema 3 para la definición de tr A.) 18. Usando la terminología del ejemplo 12, muéstrese que
es un código lineal. 19. Supóngase que V = E2, el cual puede asociarse con el plano. Muéstrese es un subespacio de V. Muéstrese asimismo que que no es un subespacio de V. Esto hace ver que si una línea recta va a representar a un subespacio del plano, entonces la recta debe pasar por el origen. Muéstrese que 20. Sea es un subespacio de V si y sólo si d = 0. Esto hace ver que si un plano va a representar a un subespacio de E3, entonces el plano debe pasar por el origen. 21. Sea
Muéstrese que es un subespacio propio de V si y sólo si existe una T tal que Esto hace ver que una línea representa a un subespacio del espacio tridimensional si y sólo si la línea recta pasa por el origen.
22. Complétense los detalles para la solución del ejemplo 1.
3.4 CONJUNTOS DE VECTORES LINEALMENTE INDEPENDIENTES La ecuación tiene la solución general donde r y s son dos números cualesquiera. Toda solución puede escribirse en términos de los vectores (1, 0, 1) y ( — 2, 1, 0) de E3 como
Es decir, puede construirse un número infinito de soluciones en términos de sólo dos vectores, y el análisis de las soluciones puede efectuarse estudiando únicamente estos dos vectores. Para poder aplicar métodos de análisis similares en los espacios vectoriales, se necesitan los conceptos de conjuntos de vectores generadores e independencia lineal. En ambos conceptos aparecen las combinaciones lineales de vectores.
203
ESPACIOS VECTORIALES
D E F I N I C I Ó N 3.4.1
Sean al de los vectores
vectores en un espacio vectorial V. Una combinación linees cualquier adición de la forma
donde los números
E J E M P L O 1
Solución
son los coeficientes de la combinación lineal.
Fórmense cinco combinaciones lineales de los vectores (1, - 1), (1, 2) y (3, 0) enE 2 . Cinco posibilidades son
Obsérvese que la primera y la última combinaciones dan el mismo vector (0, 0), a pesar de que los coeficientes no son mismos. Las últimas cuatro combinaciones lineales se llaman no triviales, ya que en cada una de ellas hay por lo menos un coeficiente que es diferente de cero.
E J E M P L O 2
Exprésese (7, - 2, 2) en E3 como una combinación lineal de (1, — 1, 0), (0, 1, 1) y (2, 0, 1 ).
Solución Se desean hallar
tales que
es decir,
lo cual da las ecuaciones
La solución es
por lo que
ALGEBRA LINEAL CON APLICACIONES
204
EJEMPLO3
Solución
¿Es posible escribir (3, — 1, 4) como una combinación lineal de (1, - 1, 0) y (3, -5, -2)? Hay que investigar si la ecuación
tiene una solución. Esto es equivalente a
En forma reducida, esto es
y no existe solución. Por tanto, (3, — 1, 4) no puede escribirse como una combinación lineal de los vectores dados.
D E F I N I C I Ó N 3.4.2
Sea cio generado por neales posibles de
un conjunto de vectores en el espacio vectorial V. El espaes el conjunto de todas las combinaciones liLa notación es gen
El espacio generado por un conjunto de vectores de V es;de hecho, un subespacio de V.
I Y . O K Y . M A 3 .4 .1
Si un subespacio de V.
siendo V un espacio vectorial, entonces gen
Demostración Supóngase que x y y están en gen les:
1
es
Entonces x y y son combinaciones linea-
El enunciado del teorema se refiere a cualquier espacio vectorial. En el caso real los escalares provienen de en el caso complejo, de
ESPACIOS VECTORIALES
205
Entonces
que también se encuentra en gen , Por tanto, gen Se le llama subespacio de V generado por
es un subespacio de V.
EJEMPLO4
El ejemplo 2 se podría haber enunciado también como: demuéstrese que (7, 2, 2) se halla en gen {(1, — 1, 0), (0, 1, 1, 1), (2, 0, 1)}. La solución sería exactamente la misma.
E J E M P L O 5
El ejemplo 3 podría haberse enunciado también así: ¿está (3, — 1, 4) en gen {(1, — 1, 0), (0, 1, 1), (3, —5, -2)}? La solución sería exactamente la misma. La respuesta es que (3, - 1, 4) no está es gen {( l , — 1, 0), (0, 1, 1), (3, -5, — 2)}.
EJEMPLO6
Ya se ha visto que las soluciones de x + 2y — z = 0 pueden escribirse como
para todos los números complejos s y r. Otra manera de decir esto es que todas las soluciones forman el subespacio gen {(1, 0, 1), (-2, 1, 0)}. En algunos casos, gen
pueden ser todo V.
Entonces gen el cual es un conjunto de vectores en son números reales culesquiera}. Así, gen S donde
E J E M P L O 7
Sea
E J E M P L O 8
Supóngase que S = {(1, 0, 0, 0), (0, 1,0, 0), (0,0, 1,0), (0,0,0,1)} S es todo E 4 , ya que gen S consta de todos los vectores de la forma
donde
EJEMPLO 9
Solución
Gen
pueden ser números reales cualesquiera.
Muéstrese que gen {(1, 0, 1), ( - 1 , 2 ,
3), (0, 1, - 1)} es todo E 3
Debe demostrarse que cualquier vector (a, b, c) en E3 se puede expresar como una combinación lineal de los tres vectores dados. Es decir, debe mostrarse tales que que existen constantes
ÁLGEBRA LINEAL CON APLICACIONES
206
independientemente de los valores reales que puedan tomar a, b y c. La última ecuación es equivalente a
que tiene la solución
Por tanto, (a ,b, c,) rardo es todo E3.
E J E M P L O 10
Solución
gen {(1,0, 1), ( - 1 , 2 , 3), (0, 1, - l ) } y el espacio gene-
Determínese si gen {(1, -1, 0), (0, 1, 1), (3, - 5 , -2)} es todo E 3 . Sea (a, b, c) un vectror cualquiera en E3. Se desea saber si es posible escribir
La última ecuación es equivalente a
la cual se reduce a
En consecuencia, hay una solución sólo si c — a — b = 0; pero esto impone una restricción a (a, b, c) y, por tanto, la primera de las ecuaciones no se puede resolver para un vector arbitrario (a, b, c). Esto quiere decir que el espacio generado por los vectores dados no es todo E 3 . La pregunta hecha en el ejemplo 10 se puede plantear de manera un poco diferente.
ESPACIOS VECTORIALES
E J E M P L O 11
Solución
207
Descríbase gen S, donde S = {( 1 , - 1 , 0), (0, 1, 1), (3, -5, -2)}. Supóngase que (a, b, c) está en gen S. Entonces la ecuación
debe poder resolverse. Trabajando como en el ejemplo 10, se concluye que c — a — b = 0. Por tanto, gen S = {(a, b, c ) \ c = a + b}. Es decir, el espacio generado por S consta de todos los vectores cuya tercera componente es la suma de las dos primeras. Así, por ejemplo, (1, 3, 5) gen S. gen S y (l, 3,4)
El espacio vectorial E2 es generado por S = {( l , 0), (0, 1)}. También puede ser generado por el conjunto mayor S' = {( l , 0), (0, 1), (1,1)}. Como se verá más adelante, E2 y funciones sobre E2 se pueden analizar usando conjuntos generadores; así, por razones de economía, lo que se desea es hallar los conjutos generadores más pequeños posibles para los espacios vectoriales. Para lograr esto, se requiere el concepto de independencia lineal.
D E F I N I C I Ó N 3.4.3
Un conjunto de vectores en un espacio vectorial V se llama linealmente independiente si única solución a la ecuación
Si este conjunto no es linealmente independiente, se dice que es linealmente dependiente.
es linealmente indePara determinar si un conjunto pendiente o linealmente dependiente, se necesita hallar la solución de
Si se descubre (al resolver en realidad el sistema resultante o mediante cualquiera otra técnica) que sólo existe la solución trivial entonces S es linealmente independiente. Sin embargo, si una o mas de las son diferentes de cero, el conjunto S es linealmente dependiente.
E J E M P L O 12
Solución
Determínese si S = {(1, 0), (0, 1)} es linealmente independiente. Considérese
ALGEBRA LINEAL CON APLICACIONES
208
Esta ecuación es equivalente a
que tiene como única solución pendiente.
E J E M P L O 13
Solución
¿Es
Por tanto, S es linealmente inde-
linealmente independiente?
Considérese
que es equivalente a
La solución de este sistema es se tiene una solución no trivial y S no es linealmente independiente, sino linealmente dependiente.
E J E M P L O 14
Solución
Determínese si
es linealmente independiente en
Considérese
Agrupando términos en el lado izquierdo, esta ecuación se puede reescribir como
Según el álgebra, un polinomio es idénticamente cero sólo cuando todos los coeficientes son cero. Por tanto,
cuya única solución es la trivial. Esto implica que S es linealmente independiente.
E J E M P L O 15
El conjunto es linealmente dependiente en cualquier espacio vectorial real o complejo, ya que tiene la solución no trivial
ESPACIOS VECTORIALES
209
Figura 3.4.1 Vectores en S = {(1, 0), (0, 1), (1, -1)} como combinaciones lineales de los demás.
La dependencia lineal de un conjunto de dos o más vectores significa que por lo menos uno de los vectores del conjunto se puede escribir como una combinación lineal de los otros. Recuérdense el ejemplo 13 y el conjunto S = {(1, 0), (0, 1), (1, - 1)}. En la figura 3.4.1 se ha mostrado geométricamente la dependencia de los vectores en 5. El siguiente es un enunciado general acerca de esta situación: T E O R E M A 3.4.2
Demostración
un conjunto de por lo menos dos vectores en un espacio vectorial V. Entonces S es linealmente dependiente si y sólo si uno de los vectores de S se puede expresar como una combinación lineal de los demás vectores. Sea
Si S es linealmente dependiente, entonces hay constantes algunas de las cuales son diferentes de cero, tales que
Supóngase que nación lineal. Entonces
es un coeficiente diferente de cero en la combi-
210
ALGEBRA LINEAL CON APLICACIONES
y como
es una combinación lineal de los demás vectores en S. Por tanto, Supóngase que Entonces, sumando (— 1) a ambos lados, se tiene
Como el coeficiente de vk es diferente de cero, el conjunto S es linealmente dependiente. E J E M P L O 16
Muéstrese que
es linealmente dependiente en combinación lineal de los demás. Solución
Escríbase uno de los vectores como una
Considérese
Esta ecuación es equivalente a
lo cual se reduce a
En consecuencia, es una solución, donde k es arbitrario. Por tanto, el conjunto S es linealmente dependiente. Eligiendo k = 1 se tiene
ESPACIOS VECTORIALES
211
y se puede escribir
Es evidente que también se podría escribir
o bien
Algunas propiedades geométricas de conjuntos generadores en E2 y E3 El espacio generado por un solo vector diferente de cero es una recta que contiene al origen. Gen {v} se compone de todos los múltiplos de v, es decir todos los vectores de posición en la misma dirección que v (véase la figura 3.4.2). Los puntos terminales de estos vectores forman la recta cuya ecuación vectorial es
El espacio generado por dos vectores independientes es un plano que contiene al origen. Para ver esto en E3, supóngase que v y w están dados por (a, b, c,) y (d, e, f), repectivamente. El plano que contiene v y w tiene el vector normal v x w y la ecuación vectorial
Si se calcula v x w y se escribe la ecuación vectorial, se halla
Figura 3.4.2
212
ALGEBRA LINEAL CON APLICACIONES
donde (x, y, z) es un vector sobre el plano. Pero, para que (x, y, z) sea una combinación lineal de v y w, debería tenerse
Este sistema se reduce a
que tiene una solución si y sólo si
la cual es válida si y sólo si la ecuación vectorial es válida. Por tanto, el espacio generado por dos vectores independientes es el plano contiene a esos vectores. Véase la figura 3.4.3. El espacio generado por tres vectores diferentes de cero en E3 puede ser una recta, un plano o todo E3, según sea el grado de dependencia de los tres vectores. Si los tres son múltiplos unos de otros, se tiene solamente una recta. son independientes pero el conjunto en su totaliSi dos de los vectores dad es linealmente dependiente, entonces es una combinación lineal de se halla sobre el plano definido por Es decir, los vectores son coplanares. Un ejemplo visual de esto son tres lápices puestos sobre una mesa, unidos por la parte de sus borradores. Si es linealmente independiente, entonces el espacio que generan es todo E3. Esto se puede verificar directamente en casos individuales; para hacer la demostración en el caso general se requieren los métodos de la sección siguiente. Las combinaciones lineales en los espacios vectoriales complejos tienen aplicaciones importantes, como se desprende de los ejemplos que siguen.
Figura 3.4.3
ESPACIOS VECTORIALES
E J E M P L O 17
213
El conjunto de las matrices de espín de Pauli, empleado en el estudio del espín del electrón en mecánica cuántica, es
Muéstrese que S es linealmente independiente en de esa independencia. Solución
Analícese la importancia
Considérese la ecuación
ya que el cero para
igual que para
es
La ecuación matricial da
que se reduce a
Además,
por lo que se tiene solamente la solución trivial, y S es un conjunto linealmente independiente. La importancia de la independencia estriba en el hecho de que ninguna de las matrices se puede expresar en términos de las otras; por tanto, el estudio del espín del electrón mediante las matrices de Pauli no puede, en general, efectuarse con un subconjunto propio de S.
214
ÁLGEBRA LINEAL CON APLICACIONES
E J E M P L O 18
Supóngase que
Muéstrese que genera a todo y que es linealmente independiente. Nótese que es el conjunto de las matrices de espín de Pauli más Solución
Considérese la ecuación
la cual es equivalente a
cuya solución es Por tanto, que, P R O B L E M A S 3.4
genera a Para la independencia, obsérvese se tiene sólo la solución trivial.
En los problemas del 1 al 9 se da un conjunto S de vectores en un espacio vectorial, a) Descríbase gen S (véase el ejemplo 11); b) determínese si S es linealmente independiente, y c) si S es linealmente dependiente, exprésese a uno de los vectores como una combinación lineal de los demás.
ESPACIOS VECTORIALES
215
10. ¿Cuáles de los conjuntos de vectores siguientes generan E3?
11. Muéstrese que un conjunto de dos vectores de E3 no puede generar a E3. 12. Escríbanse tres vectores dintintos de E2 y muéstrese que forzosamente son linealmente dependientes. 13. Muéstrese que, en general, tres vectores de E2 son linealmente dependientes siempre. 14. Muéstrese que cualquier conjunto S de vectores que contenga a mente dependiente.
es lineal-
15. Se dice que un polinomio es par si sus términos son constantes y constantes multiplicadas por potencias pares de x. Demuéstrese que gen se compone de todos los polinomios pares en 16. Se dice que un polinomio es impar si sus términos son solamente constantes multiplicadas por potencias impares de x. Muéstrese que gen consta de todos los polinomios impares en 17. El conjunto
es el conjunto de las matrices de espin de Pauli reales empleadas en el estudio del espín del electrón. Muéstrese que gen S es el conjunto de todas las matrices simétricas de 2 x 2 con traza cero. 18. Sea S un conjunto de vectores linealmente independientes tomados de un espacio V. Muéstrese que cualquier subconjunto de S es linealmente independiente. 19. Sea S un conjunto de vectores linealmente dependientes tomados de un eses un pacio vectorial V. Muéstrese que cualquier subconjunto T con conjunto linealmente dependiente. 20. Se dice que las matrices A y B anticonmutan si AB = —BA. Muéstrese que cualquier par de las matrices de espín de Pauli (véase el ejemplo 17) anticonmuta. 21. El conmutador de dos matrices cuadradas del mismo tamaño se define como AB — BA y se denota con [A, B]. Sean
Calcúlese
216
ALGEBRA LINEAL CON APLICACIONES
22. Para cualquier matriz cuadrada A, ¿a qué son iguales los conmutadores Si A es invertible, ¿a qué es igual [A, 23. Muéstrese que A y B conmutan para la multiplicación si y sólo si el conmutador de A y B es cero. 24. Muéstrese que, para matrices A, B y C de n x n y cualquier escalar r,
3.5 BASES DE ESPACIOS VECTORIALES; EL PROBLEMA DE LA BASE El conjunto de vectores S = ¡(1, 1), (1, - l ) j genera a E2. Es decir, cualquier vector en E2 es una combinación lineal de (1, 1), (1, — 1). El conjunto de vectores T = j ( l , 1), (1, — 1), (1, 0)j también genera E2. Los conjuntos S y T difieren en que S es linealmente independiente mientras T es linealmente dependiente. Esto hace que haya una diferencia al expresar un vector como una combinación lineal de los vectores de cada conjunto. Por ejemplo, al expresar (2, 4) en términos de los vectores en S, se tiene como única posibilidad
Sin embargo, en términos de los vectores de T, hay varias posibilidades:
O, en general,
La conclusión es: si un conjunto S de vectores genera V y S es linealmente dependiente, entonces la representación de un vector x en términos de los vectores en S no es única. Si se desea unicidad, el conjunto generador también deberá ser linealmente independiente. Un conjunto con esas características recibe
ESPACIOS VECTORIALES
217
el nombre de base para V. Las bases se emplean en la teoría de códigos, como se verá más adelante en esta sección. D E F I N I C I Ó N 3.5.1
Se dice que un espacio vectorial V está generado finitamente si existe un conjunto finito de vectores S = {v1, v2, . . . , vn} en V tal que gen S = V. Si el conjunto S es además linealmente independiente, entonces S es una base para V. Esta definición afirma lo siguiente: Un conjunto finito es una base para V si 1) genera a V y 2) es linealmente independiente.
EJEMPLO 1
Solución
S = 1(1, 2), (3, -1)| es una base de E2. Hay que demostrar que el conjunto es linealmente independiente y que genera a E2. Es decir, debe demostrarse que
tiene una solución para cualquier (a, b) y que
tiene solamente la solución tada son, respectivamente,
Estas ecuaciones en su forma aumen-
En vez de resolver los dos conjuntos de ecuaciones por separado, se resolverán los dos el mismo tiempo trabajando con la matriz aumentada doblemente
Haciendo esto, se halla que esta matriz se reduce a
218
ÁLGEBRA LINEAL CON APLICACIONES
para la inPara gen S se descubre que Como S es linealmente independependencia lineal se halla que diente y además genera a E2, es una base de E2.
En el ejemplo 1, los coeficientes en la combinación lineal de los elementos base son únicos para cualquier vector dado (a, b). Esto es cierto en general.
T E O REMA 3.5.1
una base para el espacio vectorial V, y sea v un elemento Sea de V. Los coeficientes en la representación
son únicos. Demostración
Supóngase que se tienen las dos representaciones
para v; se demostrará que los coeficientes son iguales. Para ello, formamos v + ( —v), que es igual a y se combinan los términos para obtener
Como S es una base, es un conjunto linealmente independiente. Por tanto, lodos los coeficientes de la última combinación lineal deben ser iguales a cero. Es decir, y las combinaciones lineales originales son las mismas.
E J E M P L O 2
Solución
Procediendo como en el ejemplo 1, se forma la matriz aumentada doblemente y se reduce por renglones:
Este sistema tiene una solución única. Por tanto, S es linealmente independiente y genera a es una base de
ESPACIOS VECTORIALES
EJEMPLO3
Solución
219
Muéstrese que el conjunto S = {(1, 2), (3, - 1), (1, 0)} no es una base de E2. El conjunto S es linealmente dependiente porque, por ejemplo,
Así que S no puede ser una base de E2.
EJEMPLO4
El espacio vectorial cero no tiene base, porque cualquier subconjunto contiene el vector cero y debe ser linealmente dependiente.
El ejemplo 4 indica que pueden haber espacios vectoriales que no tengan una base. Es necesario poder decidir si un espacio vectorial dado tiene una base o no. Los conjuntos de vectores generadores ayudan a resolver este punto.
T E O R E M A 3.5.2
Demostración
es un conjunto de vectores no nulos que genera a un subespacio W de un espacio vectorial V, entonces algún subconjunto de S es una base para W. (Nota: esto significa que también, V por ser un subconjunto trivial, tiene una base si es generado por S.) Si
Si S es un conjunto linealmente independiente, entonces por definición S es una base para W. Si S es linealmente dependiente, uno de los vectores puede escribirse como una combinación lineal de los otros. Supóngase que es dicho vector (de no ser así, los vectores en S pueden reacomodarse en tal forma que se cumpla la suposición). Se afirma que S' = aun genera W. Para comprobar esto, sea x un elemento de W con
por lo que esta expresión se puede sustiPero tuir en la combinación lineal anterior para obtener
Por tanto, S' genera W. Si S' es linealmente independiente, S' es una base para W. Si S' es linealmente dependiente, uno de los vectores en S' es una combinación lineal de los demás. Ahora se vuelve a dar la misma argumetación anterior; en esta forma debe llegarse al fin a un conjunto linealmente independiente que genera W. (Si se llega a un conjunto con un solo vector, el conjunto es linealmente independiente porque S es un conjunto de vectores no nulos.) El conjunto resultante es una base de W.
ÁLGEBRA LINEAL CON APLICACIONES
220
Se llega así al siguiente resultado fundamental: Cualquier espacio vectorial finito, generado por un conjunto de vectores no nulos, tiene por lo menos una base.
EJEMPLO5
Sea V el conjunto de todos los polinomios con las operaciones usuales. El espacio vectorial V no está generado finitamente. De hecho, si se toma cualquier subconjunto finito S de V, habrá un término de grado máximo, digamos en el conjunto. El polinomio no está en gen S, y S no puede generar V. Estamos muy interesados en bases de espacios vectoriales generados finitamente. Con el ejemplo 3 se mostró el hecho de que cualquier conjunto de tres o más vectores tomados de E2 no puede ser una base para E2. Después de todo, estos vectores serian coplanares y formarían así un conjunto linealmente dependiente. Un conjunto con un solo vector no puede ser una base para E2 porque solamente genera una recta que pasa por el origen. Lo anterior parece indicar que cualquier base para E2 debe contener exactamente dos vectores. Esto se deduce del teorema 3.5.3.
T E O R E M A 3.5.3
es una base de V, entonces a) cualquier conjunto de n + 1 (o más) vectores es linealmente dependiente y, por tanto, no es una base para V, y b) cualquier conjunto de n — 1 (o menos) vectores no puede generar V y, por tanto, no es una base de V.
Si
Este teorema simplemente dice que el número de vectores en una base es tiene ocho vectores, entonces cualúnico. Si se halla de base para quiera otra base de V tendrá ocho vectores. Por ello se puede definir la dimensión de un espacio vectorial V como el número de vectores, que hay en cualquier base de V. Si una base consta de n vectores, la dimensión de V (denotada por dim V) es n, se escribe dim V = n y se dice que V es de dimensión finita. En particular, V recibe el nombre de espacio vectorial enedimensional cuando una base para V tiene n vectores. En el ejemplo 1, dim E2 = 2. La dimensión del espacio vectorial cero se define como cero.
Demostración
Es decir, T contiene exactamente n + 1 a)Sea vectores. Se demostrará que T no puede ser una base probando que T es linealmente dependiente. Para ello considérese
ESPACIOS VECTORIALES
Pero cada
221
puede escribirse como
ya que
genera V. Sustituyendo esto en la ecuación (3.5.1) se tiene
Como
es linealmente independiente,
Es decir,
El último sistema homogéneo tiene menos ecuaciones que incógnitas; existe, pues, una solución no trivial para Esto quiere decir que T es linealmente dependiente. Ahora supóngase que T contiene más de vectores. Sea un subconjunto de n + 1 vectores. Tal como se acaba de demostrar, debe ser linealmente dependiente. Como el conjunto T contiene un subconjunto linealmente dependiente y es entonces, un conjunto linealmente dependiente (véase el problema 19 de la sección 3.4). b) Supóngase que T contiene n — 1 vectores y que genera V. Entonces, por el teorema 3.5.2 T debe contener una base para V. Si contiene r vectores, Como es una base y tiene r + lo más vecentonces deberá ser tores, se infiere de la parte a) que es linealmente dependiente. Esto contradice el hecho de que sea una base. Por lo anterior, sabemos ahora que los espacios vectoriales finitos generados por un conjunto de vectores no nulos tienen bases y son de dimensión finita. Es evidente que los espacios vectoriales de dimensión finita son generados por una base finita. A continuación se dan varios ejemplos.
ÁLGEBRA LINEAL CON APLICACIONES
222
E J E M P L O 6
Solución
(Base canónica) Muéstrese que En tiene la base (canónica)
Para el espacio generado considérese cualquier obsérvese que
En el caso de la independencia lineal considérese
de donde se ve que Por tanto, es una base de y dim Esto es razonable, ya que se tienen las asociaciones (véase la figura 3.5.1) Recta Objeto unidimensional Plano Objeto bidimensional Espacio Objeto tridimensional Comparando los ejemplos 1 y 4, se ve que E2 tiene más de una base posible. En general, un espacio vectorial (no nulo) tiene un número infinito de bases. No obstante, el número de elementos en cada una de las bases es el mismo: no hay que olvidar que a ese número es a lo que se le llama dimensión del espacio vectorial.
Figura 3.5.1
ESPACIOS VECTORIALES
EJEMPL O7
Solución
Demuéstrese que
Solución
tiene dimensión 6.
Una es (ésta es, de hecho, la base canónica)
por lo que dim
E JE MPLO 8
223
El espacio vectorial
número de vectores en S = 6.
tiene dimensión
Una base es
Para estar seguros, verificamos primero la independencia lineal. La ecuación
es válida sólo si el polinomio de la izquierda es cero para todo x real. En álgebra se sabe que esto ocurre sólo si todos los coeficientes son cero, es decir, sólo si Por lo tanto, S es linealmente independiente. Que S sí genera se puede deducir del hecho de que cualquier polinomio en es de la forma
EJEMPLO 9
En el ejemplo 18 de la sección 3.4 se mostró que es una base de nealmente independiente y que genera
es li-
Ahora que ya sabe lo que es una base para un espacio vectorial, puede plantearse el segundo problema fundamental de álgebra lineal.
El problema de la base. Sea V un espacio vectorial. El problema de la base puede presentarse en una de las dos formas siguientes:
Problema 1. Construir una base para V, tomando los vectores de V.
ALGEBRA LINEAL CON APLICACIONES
224
Problema 2. Dado un conjunto S de vectores en V, construir una base
para V añadiendo o bien eliminando, algunos (pero no todos) vectores de S, o ambas cosas.
Antes de intentar resolver este problema, podría uno preguntarse si es posible obtener una solución. El teorema 3.5.2, que establece "cómo eliminar vectores dependientes de un conjunto generador" para obtener una base, viene ahora en nuestro auxilio. Problema 1. Si puede escogerse un conjunto de vectores de V que genere V, entonces eliminando vectores dependientes se obtendrá una base para V. Problema 2. Si el conjuto dado S genera V, se procede como en el problema 1. Si no, se aumenta S añadiendo más vectores hasta que se obtenga un conjunto generador. Luego se procede como en el problema 1.
E J E M P L O 10
Solución 1
(Problema de la base # 2) Sea S = {(1, 0, 3), (2, 1, 4)}. Hállese una base T para E3 que contenga S. Como £3 tiene dimensión 3, se sabe que T debe contiene exactamente tres vectores. El conjunto S, como está, ya es linealmente independiente, por lo que sólo hace falta añadir un vector a S. Sin embargo, hay que hacerlo con cuidado. El nuevo vector que se añada a S no debe hacer que T sea linealmente dependiente. Esto quiere decir que el nuevo vector no debe estar en el espacio generado por los dos vectores ya existentes. Se tiene que gen por lo tanto, hay que procurar que el nuevo vector no sea de la forma Para ello, se supone que el nuevo vector es y se hace que la ecuación
no tenga solución para a y b. Igualando las componentes se obtienen las ecuaciones
ESPACIOS VECTORIALES
225
lo que se reduce a
Por tanto, se eligen de tal manera que tendrá un vector que no está en gen {(1, 0, 3), (2, 1,4)}. En ese caso, 0) es una elección aceptable y
es una base de E3.
Solución 2
Si el tercer vector hiciera que nealmente dependiente, entonces
fuera li-
ya que uno de los renglones sería una combinación lineal de los otros dos. Se requiere entonces que
Calculando el determinante se tiene
que es la misma condición obtenida mediante la solución 1. Algunos terceros vectores posibles son (1,0, 0),(0, 1,0), (0,0, l)(0, 1, l ) o ( l , 1, 0); en realidad, hay un número infinito de posibilidades.
Solución 3
(Prueba y error) Simplemente se prueban los vectores de la base canónica hasta que uno de ellos funcione. Se prueba primero (1, 0, 0) y se examina la dependencia lineal:
226
ALGEBRA LINEAL CON APLICACIONES
Así, los vectores son linealmente independientes y forman una base T= {(1, 0, 3), (2, 1, 4), ( 1 , 0 , 0)}. En el ejemplo 10 se usó en forma implícita el teorema que sigue. T E O R E M A 3.5.4
Sea dim V = n, y sea guientes son equivalentes:
un subconjunto de V. Los enunciados si-
1. El conjunto S es una base para V 2.-El conjunto S es linealmente independiente 3. El conjunto S genera a V. Demostración
Esto se deduce de la definición de base. Supóngase que 5 es linealmente independiente y que S no genera a V. Entonces existe un vector que no se halla en gen S. Es decir,
es un conjunto linealmente independiente tomado de V. Pero entonces dim V lo que contradice la hipótesis de que dim V = n. Supóngase que S genera a V y que no es una base para V. Entonces debe ser linealmente dependiente. Según el teorema 3.5.2, hay un subconjunto de S que es una base para V. Sin embargo, dicho subconjunto debe tener menos de n vectores, lo cual implica que dim V < n, o sea una contradicción. Nótese que, si se hubiese tenido el teorema 3.5.4 antes de los ejemplos 1 y 2, las soluciones habrían requerido la mitad del trabajo. Con mostrar la independencia lineal habría bastado.
EJEMPLO 11
Solución
(Problema 1 del problema de la base) Hállese una base para el espacio solución de
Las ecuaciones en forma de matriz aumentada son
ESPACIOS VECTORIALES
y puede tomarse
227
para obtener las soluciones
Como genera el espacio solución y es linealmente independiente, S es una base para el espacio solución. Por tanto, la dimensión del espacio solución es 2.
Los ejemplos 10 y 11 muestran que la solución del problema de la base en general no se obtiene mediante una fórmula o la aplicación mecánica de un método. Requiere razonamiento, flexibilidad y la aplicación de casi todo el material aprendido antes.
E J E M P LO 12
El conjunto
es un espacio vectorial. Obténgase una base para este espacio. Solución
Se eliminan los vectores que sean combinaciones lineales de los otros. Para identificar las dependencias, se considera
lo cual es equivalente a
Las soluciones son se tiene
Tomando k
Eligiendo k = 0 y j = 1 se obtiene
Por tanto, (8, 2, 0) y (3, 2, -2) dependen de (1, -1, 2) y (0, 5, -8), y
es una base de gen S. La dimensión de gen S es 2.
ÁLGEBRA LINEAL CON APLICACIONES
228
En el ejemplo 12, la matriz aumentada que aparece en el lado izquierdo de la ecuación (3.5.2) tiene columnas que se componen de los vectores de S. Asimismo, el número de renglones (dos) en la forma reducida por renglones es igual a la dimensión de gen 5. En general, para problemas en En del tipo del ejemplo 12, se dispone de un teorema muy útil. Antes de enunciarlo, se hará la observación de que para una matriz A de m x n, si los renglones se consideran como vectores de En, el espacio generado por esos vectores recibe el nombre de espacio renglón de A.
T E O R E M A 3.5.5
Demostración
Si es un conjunto de vectores de es la matriz formada como el renglón como el renglón 2 y así sucesivamente, y si colocando B es la forma escalonada por renglones reducida de A, entonces los renglones diferentes de cero de B forman una base para el espacio renglón de A. En otras palabras, los renglones no nulos de B forman una base de gen 5. Sea A la matriz
Según la definición de las operaciones de renglón, si se obtiene un renglón de ceros, ese renglón era igual a una combinación lineal de los demás vectores del conjunto. Todos los renglones restantes son, en consecuencia, combinaciones lineales de los vectores independientes del conjunto original. Así que el espacio generado por los renglones no nulos es igual a gen S, y por ende los renglones no nulos, siendo independientes, forman una base para gen S y dim (gen 5) = número de renglones no nulos.
E J E M P L O 13
Solución
Resuélvase el ejemplo 12 aplicando el teorema 3.5.5. Se forma A y se reduce por renglones.
ESPACIOS VECTORIALES
Por el teorema 3.5.5, dim (gen S) = 2.
229
es una base de gen S, y
El teorema 3.5.5 puede enunciarse en términos del rango de una matriz. D E F I N I C I Ó N 3.5.2
E J E M P L O
14
Solución
Sea A una matriz de El rango renglón de una matriz es el número de renglones diferentes de cero en la forma escalonada por renglones reducida de A. El rango columna de una matriz es el número de renglones diferentes de cero en la forma escalonada por renglones reducida de A'. Los rangos renglón y columna de la matriz cero se definen como cer. Calcúlese los rangos renglón y columna de
En el ejemplo 13 ya se halló que el rango renglón es 2. Para el rango columna pueden efectuarse operaciones de columna o bien formar AT, efectuar operaciones de renglón y transponer. Se usará operaciones de columna.
El rango columna de A también es 2. El rango columna y el rango renglón de A en el ejemplo 14 fueron iguales. Esto siempre se cumple.
T E O R E M A 3.5.6
Para toda matriz A, rango renglón de A = rango columna de A
230
ÁLGEBRA LINEAL CON APLICACIONES
Demostración Sean
los renglones de para gen
Después de reducir se halla la base
Escribiendo ahora
después de sustituir en la ecuación (3.5.3), se observa que
Esto significa que la transpuesta de cada columna es una combinación lineal de k vectores; por tanto, el rango columna de A es menor que o igual que k. Es decir, rango columna de
rango renglón de A
Del mismo modo se halla que el rango renglón de A es menor que o igual al rango columna de A. Por tanto, los rangos son iguales. Como resultado de este teorema, el rango de una matriz A se define simplemente como el rango renglón de A. Ahora pueden enunciarse de manera concisa resultados concernientes a ecuaciones lineales y matrices. 1.
2. La matriz 3.
tiene una solución si y sólo si rango de A = rango Además det es invertible si y sólo si rango de si y sólo si rango de tiene una solución no trivial si y sólo si rango de
ESPACIOS VECTORIALES
231
Regresemos ahora a la teoría de códigos para ver otra forma de usar las bases.
E J E M P L O 15
Tal como se definió en la sección 3.3, un código lineal de canal binario V es un subespacio de Fn. El código V, al ser generado finitamente por vectores no nulos, tiene una base. Cuando los elementos de una base de V se disponen en renglones en una matriz, la matriz se llama la matriz generadora de V. En consecuencia, el espacio generado por los renglones es todo el código; la matriz proporciona un mecanismo compacto para el almacenamiento de un código. Por ejemplo, la matriz
genera el código mostrado en esta tabla:
Una matriz de 30 x 20 (30 vectores de 20 elementos cada uno) genera un código de más de 109 vectores código. Después de todo, cada elemento del código es una suma de 30 vectores base, y hay dos posibilidades para cada uno de los 30 coeficientes. Hay por tanto 230 = 1 073 741 824 > 109 vectores código en V. El ejemplo 15 plantea un problema importante para la decodificación: ¿es cada vector código una combinación lineal única de los renglones de la matriz generadora? La respuesta es afirmativa y se demostró en el teorema 3.5.1. Otra pregunta generadora en el ejemplo del código es ésta: si un código C en Fn es "menor" que otro código D en Fn, en el sentido de que C es un subespacio propio de D, ¿es una base para C "menor" que una base para D? Esto parece razonable, y la respuesta es afirmativa como se demuestra en el teorema 3.5.7 T E O R E M A 3.5.7
Demostración
Si V es un espacio vectorial de dimensión finita y W es un subespacio de V, entonces dim W < dim V. entonces la proposición es verdadera. Supóngase que Primero se mostrará que W está generado finitamente. Como
Si W
hay por
232
ÁLGEBRA LINEAL CON APLICACIONES
lo menos un vector no nulo en Entonces gen o no. En caso está generado finitamente por en caso contrario, hay un afirmativo, debe ser livector que no esta en gen pero sí en El conjunto nealmente independiente, ya que de lo contrario estaría en gen Ahora bien, si gen la demostración ha terminado; en caso contrario, hay que continuar añadiendo vectores y comprobando la independencia lineal. Este proceso debe terminar en algún punto, ya que si V tiene dimensión n, entonces cualquier conjunto de n + 1 vectores de V (y, por tanto, de W) debe ser linealmente dependiente. Supóngase que el proceso se detiene después del paso Entonces
P R O B L E M A S 3.5
1. ¿Cuáles de los siguientes conjuntos son base de E2?
2. ¿Cuáles de los siguientes conjuntos son base de E3?
En los problemas del 3 al 7 se dan un conjunto S y un espacio vectorial V. Hállese una base de V que contenga a S.
En los problemas del 8 al 12 se dan un conjunto S y un espacio vectorial V. Hállese una base de V eliminando vectores de S.
233
ESPACIOS VECTORIALES
En los problemas del 13 al 18 se da un espacio vectorial V. Hállese una base y dígase la dimensión de V.
espacio solución de
Demuéstrese que dim las matrices simétricas?
¿Cuál es la dimensión del subespacio de
Demuéstrese que dim ¿Cuál es la dimensión del subespacio de los polinomios pares (polinomios con exponentes pares)? ¿Cuál es dim
¿Cuál es dim
Demuéstrese que dim (subespacio de polinomios pares) + dim (subespacio de dim polinomio impares). Calcúlese el rango de las matrices dadas.
Muéstrese que la base canónica de E" es también una base de Muéstrese que dim Muéstrese que
234
ÁLGEBRA LINEAL CON APLICACIONES
genera el código lineal
Muéstrese que
genera un subcódigo W de V. ¿Cuáles son dim W y dim V? Compárense el rango A y el rango (A | B) para determinar si los sistemas siguientes tienen soluciones.
Hállense bases para los espacios renglón de las matrices en el problema 23.
3.6 PERPENDICULARIDAD EN ESPACIOS VECTORIALES Una de las bases de E3 es la base canónica E = {(1, 0, 0), (0, 1, 0), (0, 0, 1)}, que puede dibujarse como en la figura 3.5.1. Esos vectores tienen longitud 1 y son todos perpendiculares entre sí. Una base así recibe el nombre de ortonormal: orto por ortogonal (perpendicular) y normal por normalizada (longitud 1). Para analizar las bases ortonormales para otros espacios vectoriales, es necesario extender la idea de producto punto a lo que que se llama un producto interno.
DEFINICION 3.6.1
Sea V un espacio vectorial real o complejo. Un producto interno sobre V es una función que asocia a cada par de vectores x, y un número y satisface las propiedades siguientes (a la derecha se describe la situación en E2. La barra encimada denota conjugación compleja):
ESPACIOS VECTORIALES
235
Sean r un escalar,
a menos que
EJEMPLO 1
lo cual es una adición de términos no negativos. La adición puede ser cero si y sólo si x1 = 0 y x2 = 0, es decir, cuando x = 0.
puede definirse un pro-
En
duelo interno como
Este producto interno se reduce al producto punto ordinario en E2 y E3. Se le llama el producto interno canónico para E".
EJEMPLO2
puede definirse un pro-
En
ducto interno como
Éste es el producto interno canónico de pero que E J E M P L O 3
En
Obsérvese que
si
puede entonces definirse un producto interno como
ÁLGEBRA LINEAL CON APLICACIONES
236
EJ E M P L O 4
En
sean y defínase es un producto interno. El ejemplo 4 muestra que puede definirse más de un producto interno sobre un espacio vectorial; E2, por ejemplo, también tiene el producto canónico. En E2 y en E2 se tiene que
por lo que resulta natural definir la longitud de un vector x en cualquier espacio vectorial con producto interno como A los espacios vectoriales que cuentan con un producto interno definido también se les llama espacios con un producto interno.
DEFINICIÓN 3.6.2
Sea V un espacio vectorial con producto interno La norma (longitud) de x se denota con
Si x, y están en V, y se define como
La distancia entre x y y se define como Si x y y son diferentes de cero, se dice que son ortogonales cuando
puede ser diferente en distintos productos internos, coObsérvese que mo se indica en el ejemplo que sigue. EJ E M P L O 5
Solución
para normas generaCalcúlese En E2 sea das por el producto interno canónico y el producto interno del ejemplo 4. Producto interno canónico
Producto interno del ejemplo 4
Muchas de las propiedades de los productos internos son simplemente generalizaciones de las propiedades del producto punto en E2 y E3. Algunas de ellas se enuncian en el teorema 3.6.1.
TEOREMA 3.6.1
Sea V un espacio vectorial con producto interno guientes son válidas para todo x y y en V.
Las propiedades si-
ESPACIOS VECTORIALES
237
(Desigualdad de Cauchy-Schwarz) (Desigualdad del triángulo)
Demostración
a) Se tiene
La única solución a la ecuación
Por tanto,
b), c) Véanse los problemas al final de esta sección.
Como el radical significa la raíz cuadrada positiva, e) Véanse los problemas.
Extrayendo la raíz cuadrada a ambos lados se obtiene
Si x y y son vectores en un espacio vectorial real, es posible definir el ángulo entre x y y. Obsérvese que la desigualdad de Cauchy-Schwarz permite definir
ya que
implica
238
ÁLGEBRA LINEAL CON APLICACIONES
Habiendo definido ya la ortogonalidad y la norma, puede pasarse al análisis de es un las bases ortonormales. Un conjunto de vectores conjunto ortonormal en un espacio vectorial con producto interno si
Es decir,
Uno de los resultados más importantes de álgebra lineal es el de que los conjuntos ortonormales siempre son linealmente independientes. Considérese
Aun cuando no se sepa qué cosa es V o cómo son los pueden hallarse los coeficientes. Se aplicará la importante técnica de tomar el producto interno a en este caso. Se tiene ambos lados con un vector en particular,
y como
para
la ecuación (3.6.1) se convierte en
Como esto es válido para cualquier el conjunto es linealmente independiente. El hecho de que los conjuntos ortonormales siempre sean linealmente independientes los hace muy apropiados cuando hay que encontrar bases para espacios vectoriales con producto interno. Todo lo que resta por hacer es generar a V. Así, en En la base conónica es una base ortonormal. Si una base está constituida por vectores ortogonales pero no todos ellos son de norma 1, entonces la base es una base ortogonal.
EJEMPLO 6
Sean Muéstrese que un ejemplo de dos vectores ortogonales de para
es un producto interno. Hállese Hállese una base ortonormal
ESPACIOS VECTORIALES
Solución
239
La verificación de las propiedades de la 1 a la 4 del producto interno (definición 3.6.1) es directa. Los vectores
son ortogonales. El vector
es ortogonal a p y a q. El conjunto
es ortogonal y linealmente independiente. Como dim el conjunto S es una base. Sin embargo, S es solamente una base ortogonal. Para convertirla en una base ortonormal, hay que normalizar los vectores. Esto es,
(q ya tiene norma 1)
Así,
no es la única base ortonormal para es una base ortonormal para con este producto interno; la base canónica es también una base ortonormal.
P R O B L E M A S 3.6
1. ¿Cuáles de los siguientes son productos internos sobre E2? Tómense x =
2. Usando el producto interno sobre E2 del problema 1 a), muéstrese que es una base ortonormal para E2 con ese producto interno. 3. En
Muéstrese que la función donde o > 0, b > 0
es un producto interno. ¿Qué sucede si a < 0 o si b < 0?
240
ÁLGEBRA LINEAL CON APLICACIONES
4. Norma de dificultad. Considérese una forma de "normar" el ascenso de una montaña. Los índices de dificultad son como se muestra:
Una norma de dificultad para un viaje de x1 millas en la categoría 1, x2 millas en la categoría 2 y x3 millas en la categoría 3 es
la cual se genera mediante el producto interno
De los ascensos siguientes, ¿cuál es el más difícil (es decir, cuál es que tiene la mayor norma de dificultad)?
5. Sea V un espacio vectorial con productos internos Supóngase que se define una nueva función sobre V mediante donde Muéstrese que es también un producto interno. Defínase Comparte (la norma original) para k > 1 y k < 1. 6. Sean
en
con el producto interno ordinario. Calcúlese conde es el ángulo entre A y B.
ESPACIOS VECTORIALES
241
7. Considérese E3 con el producto interno canónico. a) Hállese un vector que sea ortogonal a (3, -1, 0) y a (1, 2, 3). b) Calcúlense vectores x y y ortogonales a (1, - 1, 2) e independientes uno de otro. 8. Sea V un espacio vectorial con producto interno indicar que demuéstrese que entonces
sirve para para todo a y b.
entonces
es Hortogonal a cualquier
vector en gen 9. Complétense los detalles para la comprobación del producto interno en el ejemplo 1. 10. Complétense los detalles para la comprobación del producto interno en el ejemplo 2. 11. Demuéstrense las partes b) y c) del teorema 3.6.1. 12. Demuéstrese la parte e) del teorema 3.6.1 para espacios vectoriales reales mediante los pasos siguientes: a)Muéstrese que la desigualdad es validad para b) Supóngase que y empléese
para hallar
c) Recuérdese que una cuadrática
que sea mayor que o igual que cero o bien no tiene raíces reales, o bien tiene una sola raíz real. Calcúlese el discriminante (de la fórmula cuadrática) para la ecuación 1. Debe ser menor menor que o igual que cero. para obtener la desigualdad de Cauchy- Schwarz. d) Úsese 13. Muéstrese que si 14. Muéstrese que si
entonces es un conjunto ortogonal, entonces
242
ÁLGEBRA LINEAL CON APLICACIONES
es otro producto interno. Calcúlese XTY para
15. En
16. En Calcúlese X* Y para
es otro producto interno (recuérdese que
Calcúlese U* V para
17. Sean A y B matrices en
y defínase
a) ¿Qué valores de m y /; hacen que sea equivalente al prorducto interno del ejemplo 3? b) Muéstrese que sobre
tal como está definido es un producto interno
3.7 RECONSIDERACIÓN DEL PROBLEMA DE LA BASE En esta sección se considerará la siguiente forma del problema de la base:
Dada la base interno
de un espacio vectorial V con producto hállese una base ortonormal
Una razón para desear una base ortonormal de V es que para todo vector es fácil calcular los coeficientes de x en la combinación lineal
De hecho,
ESPACIOS VECTORIALES
E J E M P LO 1
Solución
243
El conjunto es una base ortonormal para E3. Exprésese (2, — 1, 4) como combinación lineal de los elementos de la base. Se tiene
Una solución del problema de la base planteado arriba implica lo que se conoce como el procedimiento de Gram-Schmidt. Para tener una idea de este procedimiento, considérese el problema en E3 y supóngase que como se ve en la figura 3.7.1. Lo que puede hay luego normalicerse es obtener primero una base ortogonal zar todos los vectores para obtener Para el primer vector en se elige debe ser perpendicular a es decir, debe estar sobre el Ahora plano como se muestra en la figura 3.7.2. Se ve que hay un número infinito de posibilidades de elegir La idea en el procedimiento de Gram-Schmidt es la de elegir es el como una combinación lineal de Como gen debe estar en la intersección del plano plano que contiene a se sabe que debe y gen (véase la figura 3.7.3). Una vez que se ha elegido ser perpendicular a En el procedimiento de Gram-Schmidt, se requiere esté en gen y que sea perpendicular a (véase la figura que 3.7.4). Finalmente, entonces,
Figura 3.7.1 Gráfica de S =
Figura 3.7.2 Plano que debe contener w2. El plano de todos los vectores perpendiculares a v1.
ÁLGEBRA LINEAL CON APLICACIONES
244
Figura 3.7.3 Intersección de P1 y gen {v 1 ; v2}, donde w2 debe estar en el procedimiento de Gram-Schmidt.
Figura 3.7.4 Base ortogonal contruida a partir de {v1, v2, v3} mediante el procedimiento de Gram-
Antes de enunciar un resultado general, se mostrará este procedimiento con un ejemplo en E3.
EJEMPLO2
Usando el procedimiento recién descrito, constrúyase una base ortonormal a partir de S con el producto interno canónico.
Solución Se elige
y se exige de
que
A continuación se toma el producto interno de ambos lados de la ecuación (3.7.1) con para obtener
245
ESPACIOS VECTORIALES
que es una ecuación homogénea con dos incógnitas. Las soluciones son Eligiendo se tiene
se exige de
Teniendo ya
que
Ahora se toman productos internos de ambos lados de la ecuación (3.7.3) con a fin de obtener ecuaciones para
Como
Tomando
= 0, estas últimas ecuaciones se reducen a
1, se tiene
Por lo tanto, una base ortogonal es
ALGEBRA LINEAL CON APLICACIONES
246
Normalizando cada uno de los vectores en T, se halla una base ortonormal:
En la figura 3.7.5 se muestran S y
gráficamente.
El método del ejemplo 2 constituye en sí mismo un método de demostración de un resultado general.
T E O R E M A 3.7.1
(Procedimiento de Gram-Schmidt) Sea espacio vectorial V con producto interno
una base para un El conjunto
es una base ortogonal para V. El conjunto
es una base ortonormal para V. Las ecuaciones (3.7.5) son una generalización de las ecuaciones (3.7.2) y (3.7.4) del ejemplo 2.
Figura 3.7.5 Gráficas de S y
ESPACIOS VECTORIALES
EJEMPLO 3
Solución
247
Hállese una base ortonormal para V = gen ((1, - 1, 0, 2), (3, 2, 1, 2), (-2, 1, 0, l)j en E4 con el producto interno canónico. Sean fórmulas del teorema 3.7.1 se halla
Utilizando las
Una base ortonormal es
Ahora que ya sabemos lo que es una base ortonormal, podemos describir una clase importante de matrices que más adelante se emplearán mucho.
DEFINICIÓN 3.7.1
Una matriz cuadrada A se llama ortogonal si AT = A -1 es decir, si AAT = A T A = I.
E J E M P L O 4
Muéstrese que
es ortogonal. Solución
Por tanto, AT = A
1
y A es ortogonal.
Los renglones de A en el ejemplo 4 son, como vectores, Obsérvese que con es una base ortonormal cho, puede decirse lo mismo para las columnas de A. Esta observación es válida en todas las matrices ortogonales, como se verá en el teorema que sigue.
ÁLGEBRA LINEAL CON APLICACIONES
248
T E O R E M A 3 . 7 .2
Demostración
Una matriz es ortogonal si y sólo si los renglones de A forman una base ortonormal para En con el producto interno canónico. Supóngase que los renglones de A forman una base ortonormal Entonces
Dada la definición del producto matricial, el elemento ij del producto es el cual es 1 si Supóngase que A es ortogonal. Entonces el elemento de AAT, es 1 si Por si las definiciones de multiplicación matricial y de tranpuesta de una matriz, se ve que renglón renglón En consecuencia, los renglones de forman una base ortonormal para
TEOREMA 3.7.3
Demostración
La matriz A es ortogonal si y sólo si AT es ortogonal. Si A ortogonal, entonces A AT = ATA = I. Por tanto,
Por tanto, AT es ortogonal. El argumento se puede aplicar en sentido contrario (véanse los problemas).
TEOREMA
3.7.4
Demostración
Una matriz es ortogonal si y sólo si las columnas de A forman una base ortonormal para En con el producto interno canónico. La matriz A es ortogonal si y sólo si AT es ortogonal. Las columnas de A son los renglones de AT, los cuales forman una base ortonormal para En.
EJEMPLO5
La matriz identidad es una matriz ortogonal.
EIEMPLO6
Hállese un ejemplo de una matriz ortogonal de 3 X 3 (que no sea I).
Solución
Hay un número infinito de posibilidades. Usando la base canónica para E3 se puede obtener
ESPACIOS VECTORIALES
249
Otra posibilidad es
Obsérvese que AT = A, por lo que A2 = I. A estas matrices seles llama involutorias. En el caso complejo, una matriz cuadrada A se llama unitaria si A*A = I. Por ejemplo,
es unitaria. Se tienen teoremas prácticamente idénticos para matrices unitarias y sus demostraciones también son las mismas. T E O R E M A 3.7.5
E J E M P LO 7
Una matriz cuadrada A es unitaria si y sólo si sus renglones y columnas son mutuamente ortogonales con respecto al producto interno canónico en La matriz
es unitaria. Proyecciones ortogonales Si W es un subespacio de En con una base ortonorentonces la proyección ortogonal de v sobre W se define mal como
donde el producto punto es el producto punto canónico en E". Por ejemplo, si con las bases (véase la figura 3.7.6). No es difícil ver, en entonces es el vector en W "más cercano" a en el sentido la figura 3.7.6, que es de que la distancia desde el "extremo de v" hasta el "extremo de la más pequeña en comparación con los demás vectores en W. Es decir,
250
ALGEBRA LINEAL CON APLICACIONES
Figura 3.7.6 Proyección ortogonal de (1, 2, 2) sobre W
para todos los vectores w en W. Aunque esto es cierto en general, no se dará la demostración. Si se emplean productos internos no canónicos, las normas generadas en esa forma no tienen por qué representar la distancia en el sentido usual. PROBLEMAS
3.7
1. Verifíquese que las siguientes son bases ortogonales para E3. Obténganse bases ortonormales a partir de ellas.
2. Aplíquese el procedimiento de Gram-Schmidt a fin de construir bases ortonormales para los siguientes subespacios de E4.
3. ¿Cuáles de las siguientes son matrices ortogonales?
4. ¿Cuáles de las siguientes son matrices unitarias?
ESPACIOS VECTORIALES
5. Sea
251
una base ortonormal de entonces
Muéstrese
6. Sea un conjunto de vectores linealmente independiente en un espacio vectorial V de dimensión n, n > k, con producto interno. Muéstrese que si x es ortogonal a todos los vectores en S, entonces T también es linealmente independiente 7. Muéstrese que
es una base ortonormal para
con el producto interno
Escríbase
como una combinación lineal de los vectores base. 8. Úsese el procedimiento de Gram-Schmidt para tranformar las bases dadas en bases ortonormales, en los espacios dados. (Utilícese el producto interno canónico.)
9. Aplíquese el argumento en el teorema 3.7.3 en sentido inverso para completar la demostración. 10. Úsese el procedimiento de Gram-Schmidt para hallar una base ortonormal para gen j ( l , 3, 1), (1, 2, l ) j en E3 con el producto interno canónico. Hágase lo mismo en E3 con el producto interno 11. Obténgase una base ortonormal para E 3 que incluya a 0) (hacerlo por simple observación).
252
ÁLGEBRA LINEAL CON APLICACIONES
12. Hállese una base ortogonal para E3 que incluya v1 = ( 1 , 1, 1). Primero hállese cualquier base que incluya v1 como el primer vector; luego úsese el procedimiento de Gram-Schmidt, pero sin normalizar a v1 . 13. a) Sea A una matriz unitaria. Muéstrese que |det A\ = 1. b) Muéstrese mediante un ejemplo que, en una matriz unitaria A, det A no es necesariamente igual a 1 o — 1. (Nota: recuérdese que A puede tener ele mentos complejos.) c) Sea A una matriz ortogonal. Muéstrese que det A = ± 1. En general, si en una matriz A su determinante es igual a 1, se le llama unimodular. 14. ¿Qué condiciones deben cumplir a y b para que
sea ortogonal? ¿Hay alguna condición que convierta a A en unitaria? 15. ¿Es ortogonal el cuadrado de una matriz ortogonal? ¿Es unitario el cuadrado de una matriz unitaria? 16. Si A es ortogonal, ¿es A n ortogonal 17. a) Muéstrese que si U es ortogonal y B = U T AU, entonces det B = det A. b) Muéstrese que si U es unitaria y B = U*A U, entonces det B = det A. 18. Si A y B son ortogonales, ¿qué puede decirse de A + B? ¿Y acerca de -A? 19. Supóngase que A es involuntaria. Muéstrese que si n es impar, entonces An = A. 20. Si A es unitaria, ¿es —A también unitaria? 21. Si A es idempotente, ¿debe A ser simétrica? 22. Muéstrese que si para cualquier
es una base ortogonal para V, entonces
23. Hágase una demostración del teorema 3.7.5 calcan de los teoremas 3.7.2, 3.7.3 y 3.7.4. 24. Muéstrese que la matriz de rotación
es ortogonal. ¿Es también unitaria?
demostraciones
253
ESPACIOS VECTORIALES
25. Sean a y b números reales. ¿En qué condiciones es
unitaria? (Éste es un ejemplo de una matriz de dispersión.) 26. El conjunto no genera a E3. Hállense las proyecciones ortogonales de los vectores siguientes en gen S. Dibújese gen S y el vector, a) (1, 0, 0) b) ( 1 , - 1 , 0 ) c) (1, 1, 2).
3.8 CAMBIOS DE BASE EN ESPACIOS VECTORIALES Si a varias personas se les piden señas para llegar a cierto lugar es posible que digan lo mismo, pero cada una a su manera. En la figura 3.8.1 se ve el mapa de un pueblo pequeño con un origen 0, y se piden instrucciones para llegar a la esquina de McDaniel y Walker, marcada con una X. Dos conjuntos posibles de instrucciones son 1. Avanzar 8 cuadras hacia el este y 6 cuadras hacia el norte. 2. Avanzar 6 cuadras hacia el norte y 8 cuadras hacia el este. Los dos conjuntos de instrucciones son correctos. ¿Cuál es la diferencia? ¡Cada conjunto está relacionado con una base diferente de E2 ! En la figura 3.8.2
Figura 3.8.1
Un pequeño pueblo. 1 cuadra
Figura 3.8.2 Diferentes bases de las instrucciones.
254
ALGEBRA LINEAL CON APLICACIONES
se han dibujado dos bases S1 y S2 que corresponden a los casos 1 y 2, respectivamente. En unidades de cuadras se tiene
El ordenamiento de los vectores base está cambiado en S1 y S2. La esquina se localiza en (8, 6), aunque en términos de las diferentes bases (8, 6) tiene coeficientes distintos por lo que respecta al orden.
Nótese que los coeficientes en estas combinaciones lineales son en realidad las "instrucciones" en términos de la base dada. Comparando S 1 y S2 , se ve que el orden es importante en una base, cuando ésta sirve para describir vectores. También se observa que los vectores "instrucción"
pueden relacionarse mediante una matriz:
En esta sección se analizará el problema de describir un vector dado en términos de bases diferentes. Este tipo de problema es de interés en mecánica. Considérese el alambre de soporte que se ve en la figura 3.8.3. El vector F representa una fuerza que actúa horizontalmente sobre el alambre. En términos de la base canónica (con los ejes x1 y x 2 como se muestra), F = 2(1, 0) + 0(0, 1). Son de interés las fuerzas normales y tangenciales T y N sobre el alambre.
Figura 3.8.3 Fuerzas sobre un cable.
ESPACIOS VECTORIALES
En términos de la base
255
no obstanEs decir, las componentes normal y tangencial son
D E F I N I C I Ó N 3.8.1
Una base ordenada es una base ordenamiento2 de los vectores en la base.
D E F I N I C I Ó N 3.8.2
Sea
de vectores junto con un
una base ordenada para un espacio vectorial V, y sea
entonces los coeficientes pecio a S. La matriz
se llaman coordenadas de cx con res-
se llama matriz de coordenadas de x con respecto a S. Una matriz de coordenadas de x para una base ordenada es única, ya que la combinación lineal en la ecuación (3.8.1) es única (por el teorema 3.5.1.)
EJEMPLO 1
Solución
Sea x = (2, 3) en E 2 . Hállese la matriz de coordenadas para x con respecto a a) S = base canónica, b) S = {( l , 1), (1, - l ) ) , c ) S = 1 ( 1 , 0 ) , ( 1 , 1) } y d ) S = {(1, 1), ( 1 , 0 ) } . a ) C o m o ( 2, 3 ) = 2 ( 1 , 0) + 3 ( 0 , 1 ) ,
b) Como {(1, 1), (1, —1)} es una base ortogonal,
2
Un ordenamiento de un conjunto S de n objetos es una función del conjunto {1 , 2 ............n} sobre S. Es simplemente una regla que señala qué objeto debe ser llamado el primero, luego el segundo, etc.
ÁLGEBRA LINEAL CON APLICACIONES
256
(véase el problema 22 de la sección 3.7). Por tanto,
c) Se resuelve (2, 3) manera que
d) En este caso (2, 3)
para obtener
de tal
Resolviendo, se obtiene
Por tanto,
Obsérvese en c) y d) que la inversión del orden de los elementos de la base dio por resultado una inversión de los elementos de la matriz de coordenadas.
es una base de E3. Hállese el vector x si
E J E M P L O 2
Solución
En términos de la base S,
La flecha simplemente sustituye a la palabra "representa". En el ejemplo 1 se ve que si se cambia la base para un espacio vectorial V, entonces la matriz de coordenadas para el vector cambia. Esto plantea el problema:
ESPACIOS VECTORIALES
257
Dado un espacio vectorial V con base S, puede calcularse (x)s. Si se obtiene una nueva base T de V, ¿puede calcularse Es empleando decir, ¿existe una relación sencilla entre
Analicemos el problema en E3. Sean S bases para Supóngase que
dos
Esto es,
Ahora se desea "convertir las v en w". Como T es una base, hay coeficientes tales que
Sustituyendo esto en (3.8.2) queda
y así
(Por la ecuación (3.8.3)) Por tanto,
ÁLGEBRA LINEAL CON APLICACIONES
258
En un espacio vectorial V enedimensional, si S antigua y T es la nueva base,
es la base
Esto se puede deducir en la misma forma que en el caso de E3. La matriz en la ecuación (3.8.4) es la matriz de transición de S a T, y se acostumbra denotarla con P. Es decir, Algunas veces se escribe cuando es necesario recalcar el hecho de que P es la matriz de transición de S a T. Hay dos cosas importantes en las matrices de transición: 1. La matriz P es invertible, y P
-1
es la matriz de transición de T a S.
2. Si S t y T son bases ortonormales, entonces P es matriz ortogonal. Las demostraciones de 1. y 2. se dan en los problemas.
EJEMPLO3
Considérese E2 y las bases a) Hállese la matriz de transición de la base S a la base T. b) Obténgase la matriz de transición de la base T a la base S. c) Muéstrese que las matrices calculadas en a) y b) son inversas una de la otra. d) Calcúlese ((3, -5)) T . e) Calcúlese ((3, — 5))T usando la matriz de transición de a).
Solución
a)
Como
entonces
b) Sea
Como
ESPACIOS VECTORIALES
259
entonces
c) Como
se sabe que d) Se tiene que (3, -5) = -1 (1, 1) + 4(1, -1), así que
e) Ahora bien,
Puede comprobarse la respuesta calculando
EJEMPLO 4
Considérese E3 con las bases ortonormales (y el producto interno canónico)
Muéstrese que la matriz de transición P de S a T es ortogonal. Escríbase la matriz de transición Q de T a S. Solución
Usando productos internos
260
ALGEBRA LINEAL CON APLICACIONES
se sabe que
La matriz P es ortogonal ya que sus columnas son ortogonales y tienen norma 1. Como P-1 es la matriz de transición de T a S, se sabe que Q = P-1. Pero P es ortogonal, por lo que P-1 = PT y
EJEMPLO5
Solución
En el ejemplo 4, si el primero y segundo vectores en S se intercambian, ¿qué cambio hay en P? Examinando la solución del ejemplo 4, se ve que se invierten los papeles de v1 y v2. Por tanto, la matriz de transición es
Es decir, la primera y segunda columnas se intercambian.
EJEMPLO6
Solución
En el ejemplo 4, si se intercambian el primero y segundo vectores en T, ¿qué cambio se da en P? Examinando la solución del ejemplo 4, se ve que cómo los papeles de están invertidos, también lo están los primeros dos elementos en cada matriz Por tanto, la matriz de transición es de coordenadas
Es decir, se intercambian el primero y segundo renglones.
ESPACIOS VECTORIALES
261
Los ejemplos 5 y 6 muestran el principio general de que, si se intercambian vectores en la base S, entonces se intercambian las columnas correspondientes Si se intercambian vectores en la base T, entonces se intercambian los en renglones correspondientes en
E J E M P L O 7
Solución
Considérese la base de la base al girar los vectores en S por se la figura 3.8.4). Hállese la matriz de transición de S a T.
Como las bases son ortonormales, pueden calcularse las matrices de coordenadas empleando los productos internos:
Por tanto,
A propósito, P T es
Figura 3.8.4
en E2 obtenida radiantes (véa-
ÁLGEBRA LINEAL CON APLICACIONES
262
El ejemplo 7 muestra la forma general de una rotación, tal como se analizó en el capítulo 2. En general, las rotaciones tienen matrices de transición ortogonales.
EJEMPLO8
Solución
Con respecto al ejemplo del alambre en la figura 3.8.3, obténgase la matriz de transición a partir de la base canónica de E2. Se tiene
por lo que
Por tanto, si F = (a, b), sus componentes normales y tangencial están dadas por
P R O B L E M A S 3.8
En los problemas del 1 al 4, sean bases de E2 con el producto interno canónico. 1. Hállense las matrices de transición a) de S a T, b) de 7 a U y c) de S a U. Multiplíquense las matrices de a) y b) en ambas formas. ¿Está alguno de esos productos relacionado con la matriz de c)? 2. Sea lense
Enumérese
Usando las matrices del problema 1, calcú-
3. Calcúlense las matrices de transición de T a Z y de Z a T. 4. a) Calcúlese la matriz de transición de 5 a Z. b) Calcúlese la matriz de transición de U a Z usando intercambios en la matriz de a). En los problemas del 5 al 10, sean bases para E3 con el producto interno canónico. Sea
ESPACIOS VECTORIALES
263
5. Hállense las matrices de transición a) de S a T, b) de T a U, c) de S a U. Multiplíquense las matrices de a) y b) en las dos formas. ¿Está alguno de esos productos relacionado con la matriz de c)? 6. Calcúlese
Usando las matrices del problema 1, hállense
7. Calcúlense las matrices de transición de T a Z y de Z a T. 8. a) Hállese la matriz de transición de S a Z. b) Hállese la matriz de transición de U a Z usando intercambios en la matriz de a). 9. Calcúlese x si
10. Calcúlese x si
11. Hállese x si S es una base cualquiera para V y si
12. Calcúlese
si S es una base cualquiera para V y si
13. Muéstrese que si P es la matriz de transición de S a T en el espacio vectoes la matriz de transición de T a S, existe y rial V, entonces completando los pasos siguientes: a) Sean de T a S. Escríbase QP como
y Q la matriz de transición
b) Multiplíquese c) Sustitúyase el resultado de b) en
para obtener
264
ALGEBRA LINEAL CON APLICACIONES
d) Tómese
en la ecuación (1) y muéstrese que
e) Tómese
en la ecuación (1) y muéstrese que
f) Conclúyase que QP = I. 14. Muéstrese que si S son bases ononormales de un espacio vectorial real V, entonces la matriz de transición de S a T es ortogonal, completando los pasos siguientes: a) Muéstrese que la matriz de transición de S a T es
b) Muéstrese que la matriz de transición de T a S es
c) Del problema 13 se sabe que Q = P -1. Empléense a) y b) para mostrar que Q = PT. d) Conclúyase que P-1 = PT y que, por lo tanto, P es ortogonal. 15. Muéstrese que si P es la matriz de transición de S a T y Q es la matriz de transición de T a U, siendo S, T y U bases para V, entonces la matriz de transición de S a U es QP.
ESPACIOS VECTORIALES
265
16. Sean Calcúlese la matriz de transición de S a T.
dos bases para
17. Demuéstrese que una matriz de transición para un espacio vectorial V n-dimensional es de n x n. 18. En sean de transición de S a T y de T a S.
Calcúlense las matrices
19. Considérese el cable de soporte que se muestra en la figura P3.8.19. Calcúlese la matriz de transición de la base canónica para E2 a la base donde tienen longitud unitaria.
Figura P3.8.19
20. Considérese el cable de soporte a un ángulo a como se muestra. Calcúlese donde la matriz de la base canónica para E2 a la base tienen longitud unitaria.
Figura P3.8.20
ÁLGEBRA LINEAL CON APLICACIONES
266
3.9 PARANGÓN CON EL CÁLCULO Los espacios vectoriales, las bases y la ortogonalidad se pueden emplear para analizar muchos conceptos del cálculo. A continuación se mencionarán algunos de ellos.
Espacios vectoriales Recuérdese el teorema sobre las sumas y los múltiples de funciones continuas: si/y g son continuas en un intervalo [a, b] y c es cualquier número real, entonces f + g es una función continua en [a, b] y
cf es una función continua en [a, b] Este teorema establece que el conjunto de las funciones continuas en [a, b] es cerrado en la adición y la multiplicación por una constante. Esto genera una situación que podría dar por resultado un espacio vectorial. Con esta idea presente, se define C [a, b] como el conjunto de las funciones continuas en [a, b] junto con la suma de funciones y la multiplicación por una constante, definidas en la forma usual. Para ver si C [a, b] es un espacio vectorial, hay que comprobar los axiomas para los espacios vectoriales. La cerradura es válida según el teorema ya mencionado. Las propiedades
se verifican fácilmente. El vector cero es la función constante (es continua) que es idénticamente cero en [a, b]. Dada f, la función -f es continua y es la inversa aditiva de f. Por tanto, C [a, b] es un espacio vectorial. Las funciones derivables son otro conjunto importante de funciones en el como el conjunto de las funciones f definidas en cálculo. Si se define es continua) y se dota con las mismas operaciones que entonces es un subespacio de Para convencerse de esto, basta comprobar la cerradura. Como hay un teorema del cálculo según el cual la suma y los múltiplos constantes de funciones derivables son también funciones derivables, se tiene así la cerradura requerida. En consecuencia es un espacio vectorial por derecho propio y también es un subespacio de C [a, b].
EJEMPLO 1
Muéstrese un ejemplo de una función en que no esté en Con esto se prueba que es un subespacio propio de
ESPACIOS VECTORIALES
Solución
267
Una función continua que no sea derivable será suficiente. La función y = es continua en [- 1, 1] pero no tiene derivada en x = 0. Muchas funciones del cálculo son derivables un número infinito de veces. Por ejemplo, y todos los polinomios son derivables infinitamente en Entonces pueden definirse los espacios vectoriales
y aun
D E F I N I C I Ó N 3.9.1
EJEMPLO2
es el conjunto de todas las funciones f definidas en continuas en (En a y b se toman derivadas por la derecha y por la izquierda.) Con la operaciones estándar de adición y multiplicación por una constante, es un espacio vectorial. es el conjunto de todas las. en para toda n. es un espacio vectorial.
pero no en
Muéstrese un ejemplo de una función que esté en
Solución Sea
Entonces no lo es, porque
Aunque y' es continua en no está definida.
Los ejemplos 1 y 2 muestran la relación entre subespacios
entre estos espacios vectoriales. El espacio vectorial C[a, b] difiere de los espacios vectoriales que hemos estado estudiando en que C[a, b] no es de dimensión finita. Para comprobarlo. Entonces existiría una base finita supóngase que dim y cualquier conjunto de de funciones continuas en funciones tendría que ser linealmente dependiente. Pero que son linealmente infunciones en es un conjunto para alguna dependientes. Por tanto, es imposible tener dim Como los polinomios son infinitamente derivables, el mismo argumento no es dimensión finita para ninguna k. muestra que no es de dimensión finita, existen algunos subespacios imAunque de dimensión finita. portantes de
ÁLGEBRA LINEAL CON APLICACIONES
268
E J E M PLO 3
Muéstrese que el conjunto de todas las soluciones de la ecuación3 un subespacio unidimensional de
4 donde Solución Recuérdese que las funciones que satisfacen a C es arbitraria. Es decir, Para mostrar que es un subespacio de se observa primero que como es una función continua, Ahora hay que demostrar la cerradura de W. Como se tiene la cerradura y W es un subespacio de Una base de Por tanto, dim
EJEMPLO 4
Solución
Muéstrese que el conjunto de todas las soluciones de la ecuación es un subespacio bidimensional de Para mostrar Las soluciones de la ecuación son de la forma A es un subespacio, se procede igual que que Demostrar que S genera en el ejemplo 3. Una base de W es W es fácil. Para la independencia lineal considérese La se halla ecuación debe ser válida para toda x. Haciendo se obtiene
Independencia lineal
No siempre es fácil demostrar la independencia lineal de un conjunto de funciones en C[a, b].
EJEMPLO 5
Solución
Considérese el conjunto S linealmente indendiente?
¿Es S un conjunto
Podría probarse
como en la definición. La dificultad radica en que en esie caso los vectores son funciones, por lo que no se obtiene un conjunto de ecuaciones lineales con coeficientes constantes. Los coeficientes de la ecuación lineal incluyen la variable
La ecuación es importante en el estudio del crecimiento de la población, el decaimiento radiactivo y otras áreas. 4 Que estas funciones sí satisfacen a la ecuación se demuestra en un teorema de las ecuadones diferenciales ordinarias.
ESPACIOS VECTORIALES
269
x, y la ecuación debe ser válida para toda x. En este ejemplo, confiaremos en los conocimientos de identidades trigonométricas y recordaremos que
Por tanto, el conjunto es linealmente dependiente. Hay otro método que se puede aplicar si las funciones en un conjunto de funciones son derivables un número suficiente de veces; el método al que nos referimos es el método del wronskiano. Con dos funciones, el resultado básico es el siguiente: Las funciones f y g en
son linealmente independientes si para alguna x en [a, b]
El determinante se llama wronskiano de f y g y se denota por W(f, g).
EJEMPLO 6
Solución
Muéstrese que S = {sen x, cos x} es linealmente independiente en Se tiene
Como diente.
para toda x, el conjunto S es linealmente indepen-
para la indeAhora se demostrará por qué es suficiente que pendencia lineal. Considérese la ecuación usual para comprobar la independencia lineal:
Después de derivar esta ecuación se tiene el sistema
270
ALGEBRA LINEAL CON APLICACIONES
y por la regla de Cramer este sistema admite solamente la solución cero cuando
Con conjuntos mayores de funciones se tiene este resultado: El conjunto
es linealmente independiente si
para alguna x en [a, b].
Ortogonalidad
Puede definirse un producto interno en
mediente
donde es una función continua fija, positiva en se le llama una función de peso. La elección más simple para Una vez que se ha definido puede decirse "f es ortogonal a g si "la norma de o bien se puede enunciar cualquiera otra proposición que tenga un significado en un espacio con producto interno. Puede incluso hablarse del "ángulo" entre dos funciones.
EJEMPLO 7
Solución
sea
Hállense cuando n es par y m es impar.
ESPACIOS VECTORIALES
ya que n + m + 1 es par. Con este producto interno, les.
EJEMPLO8
Solución
con el producto interno En ortonormal para gen
271
son ortogona-
hállese una base
Como el procedimiento de Gram-Schmidt es válido para cualquier espacio vectorial con producto interno, se puede aplicar aquí. Se tiene
Finalmente, se normaliza y se obtiene
272
ÁLGEBRA LINEAL CON APLICACIONES
sea un proAún no hemos comprobado que continuación se hará eso, mostrando que son váliducto interno en dos los cuatro axiomas para un producto interno.
Como La integral definida de una función continua no negativa es cero si y sólo si la función es idénticamente cero. Por tanto, Aunque la estructura de espacio vectorial de espacios tales como no es absolutamente necesaria en cursos introductorios de cálculo, constituye una herramienta importante en el cálculo avanzado y en las matemáticas avanzadas de la ingeniería. En particular, tiene una base ortonormal infinita
Estas funciones de tipo ondulatorio pueden emplearse para representar funciones en en forma definida. Esto es la base del análisis de Fourier, tan potente para analizar problemas de la conducción del calor, la propagación de ondas y la electrostática.
ESPACIOS VECTORIALES
P R O B L E M A S 3.9
1. Sea dados de funciones.
2. Sea res dados de funciones.
273
Calcúlese
para los pares
Calcúlese
para los pa-
3. Para el producto interno en el problema 1, calcúlese
para
4. Para el producto interno en el problema 2, calcúlese
para
5. Si en
se define
muéstrese que éste es un producto interno. 6. En se define un producto interno.
Muéstrese que éste no es
7. En determínese la dependencia o independencia lineal de los siguientes conjuntos de funciones.
es un conjunto linealmente independiente en 8. Muéstrese que y luego con considerando la ecuación 9. ;Por qué no puede utilizarse el wronskiano para determinar la dependenEmpléese el método cia o independencia lineal de directo para determinar la independencia lineal. 10. Recuérdense las desigualdades de Cauchy-Schwarz y del triángulo:
reescríbanse Usando el producto interno las desigualdades de arriba, sustituyendo x y y por / y g, respectivamente.
ÁLGEBRA LINEAL CON APLICACIONES
274
11. Usando el producto interno en el problema 1, hállese el ángulo entre x y son vectores, entonces Recuérdese: si 12. Considérese gen
con el producto interno Hállese una base ortonormal de V. La base consta de los tres primeros polinomios de Legendre.
13. Muéstrese que el conjunto de soluciones para/" = y forma un subespacio de Demuéstrese además que la dimensión es de al menos dos. 14. Considérese el subespacio W de consistente en todos los polinomios. Defínase el producto interno Obténgase una base ortonormal para V. La base esta constituida por los dos primeros polinomios de Laguerre.
RESUMEN
Los espacios vectoriales son una de las estructuras más importantes en las matemáticas aplicadas; en este capítulo se definieron y se desarrollaron. Algunos, como E", son generalizaciones directas del espacio bidimensional y tridimensional mientras que otros, como los espacios vectoriales de polinomios, funciones o matrices, surgen en el cálculo, en las ecuaciones diferenciales o en las matemáticas aplicadas. Independientemente de su apariencia, los espacio vectoriales generados finitamente tienen atributos comunes, tales como los axiomas de definición, la estructura de subespacio, las bases y la dimensión. El problema de la base se planteó como uno de los problemas fundamentales de álgebra lineal. Su solución resulta ser extremadamente importante en el capítulo 5, donde se analiza la diagonalización de las matrices. En este punto su importancia radica en el análisis de problemas aplicados (el análisis del espín del electrón y la resolución de fuerzas en sus componentes normal y tangencial no son más que dos ejemplos). Por el teorema fundamental enunciado en este capítulo queda garantizada una base5 para todo espacio vectorial generado finitamente. De hecho, la demostración sirvió para hacer ver que puede "construirse" una base a partir de cualquier conjunto de vectores que genera a V. Para una base dada, la representación de cualquier vector x en V es única, y los coeficientes en la combinación lineal de los vectores base para x se llaman coordenadas de x en esa base. El desarrollo de estos conceptos se basó en gran medida en los conceptos de dependencia e independencia lineal. Las bases ortonormales tienen algunas propiedades "agradables"; en el capítulo 5 se sacará provecho de ellas. Las bases no son únicas. Sí S y T son dos bases para un espacio vectorial V y x está en V, entonces las coordenadas de x en S y en T están relacionadas mediante la matriz de transición. Las matrices de transición se emplearán en el capítulo 4 como ayuda en la representación de funciones importantes, llamadas transformaciones lineales. 5
Donde el conjunto generador sólo contiene vectores no nulos.
ESPACIOS VECTORlALES
275
En cálculo, es necesario definir primero la estructura de los números reales para poder definir el concepto de función. De manera similar, debido a que las funciones lineales que estudiamos tienen dominios e imágenes que son espacios vectoriales, estamos listos para proceder a la definición de las transformaciones lineales, en el capítulo 4. PROBLEMAS ADICIONALES
1. Sea
¿Es V un espacio vectorial?
2. Sea
¿Es V un espacio vectorial?
3. Sea
una base para un espacio vectorial complejo V. ¿Es una base de V?
4. Sea una base para y sea , una matirz real. ¿Es una base para E21 ¿Hay alguna diferencia si A es singular? 5. Supóngase que jo
es una base de un espacio vectorial compleuna base de V? Supóngase que para
debe ser una base ortonormal de E2, ¿cuánto valen c y d en términos de a y b? ¿Qué condición debe cumplir
6. Si
7. Sea A una matriz de que P es simétrica y que P2 = P.
Muéstrese
8. Hállese la primera columna de la matriz
de tal manera que esta matriz sea ortogonal. 9. ¿Es el conjunto de todas las matrices ortogonales de n x n un subespacio de
10. Sea A una matriz de n x n fija. Sea V el conjunto de todas las matrices de la forma P- 1AP, donde P puede ser cualquier matriz invertible de n x n. ¿Es V un subespacio de 11. Sea V el conjunto de las soluciones de número complejo. V está dotado con las operaciones de pacio vectorial?
siendo c un ¿Es V un es-
276
ALGEBRA LINEAL CON APLICACIONES
12. Muéstrese que si A y B son matrices hermitianas de n x n, entonces i(AB — BA) es hermitiana. 13. La aproximación de una función dada mediante otras funciones es una técnica común en las matemáticas aplicadas. Sea g(x) la función dada, x en [a, b]. Para efectuar la aproximación, es necesario definir un espacio vectorial de dimensión finita V, definido en [a, b], y asegurarse que el espacio vectorial tiene un producto interno (el cual genera una norma). La norma deg, debe ser un número finito. Entonces si S tales que una base de V, se trata de hallar constantes
sea tan pequeño como sea posible. Este proceso de minimización se simplifica si 5 es una base ortonormal, ya que en ese caso la mejor aproximación es
Aproxime cio vectorial
mediante un polinomio cuadrático. Empléese el espacon el producto interno definido por
14. Supóngase que en un espacio vectorial real V con base se define un producto interno para el cual la base no es ortogonal. Defínase Muéstrese que G y además que G es simétrica. En física matemética, a G se le llama la métrica del espacio vectorial. 15. Con respecto al problema 14, muéstrese que para vectores x y y en Fcon x
16. Empléese el resultado del problema 15 para mostrar que para cualquier vector no nulo X en En,
Esto significa que la métrica de un espacio vectorial es una matriz definida positiva.
4.1 TRANSFORMACIONES LINEALES El objetivo principal del álgebra lineal es el análisis de las funciones lineales definidas sobre un espacio vectorial de dimensión finita. Un ejemplo de este tipo es el del análisis de la transformación de corte. Primero se definirá el concepto de función o transformación lineal. D E F I N I C I Ó N 4.1.1
Sean V y W espacios vectoriales reales (sus dimensiones pueden ser diferentes), y sea T una función cuyo dominio es V y cuyo codominio es W (se escribe T: V — W). Se dice que T es una transformación lineal si a) Para cualesquiera b) Para cualquier
(T es aditiva). (T es homogénea).
Si Vy W son espacios vectoriales complejos, la definición es la misma, excepto se le da a T el nombre de operador lineal. que en EJEMPLO 1
Solución
Sean V = W = E1 y T(x) = mx, donde m es un número real constante. Demuéstrese que T es una transformación lineal. Hay que mostrar que T es aditiva y homogénea. Para la aditividad, sean x y y elementos de E1; entonces
Como T(x + y) = T(x) + T(y), entonces T es aditiva. T también es homogénea ya que
ÁLGEBRA LINEAL CON APLICACIONES
278
Por tanto, T es una transformación lineal. EJEMPLO2
Solución
Sean meros reales y
Para se define donde m y b son núMuéstrese que F no es una transformación lineal.
Primero se comprueba la aditividad, notando que
Pero
Como lineal.
así que
EJEMPLO 3
Sean
EJEMPLO4
Supóngase que
para
es no
y defínase, para mediante Es decir, T es la derivación. Del cálculo se sabe que para funpor lo cual es lineal. ciones derivables funciones de valor real definidas y continuas en Entonces es lineal porque, según el cálculo, para funciones integrables
EJEMPLO5
Sean Entonces
EJEMPLO6
Defínase mediante para es lineal por las propiedades de la traza de una matriz.
Sean y defínase es lineal por las propiedades de la transpuesta.
para A en
Entonces T
En los ejemplos 1 y 2, las gráficas de las funciones T y F son líneas rectas, a pesar de lo cual se vio en el ejemplo 2 que F es no lineal. La y F es el término constante. Si hay linealidad; si no hay linealiEsto da una pista para encontrar la dad. En los ejemplos del 3 al 6, primera propiedad de las transformaciones lineales. TEOREMA 4.1.1
Sean V y W espacios vectoriales. es una transformación lineal, entonces (Los subíndices sirven para identificar el espacio vectorial al que pertenece el cero.)
TRANSFORMACIONES LINEALES Y SUS MATRICES
Demostración
279
Como
y así
la única forma en que la última ecuación puede
Por la unicidad de ser válida es
Este teorema se puede utilizar a veces para demostrar que una transformación es no lineal. Una consecuencia lógica del teorema es Si
EJEMPLO7
Muéstrese que
entonces T es no lineal.
definida por
es no lineal. Por tanto, T no es lineal.
Solución En
EJEMPLO 8
Sea
definida por
Muéstrese que a pesar de que Solución
es no lineal.
De aquí no se que es el cero de Se tiene puede concluir nada; debe emplearse la definición de linealidad. Para comprobar la aditividad se calcula
ÁLGEBRA LINEAL CON APLICACIONES
280
se concluye que T es no lineal. En la mayor Como parte de los casos, para determinar la linealidad o no linealidad de una transformación, hay que usar la definición. EJEMPLO9
Muéstrese que las transformaciones siguientes son lineales. definida por
definida por
donde v es un vector fijo en definida por
donde a, b y c son números reales fijos definida por
definida por
definida por
Solución
Las partes de la a) a la e) se dejan para los problemas.
TRANSFORMACIONES LINEALES Y SUS MATRICES
281
Por tanto, T es lineal. E J E M P L O 10
Solución
E J E M P L O 11
Muéstrese que
definida por
es no lineal.
Se sabe que a menos que pero puede tener una parte imaginaria diferente de cero. Por tanto, T no es lineal. No obstante, T se llama lineal conjugada porque
Sean mediante
Sea M una matriz real de
Defínase
T es lineal ya que por el álgebra matricial
E J E M P L O 12
Sean Defínase matricial
tomada de una matriz de Entonces T es lineal ya que por el álgebra
A continuación se mencionarán algunas transformaciones lineales especiales que serán utilizadas más adelante. La transformación cero se define como
La transformación identidad I de V a V se define como para todo La transformación contracción para todo La transformación dilatación para todo
ALGEBRA LINEAL CON APLICACIONES
282
Figura 4.1.1
En los problemas se pide verificar que éstas sean realmente transformaciones lineales. Aunque ya se han dado varios ejemplos de transformaciones lineales, todavía no se ha iniciado el análisis de las transformaciones lineales. En álgebra, el análisis de las funciones se llevó a cabo con gráficas de las funciones. En el caso presente, sin embargo, habrá que contentarse con un tipo de gráficas diferente al de las usadas en álgebra. Usualmente se dibujan "gráficas", como las indicadas en la figura 4.1.1, siempre que sea posible. Por lo general, esto sólo se puede hacer cuando V y W son versiones de En, n = 1,2 o 3. En otros casos se requiere bastante imaginación. Considérese el ejemplo 13. E J E M P L O 13
Solución
"Grafíquese" la transformación
definida por
En la figura 4.1.2 se muestran las visualizaciones de E2 y E3, así como algunos vectores especiales. En esa figura se muestra también la representación de algunos de esos vectores después de haber actuado T sobre ellos. Si se colocan más vectores de nódulo (longitud) 1 en el círculo de la figura 4.1.2a, los puntos terminales de las imágenes se encontrarán sobre el círculo de radio como en la figura 4.2.2b. Esto apoya la idea intuitiva de que T "reduce" todos los vectores en el dominio, de manera muy similar a una transformación de contracción. Como las gráficas no son sencillas para las transformaciones lineales, deberemos ser capaces de analizarlas sin ayuda de las gráficas. A menos que se indique otra cosa, de aquí en adelante se supondrá que los espacios vectoriales
Figura 4.1.2
TRANSFORMACIONES LINEALES Y SUS MATRICES
283
son de dimensión finita. Una de las herramientas básicas en el análisis de las transformaciones lineales en la siguiente:
Problema del núcleo
El problema del núcleo en general es muy parecido al programa de álgebra de
la solución de la ecuación (por ejemplo, En álgebra este problema se resuelve factorizando o bien empleando la fórmula cuadrática. En álgebra lineal el problema del núcleo se reduce, en muchas ocasiones, a la solución de m ecuaciones con n incógnitas (el "primer problema básico del álgebra lineal"). E J E M P L O 14
Hállese
donde
Solución Como
se define como se debe resolver
es decir,
Las ecuaciones resultantes son
cuya solución es
Por tanto,
En este ejemplo, el núcleo de la transformación lineal dada es un subespacio del dominio. De hecho, una base para ker T es {(-1, 1, 1)}. El núcleo de una transformación lineal es siempre un espacio vectorial. T E O R E M A 4.1.2
Demostración
Sean V y W espacios vectoriales, y sea conjunto ker T es un subespacio de V.
una transformación lineal. El
Hay que demostrar que ker T es El núcleo de T es no vacío ya que cerrado ante la suma y la multiplicación por un escalar. Recuérdese que están en ker T, y sea c un númeSupóngase que ker T si y sólo si ro. Por la linealidad de T,
ÁLGEBRA LINEAL CON APLICACIONES
284
Por lo tanto, ker T es un subespacio de V.
así que
Como ker T es un subespacio de V, tiene entonces una dimensión. La dimensión de ker T se llama la nulidad de T. La transformación lineal del ejemplo 14 tiene nulidad 1. Esto se escribe
E J E M P L O 15
Calcúlese
para la transformación lineal
definida por
Hállese una base para ker T. Solución
Debemos hallar el conjunto de todos los vectores tales que En otras palabras, hay que resolver la ecuación
La solución es
y ker
En consecuencia, dim Una base es
Figura 4.1.3
por lo que
TRANSFORMACIONES LINEALES Y SUS MATRICES
285
Para continuar el análisis de las transformaciones lineales, se considerará la imagen de T. En álgebra es importante hallar la imagen de una función f para ficar Por ejemplo, tiene la imagen Las soluciones de (Es decir, el núcleo de Toda esta información se muestra en la figura 4.1.3. No siempre es posible emplear la imagen de una transformación lineal para dibujar una gráfica de T, pero es muy útil en otras formas. D E F I N I C I Ó N 4.1.2
E J E M P L O 16
Solución
una transformación lineal. El recorrido de T es el conjunto de todos los posibles v en W tales que y en W tales que y = T(x) para algún x en V. El recorrido de T se escribe (T). El recorrido de T es un subespacio de W (véanse los problemas).
Sea
Defínase T de E3 a E3 mediante T((a, b, c)) = (a - b + c, 2a + b - c, - a - 2b + 2c). Determínense (T) y dim (T). Hállense dos vectores en (T) y dos vectores que no estén en (T). Hállese una base para (T). Calcúlese ker T. Grafíquense ker T y (T). Si es posible, trácese una gráfica de T. Supóngase que y = (y1, y2, y3) está en (7). Entonces y = T((a, b, c)) para algún vector (a, b, c) en E3. Es decir, la ecuación y = T((a, b, c)) debe ser consistente. Se reducen las ecuaciones y se observa a qué condiciones obliga la consistencia. Las ecuaciones son
y se reducen a
Así, si Es decir,
ha de estar en la imagen de T, entonces imagen de
Alda un criterio para su inclusión en La condición impuesta a Algunos vectores que no están gunos vectores en (T) son La dimensión de (T) es 2, porque la ecuación en (T)son reduce el número de variables independientes a dos. Para obtener una base, pueden utilizarse (-2, -1, -1) y (0, -1, 1) mencionados antes, ya que son linealmente independientes en la imagen, y dim (T) = 2. De hecho, dos vectores linealmente independientes en (T) forman una base de
ÁLGEBRA LINEAL CON APLICACIONES
286
Figura 4.1.4 Gráfica de la transformación en el ejemplo 16. El núcleo de T es la recta generada por (0, 1 , 1 ) . E recorrido, sombreado, a la derecha es el plano generado por (0, -1, 1) y (-2, -1, -1). El plano está inclinado de tal modo que la parte superior derecha sale de la página. En la gráfica se ha truncado.
El núcleo de se halla sustituyendo en las ecuaciones lineales de arriba. Se obtiene ker Las gráficas se muestran en la figura 4.1.4. La dimensión de la imagen de una transformación lineal T se llama rango de y se escribe Es decir,
El rango y la nulidad de una transformación lineal se relacionan una con otra mediante la ecuación rango de T + nulidad de T = dim (dominio) Éste es el resultado del siguiente teorema básico, uno de los más importantes en álgebra lineal:
TEORE MA 4.1.3
Si T: V — W es una transformación lineal y dim V = n, entonces
Antes de demostrar este teorema, se explicará su uso mediante un ejemplo. E J E M P L O 17
Solución
Hállese la nulidad de la transformación lineal del ejemplo 16. Se tenía y se halló que ecuación (4.1.1) lleva a
Como
la
TRANSFORMACIONES LINEALES Y SUS MATRICES
287
Demostración del Como ker T y la imagen de T son espacios vectoriales, ¡ teorema 4.1.3 nidos. Se considerarán tres casos:
están defi-
Caso 1:
Supóngase que Es decir, supóngase que cualquier Se obtendrá una contradicción. Como conjunto con más de k vectores en la imagen de T es linealmente dependiente. Supóngase que es una base para V. Como debe ser linealmente dependiente, por lo que deben existir no todas cero, tales que
Así, por linealidad y no todas las c, son cero, se tiene que dependiente, lo cual es una contradicción. Por tanto,
Como
es linealmente
Como ker T es un subespacio de V y dim Caso 2: Por tanto, imagen para todo V, en realidad se tiene ker En consecuencia, de una base para ker Caso 3 Por un resultado previo, B puede ampliarse a la base Entonces se mostrará que ya que dim Se tiene es una base para
es linealmente independiente Considérese
Por la linealidad de T, y así Es decir,
está en ker
Entonces existen
con
ÁLGEBRA LINEAL CON APLICACIONES
288
y como S es una base para V, se sabe que Por tanto, es linealmente independiente. Supóngase que y está en la imagen de T, de tal modo que y = para algún Como S es una base de V, puede escribirse y por tanto,
En consecuencia, E J E M P L O 18
"Grafíquese"
definida por indicando ker
Solución Resolviendo
y se halla
Para determinar ker T se toma La solución de las ecuaciones resultantes por lo cual ker es En la ecuación (4.1.2) se ve que En la figura 4.1.5 se muestra una gráfica. Otras dos formas de ver la acción de una transformación lineal consisten en determinar las imágenes, debidas a T, de figuras geométricas tales como cuadrados y círculos.
Figura 4.1.5
Gráfica de la T del ejemplo 18.
ker T = línea recta que contiene (-1, -2, 1)
Imagen de T = plano que contiene (1, 0, 3) y (0, 1, 2)
TRANSFORM ACIONES LINEALES Y SUS MATRICES
Figura 4.1.6
Cuadrado unitario.
E J E M P L O 19
Puede mostrarse (véanse los problemas) que si T: mación lineal definida por
289
Figura 4.1.7
Imagen del cuadrado unitario de la figura 4.1.6.
es una transfor-
donde A es una matriz no singular, entonces la imagen de un segmento de recta de P a Q en E2 será un segmento de recta de T(P) a T(Q). Sea T definida como
Hállese la imagen, debida a T, del "cuadrado unitario" que se muestra en la figura 4.1.6. Solución
Se hallarán las imágenes de los vértices. Como cada lado del cuadrado es un segmento de recta, la imagen del cuadrado será la figura generada al unir las imágenes de los vértices mediante un segmento de recta. Se tiene
Por tanto, la imagen es el paralelogramo mostrado en la figura 4.1.7. Nótese que se asocian puntos con puntos terminales de los vectores naturalmente asociados con los elementos de
ÁLGEBRA LINEAL CON APLICACIONES
290
E J E M P L O 20
Muéstrese que
definida por
transforma el círculo unitario Solución
1 en una elipse.
Como la imagen de
debida a T es
se tiene
Por tanto, la imagen del círculo es una elipse. Esta acción de T se muestra en la figura 4.1.8. Una interpretación de la figura 4.1.8 es que T dilata con constante 3 en la dirección x2 y constante 2 en la dirección x1. E J E M P L O 21
Figura 4.1.8
T que actúa sobre el círculo unitario.
Muéstrese que
definida por
TRANSFORMACIONES LINEALES Y SUS MATRICES
291
Figura 4.1.9
Imagen de la esfera en el ejemplo 21.
transforma la esfera Solución
en un elipsoide.
La imagen de
Al dividir entre R2 se obtiene
la cual es una ecuación para el elipsoide que se muestra en la figura 4.1.9. Hay ejemplos importantes de transformaciones lineales que no pueden ser analizados geométricamente, excepto en alguna forma generalizada. Uno de esos ejemplos es definida por
Es decir, para
es la función obtenida en cada x multiplicando
Esta transformación lineal es un caso especial del operador de coordenadas en mecánica cuántica. Si se admiten los espacios vectoriales complejos y se considera el conjunto de los polinomios de enésimo grado, con coeficientes complejos y las mismas Puede definirse una se tendrá el espacio vectorial operaciones que transformación
292
ALGEBRA LINEAL CON APLICACIONES
es decir,
T es lineal, y la regla para T es la misma que la regla para el operador de moméntum en mecánica cuántica. Sin embargo, el operador de moméntum tiene un dominio diferente.
PROBLEMAS 4.1
1. Determínese si las transformaciones siguientes
son lineales.
2. Determínese si las transformaciones siguientes definidas sobre neales.
son li-
(donde / es la matriz identidad) (donde k es un número real),
(traza de A = suma de los elementos de la diagonal) 3. Determínese si las transformaciones siguientes
son lineales.
TRANSFORMACIONES LINEALES Y SUS MATRICES
293
4. Determínese si las transformaciones siguientes
son lineales.
5. Para cada una de las transformaciones lineales del problema 1, determínense el núcleo y el recorrido de T, hállense bases para el núcleo y el recorrido, y verifiqúese la ecuación dim (dominio 7). Dibújese una "gráfica" de T como en los ejemplos 13 y 19. 6. Para cada una de las transformaciones lineales del problema 2, determínense ker T y (T), hállense bases para ker T y (T), y compruébese la ecuación dim (dominio 7). 7. Para cada una de las transformaciones lineales del problema 3, determínense ker T y (T), hállense bases para ker T y (T), y compruébese la ecuación dim (dominio 7). 8. Muéstrese que la transformación cero es lineal. 9. Muéstrese que la transformación identidad es lineal. 10. Muéstrese que un operador de contracción es lineal. 11. Muéstrese que una transformación de dilatación es lineal. 12. Muéstrese que una transformación lineal
transforma al círculo
definida por
en la elipse
13. Dibújese la imagen, debida a T, del cuadrado unitario en E2 para T definida como
14. Muéstrese que la condición de aditividad T(x + y) = T(x) + T(y) implica que T(nx) = nT(x) para cualquier entero positivo n. 15. Muéstrese que la condición de aditividad T(x + y) = T(x) + T(y) implica que T((p/q)x) = (p/q)T(x), donde p y q son enteros positivos. [Sugerencia: por el problema 14, pT(x) = T(px) = T(q(p/q)x).]
294
ALGEBRA LINEAL CON APLICACIONES
16. Muéstrese que la definición siguiente es equivalente a la definición 4.1.1: Sean V y W espacios vectoriales, y sea T una función con dominio V e imagen en W. Entonces T es una transformación lineal si para W una transformación lineal. Muéstrese que el recorrido de T 17. Sea es un subespacio de W. 18. Complétense los detalles en el ejemplo 9, de la parte a a la e. 19. Verifíquese que el operador de coordenadas definido en esta sección sea lineal. 20. Verifíquese que el operador de moméntum definido en esta sección sea lineal. 21. Sea lineal, y supóngase que T((l,0, 1)) = (1, -1, 3) y T((2, 1,0)) = (0, 2, 1). Determínese 71(8, 3, 2)). [Sugerencia: escríbase (8, 3, 2) como una combinación lineal de (1, 0, 1) y (2, 1, 0), y empléese la linealidad de T.] 22. Considerando a T como en el problema 21, calcúlense T((1, 2, -3)) y T((4, 4, 12)). 23. Considerando a T como en el problema 21, ¿por qué T((3, 0, 4)) no puede calcularse a partir de la información dada? 24. Defínase
para cada
mediante
¿Es T una transformación lineal? 25. Defínase
mediante
donde M es una matriz real invertible de 2 x 2. Muéstrese que la imagen debida a T de una recta es de nuevo una recta. [Sugerencia: descríbase una recta en el dominio mediante su ecuación vectorial; luego empléese la linealidad de T]
295
TRANSFORMACIONES LINEALES Y SUS MATRICES
4.2 EL PROBLEMA DE LA REPRESENTACIÓN MATRICIAL DE LAS TRANSFORMACIONES LINEALES Los métodos de la sección 4.1 se pueden utilizar para analizar sistemas de ecuaciones lineales. Para un conjunto de ecuaciones
la matriz en el lado izquierdo representa una transformación lineal de porque, por las leyes de álgebra matricial, El núcleo de la transformación lineal es el conjunto solución para la ecuación homogénea El recorrido de la transformación lineal es el conjunto de todos los vectores B para los cuales AX = B tiene una solución. La "ecuación rango-kernel" del teorema 4.1.3 de la sección 4.1 significa que dim (espacio solución de AX
+ dim (recorrido) = n
Pero de capítulos anteriores sabemos que la dimensión del espacio solución es el número de renglones cero de la forma escalonada reducida por renglones de A. Por tanto, la ecuación anterior se puede escribir como (dim del espacio solución de AX lumnas de A EJEMPLO 1
Solución
(rango de A) = n = número de co-
Hállese la dimensión del espacio solución de AX =
donde
Como n = 4, si calculamos rango de A, entonces 4 - rango de A es el número que buscamos. Como rango de A = rango renglón de A, reducimos A por renglones:
para obtener rango de A = 2 . Por tanto, la dimensión del espacio solución de Obsérvese que éste es también el número de incógnitas que
296
ALGEBRA LINEAL CON APLICACIONES
pueden fijarse de manera arbitraria. De ahí la terminología 2 grados de libertad. El ejemplo 1 muestra este principio general: Si T es una transformación lineal generada por una matriz A, entonces pueden hallarse reduciendo por renglones la matriz A. Es decir, puede obtenerse información acerca de una transformación lineal analizando una matriz. Por esta razón (y otras que aparecerán más adelante), la representación de una transformación lineal mediante una matriz es importante. Así llegarnos al tercer problema básico de álgebra lineal. Tercer problema básico de álgebra lineal
Dada una transformación lineal donde dim V = n y dim W = hallar una matriz A de m x n que "represente" a T. Antes de establecer con precisión el significado de la palabra representar, se considerarán algunos ejemplos. E J E M P L O 2
Considérese la transformación identidad definida por Sea X donde es la base ordenada canónica {(1, 0, 0), (0, 1,0), (0, 0, 1)}. Entonces.
cuando
Así,
La acción de la transformación identidad está representada mediante una multiplicación matricial de matrices de coordenadas por la matriz identidad I. E J E M P L O 3
Considérese la proyección como en el ejemplo 2, Para
definida por
TRANSFORMACIONES LINEALES Y SUS MATRICES
297
se ve que la acción de P está representada mediante la multiplicación matricial por
Nótese que P(P(X)) = P(X); además MM = M. Tenemos a la proyección representada por una matriz idempotente. EJEMPLO4
Considérese la derivación emplea la base ordenada canónica
definida por D(a + bx) = b. Si se {1, x}, entonces
y se puede escribir
Pero la matriz
satisface
es decir, la acción de D está representada mediante la multiplicación por M. Se observa que
y que
La transformación D está representada por una matriz que es nilpotente con exponente 2. Esto significa que la segunda derivada de un polinomio de primer grado es cero. Los ejemplos 2 al 4 dependen del hecho de haber usado la base canónica para representar los vectores en cada espacio vectorial. Se verá que en general la matriz representativa depende de las bases empleadas para el dominio y la imagen.
298
ALGEBRA LINEAL CON APLICACIONES
Solución del problema de la representación
El principio básico que sirve de guía para la solución del problema de la base para una transformación lineal es el siguiente: Si dim es una base para V, entonces la imagen de T puede describirse completamente en términos de las imágenes de los vectores base. Para ver esto, sea cualquier vector en V. Existen constantes tales Entonces, y se ve que cada elemento en la imagen es una combinación lineal de las imágenes de los elementos de la base. Es decir, que
El procedimiento para resolver el problema de la representación es el siguiente: Supóngase de dim V, y supóngase que dim denada para W.
es una base ordenada para es una base or-
1. Calcúlense 2. Hállense los vectores de coordenadas 3. Escríbase la matriz con columnas iguales a los vectores columna calculados en el paso 2:
Figura 4.2.1 Representación de T: V W mediante M. Este diagrama representa el hecho de que la acción de T sobre x puede hallarse mediante Hallando el vector de coordenadas de x con respecto a Multiplicando por para obtener el vector de coordenadas de con respecto a Usando la base para calcular y en se nota que, si se cambian las bases, M puede cambiar.
La matriz M de m x n representa a T, como se indica en la figura 4.2.1. Siempre que sea necesario escribiremos MT para denotar la matriz de T. El diagrama da el contenido del teorema que se enunciará para resolver el problema de la representación. Antes de enunciar el teorema, se presentarán varios ejemplos. En dichos ejemplos se escribirá para indicar el espacio vectorial V con base
TRANSFORMACIONES LINEALES Y SUS MATRICES
EJEMPLO5
299
definida por Sea la matriz M que representa T cuando
Hállese
la base canónica
En cada caso calcúlese T((3,2)) directamente y luego usando M. por lo que
Solución
por lo que La matriz es
De la definición de T se tiene que T((3, 2)) = (7, 1). Pero
así que
y finalmente,
se dice que M es la matriz de T con respecto a En este caso, como la base canónica, M se llama la matriz canónica de Además, como b) Se trabaja como en a): por lo que por lo que
300
ÁLGEBRA LINEAL CON APLICACIONES
Así se tiene la matriz de T con respecto a
De la definición de T, T((3, 2)) = (7, 1); como
usando la matriz M se tiene
Finalmente,
c) Este caso difiere de b) en que el orden de te, los cálculos son similares:
Por tanto, la matriz de T con respecto a
se ha invertido. No obstan-
es
Nótese que esta matriz difiere de la matriz representativa en b), porque se ha efectuado un intercambio de renglones y columnas. El cálculo de T((3, 2)) se deja al lector. d) En este caso pero puede aplicarse el procedimiento usual. por lo que por lo que La matriz de T con respecto a
es
TRANSFORMACIONES LINEALES Y SUS MATRICES
301
Para calcular T((3, 2)) en dos formas, T((3, 2)) = (7, 1) por definición pero también
e) Los detalles de esta parte se dejan al lector. La matriz en este caso es
Nótese que la diferencia entre d) y e) es que el orden de la base en la imagen está invertido. Esto dio por resultado un intercambio de renglones en la matriz representativa. Ya que se han resuelto algunos ejemplos, se enunciará y demostrará el teorema que da el procedimiento a seguir para resolver el problema de la representación. T E O R E M A 4.2.1
Demostración
donde dim (Solución al problema de la representación) Sea una transformación lineal. Sean respectivamente. Existe una matriz con la propiedad de que para, todo n (única para las bases ordenadas es una base, hay un conjunto único Ahora bien, por la linealidad de Para cada está en W y se puede representar mediante los elementos de la ba-
Debido a que de constantes tales que Sea
se para
Por tanto,
ALGEBRA LINEAL CON APLICACIONES
302
y después de agrupar términos se tiene
Los coeficientes de productos renglón-columna de
en la última expresión son exactamente los
Por tanto, la matriz las columnas de la cual son los vectores de coordenadas de es la matriz deseada. La matriz es única para el par de bases, ya que los vectores de coordenadas son únicos en una base dada. EJEMPI. O6
Solución
definida por tienen las bases canónicas respectivamente. Hállese la matriz de T con respecto a estas bases. Hágase lo mismo con definida por Sea
Como T(1) = x, entonces
De manera parecida
Para la transformación L,
por lo que
TRANSFORMACIONES LINEALES Y SUS MATRICES
303
Así,
y la matriz
que representa a L es
Obsérvese que
por lo que a ML se le podría llamar inversa por la izquierda de MT. Sin embargo,
y MT no es una inversa por la izquierda de ML. Observe que T es simplemente la antiderivación con la constante arbitraria igualada a cero. Cuando se antideriva y luego se deriva, se obtiene la función original. Esto se refleja en MLMT = I. EJEMPLO7
Sea
definida por
hállese la matriz de T con respecto a Solución
Primero se calculan las imágenes de los vectores base:
tiene la base canónica
ÁLGEBRA LINEAL CON APLICACIONES
304 .
Por tanto,
EJEMPLO 8
Defínase tiene la base
mediante
Supóngase que Calcúlese
Solución
Por lo tanto,
Un poco del álgebra de las transformaciones lineales Sean V y W espacios vectoriales y sean L y T transformaciones lineales de V a W. Se puede definir el múltiplo escalar rL de L y la suma L + T de L y T como transformaciones lineales de V a W mediante las reglas
Si ML y MT son las matrices representativas con respecto a las bases respectivamente, entonces rML representa a rL y ML + MT representa a L + T. Esto se puede probar mediante el método de demostración del teorema 4.2.1. EJEMPLO9
Considérese T definida como en el ejemplo 5a, y defínase Las matrices canónicas para T y L son
Así que T + L está definida como
como
TRANSFORMACIONES LINEALES Y SUS MATRICES
305
y rT está definida como
La matriz canónica para T + L es
y la matriz canónica para rT es
Cálculos directos muestran que
P R O B L E M A S 4.2
1. En los conjuntos siguientes de ecuaciones homogéneas AX = 0, calcúlense rango de A, dim (espacio solución), y compruébese que dim (espacio solución) + rango de A = número de columnas de A
hállese la matriz T, supo2. En las transformaciones siguientes niendo que las bases para V y W son las bases canónicas.
306
ÁLGEBRA LINEAL CON APLICACIONES
3. Sea definida por gase además que E3 tiene la base canónica y que E2 tiene la base
Supón-
1), (1,-D).
a) Hállese la matriz de T con respecto a estas bases. b) Calcúlese T((1, -1, 2)) directamente y usando la matriz de T. 4. Sea definida por supóngase que E? tiene la base a) Hállese la matriz de T con respecto a b) Calcúlese T((1, 1, 1)) directamente y usando la matriz de T. una transformación lineal con la propiedad Hállese una representación matricial para T. [Sugerencia: para el dominio tómese como una base.]
5. Sea
6. Defínase mediante defínase mediante Hállense las matrices de L y R con respecto a la base canónica. 7. Muéstrese que la matriz que representa a la transformación cero es la matriz cero, independientemente de la base. 8. Muéstrese que una transformación de contracción o dilatación de V a V tiene una representación matricial diagonal independientemente de la base que tenga V (la misma base en el dominio y la imagen). 9. Sea T definida por
como el operador de coordenadas
Muéstrese que la matriz canónica de T es
10. Sea T el operador del moméntum definido al final de la sección 4.1. Si tiene la base ordenada canónica muéstrese que la matriz canónica de T es
TRANSFORMACIONES LINEALES Y SUS MATRICES
11. Para las transformaciones siguientes de T.
307
hállese la matriz canónica
4.3 MATRICES SIMILARES Y CAMBIO DE BASE El propósito de una representación matricial M para una transformación lineal T es permitirnos analizar T trabajando con M. Si es fácil trabajar con M, ya se ha ganado algo; en caso contrario, no hay ninguna ventaja. Como bases diferentes dan por resultado matrices diferentes, la elección "correcta" de una base para obtener una matriz M sencilla es importante. La elección adecuada de una base no es obvia, como se verá en el ejemplo que sigue. E J E M P L O 1
Muéstrese que tiene la matriz canónica.
definida por
Luego muéstrese que, con respecto a la base representación matricial diagonal. Solución
Para la matriz canónica se tiene
tiene una
308
ALGEBRA LINEAL CON APLICACIONES
Pero con respecto a por lo que por lo que y la matriz con respecto a
Por el álgebra matricial sabemos que, en ciertas operaciones, los cálculos son más fáciles si las matrices son diagonales: inversión, multiplicación y determinantes, por citar sólo tres. Al crecer la dimensión de los espacios vectoriales (y el tamaño de las matrices), esta situación se acentúa. Es necesario, por tanto, hallar una forma de obtener la matriz más simple posible para representar una transformación T. Para resolver este problema (en el capítulo 5 se da una solución), hay que descubrir cómo relacionar las diferentes representaciones matriciales de una transformación lineal dada. Se restringirá la atención al caso V = W con la misma base en V y W. Éste es el caso que ocurre con más frecuencia en las aplicaciones. es la matriz que representa a Para hallar la relación, supóngase que y que representa a Sea P la matriz a la base de manera que para cualquier x en V, de transición de la base
Por tanto, para todo
en
por lo que Estas ecuaciones en realidad constituyen una demostración del resultado básico. T E O R E M A 4.3.1
una transformación lineal con matriz respecto a una base y matriz con respecto a una base Si P es la matriz de transición de la base a la base entonces
Sea
TRANSFORMACIONES LINEALES Y SUS MATRICES
La relación nombre.
D E F I N IC I Ó N 4.3.1
309
P es lo suficientemente importante y merece un
Dos matrices A y B de n x n son similares si existe una matriz invertible P tal que B = P-1AP. Nótese que la definición de ninguna manera indica cómo hallar la transformación de similaridad P. En el caso de dos matrices de representación para una transformación lineal, P es una matriz de transición de una base a otra, como se vio en el teorema 4.3.1. La siguiente es una reformulación importante del teorema 4.3.1:
Sea una transformación lineal. Dos matrices cualesquiera que representen a T son similares.
EJEMPLO2
Solución
En el ejemplo 1, sea la base canónica. Muéstrese el teorema 4.3.1 para como en el ejemplo 1. La matriz canónica, como antes, es
Ahora se calcula la matriz de transición de
Entonces,
310
ALGEBRA LINEAL CON APLICACIONES
Una forma de recordar cómo relacionar las matrices con respecto a es usar el diagrama
El hecho es que la matriz de transición es simplemente la matriz que representa indica la matriz de transia la transformación identidad. La notación Nótese que ción de
y recuérdese que Para aprovechar al máximo el resultado del teorema 4.3.1, se usarán más adelante las propiedades de las matrices similares. T E O R E M A 4.3.2
Las siguientes proposiciones relativas a la similaridad son verdaderas. En todos los casos las matrices son de n x n. a) b) c) d) e) f) g)
La matriz A es similar a A. Si A es similar a B, entonces B es similar a A. Si A es similar a B y B es similar a C, entonces A es similar a C. Si A es similar a B, entonces det A = det B. Si A es similar a B, entonces tr A = tr B. Si A es similar a B, entonces Am es similar a Bm para algún entero positivo m. Si A es similar a B, entonces A es invertible si y sólo si B es invertible. En ese caso A-1 es similar a B - 1 .
[Nota: las partes d), e) y g) dicen, respectivamente, que el determinante, la traza y la invertibilidad son invariantes ante las transformaciones de similaridad.] Demostración
Como A
A es similar a A.
b) Si A es similar a B, entonces Denotando a es similar a A.
por
se tiene
TRANSFORMACIONES LINEALES Y SUS MATRICES
311
c) Si A es similar a B y B es similar a C, se tiene B donde P y Q son, en general, diferentes. Se tiene entonces
Como PQ es invertible, C es similar a A. d) Si B = P -1 AP, entonces
e) Si B = P - 1 AP, y como tr (AB) = tr (BA), se tiene tr B = tr (P -1 AP) = tr (( P - 1 A)P ) = t r (P( P - 1 A)) = tr A.
Entonces B2 es similar a A2 y tiene la misma transformación de similaridad P. Ahora se aplica la inducción. Supóngase para la hipótesis de inducción que Ak es similar a Bk con Bk = P-1AkP. Se mostrará entonces que esto implica que Bk+1 es semejante a Ak+1. Por la hipótesis de inducción
Por tanto,
Así que Bk+1 es similar a Ak+1 mediante la transformación de similaridad P. Por el principio de inducción matemática, f) queda demostrado. g) Como det A = det B, se sabe que det A segunda parte obsérvese que
si y sólo si det B
Para la
ÁLGEBRA LINEAL CON APLICACIONES
312
Las partes d) y e) se pueden mostrar mediante las matrices similares
del ejemplo 1. Las dos matrices tienen traza 5 y determinante -14. El problema de determinar si dos matrices son semejantes o no generalmente es difícil. Pero se pueden emplear las partes d) y e) para descartar la sidet B, A no puede ser similar a B. milaridad: si tr A tr B o bien si det A EJEMPLO3
En los siguientes pares de matrices, determínese si A y B son similares.
Solución a) Aun cuando tr A = tr B, det A b) Como tr A
det B, por lo que A no es similar a B.
tr B, la matriz A no es similar a B.
c) En este caso, las trazas y los determinantes de A y B coinciden, y las similaridad no se puede descartar tan fácilmente. Como A y B son de tamaño pequeño, puede verificarse la ecuación
Si esto se debe cumplir, entonces para una matriz no singular P. Sea
Entonces la ecuación requerida es
TRANSFORMACIONES LINEALES Y SUS MATRICES
313
lo cual lleva a
Por tanto, a y b son arbitrarios, y c = d = 0, lo que da
la cual es una matriz singular. Por tanto, A no es similar a B. Para matrices de tamaño grande, este método de solución no es práctico. P R O B L E M A S 4.3
y bases
En los problemas del 1 al 9 se dan una transformación lineal
a) Hállese la matriz de T con respecto a usando la matriz de transición. b) Hállese la matriz de T con respecto a c) Hállese directamente la matriz de T con respecto a
base canónica base canónica (Ésta es una dilatación. Compárese el resultado de este problema con la solución del problema 8 de la sección anterior.) base canónica 7" como en el problema 3 donde T es una rotación antihoraria de base canónica base canónica base canónica base canónica
radianes.
314
ÁLGEBRA LINEAL CON APLICACIONES
9.
base canónica 10. Muéstrese que si A es similar a B y B es invertible, entonces para a
es similar
11. Se dan parejas de matrices A y B. En cada caso muéstrese que A y B no son semejantes.
12. Muéstrese que si A y B son matrices similares, entonces rango de A = rango de B. (Sugerencia: úsese el hecho de que matrices similares represen tan la misma transformación lineal.) 13. Compárense los resultados de los problemas 3 y 8. ¿Hay una identifica ción razonable de las transformaciones (y V) en estos problemas? 14. Sea M una matriz de m x n. Sea V un espacio vectorial enedimensional con base S, y sea W un espacio vectorial enedimensional con base T. Sea x un elemento de V. Defínase una transformación L de V a W mediante esta regla: L transforma x en V en una y en W como sigue: 1. Sustitúyase x por 2. Calcúlese 3. Sea y el vector en
la matriz de coordenadas de x. con
Muéstrese que la L definida así es lineal. Esto significa que cualquier matriz genera una transformación lineal.
4.4 TRANSFORMACIONES INVERTIBLES Y CLASIFICACIÓN DE LAS TRANSFORMACIONES Uno de los problemas más importantes en las matemáticas aplicadas consiste en resolver
TRANSFORMACIONES LINEALES Y SUS MATRICES
315
donde es una transformación lineal, V es un espacio vectorial, y es dada y debe hallarse x. Si V tiene la base es la matriz de T con respecto a entonces el problema matricial correspondiente es
que es el primer problema fundamental de álgebra lineal. Puede verse entonces la importancia del problema de la representación para reducir ecuaciones de transformación a ecuaciones matriciales, en las matemáticas aplicadas. Si se resuelve la ecuación (4.4.2), en esencia se habrá invertido la transformación T. A continuación se desarrollará este concepto. D E F I N I C I Ó N 4.4.1
Sean donde V, W y Z son espacios vectoriales. La composición de L y T, denotada por L o T, se define para como
En la figura 4.4.1 se muestra gráficamente la definición recién dada. No es difícil definir cadenas mayores de composiciones y ver que
E J E M P L O 1
Supóngase que
están definidas por
Muéstrese que es una transformación lineal. Determínense las matrices canónicas para Muéstrese que la matriz de es el producto de la matriz de L y la matriz de T.
Figura 4.4.1
Composición de transformaciones.
ÁLGEBRA LINEAL CON APLICACIONES
316
Solución Por definición, Ahora supóngase que vectores en
Se tiene Además
por tanto, se tiene lo siguiente:
Es fácil mostrar que es lineal. Al aplicar los métodos de la sección 4.3
Además,
Obsérvese que Esto es el reflejo de algo que ya sabemos: la multiplicación matricial, en general, no es conmutativa. El ejemplo 1 muestra el teorema siguiente.
T E O R E M A 4.4.1
Si
es lineal. respectivamente, entonces
Demostración
son lineales, entonces son las matrices que representan a T,
Para la linealidad, sean u y v vectores en V, y sean r y s números. Según la linealidad de L y T por separado, Por tanto, es lineal. Para mostrar lo relativo a la representación matricial, sean
TRANSFORMACIONES LINEALES Y SUS MATRICES
317
Por lo
Entonces tanto,
Pero se tiene también
Por la unicidad de la representación matricial
Ahora que ya se conoce el concepto de la composición de una transformación, se puede definir la inversa de una transformación. D E F I N I C 1 Ó N 4.4.2
una transformación lineal. La inversa (bilateral) de T es una transformación para la cual Sea
Si
existe, entonces T se llama invertible. Se observa que
es lineal. De hecho,
En el teorema 4.4.2 se enuncian otras propiedades importantes de las inversas. T E O R E M A 4.4.2
una transformación lineal.
Sea
a) Sea M la matriz de T con respecto a existe.. Es más, la matriz para b) T es invertible si y sólo si
Entonces T es invertible si y sólo si en este caso es precisamente [es decir, dim (ker T) = 0].
implica que c) T es invertible si y sólo si (Es decir, T es una función uno a uno.) tenemos
Como
Demostración
(matriz de T por la matriz de Si
denota la matriz para
la última ecuación es
para cualesquiera
ÁLGEBRA LINEAL CON APLICACIONES
318
lo que significa que Por tanto, Supóngase que existe. Como representa a una transformación lineal se sabe que Por tanto, T es invertible. b) Sea dim la matriz de T. Supóngase que T es invertible y Entonces, como rango de T rango de Por tanto, rango de no existe, lo cual es una contradicción ya que, si existe, también debe existir.1 como
rango de T = n. Entonces rango de M = n y M existe. Razose tiene debe existir. nando como en a), se verá que Supóngase que T es invertible y que existen Pero entonces dim Entonces Es decir, lo cual contradice a b). Supóngase que implica que para todos que T no es invertible. Entonces por b) dim Asi pues, ker Tcontiene por lo menos Pero como ker Tes un subespacio, En consecuencia Se tiene así ker ro lo cual contradice la suposición. La parte a) del teorema 4.4.2 establece que la invertibilidad de una transformación se puede determinar si se conoce la invertibilidad de cualquier matriz que la represente. Esto sucede porque si A y B son dos matrices que representen a la misma transformación lineal, entonces son similares." A = Y como det A = det B, la matriz A es invertible si y sólo si la matriz B es invertible. Por tanto, si una de las matrices de representación es invertible, todas las demás lo son (para la misma transformación lineal, claro está). E J E M P L O 2
Solución
definida por Esta función transforma a el producto cruz del vector fijo (a, b, c), con x. Muéstrese que T no es invertible, probando así que no es posible determinar un vector a partir de su producto cruz con un vector conocido (a, b, c).
Sea
Se hallará una matriz M que represente a T y se mostrará que M-1 no existe. Como la similaridad preserva la invertibilidad, puede utilizarse cualquier matriz de representación para determinar la invertibilidad. Se empleará la matriz canónica, ya que es la más fácil para hacer cálculos. Se tiene
1
En el problema 12 de la sección 4.3 se muestra que el rango de T se define como el rango de
TRANSFORMACIONES LINEALES Y SUS MATRICES
319
así que la matriz es
Nótese que M es antisimétrica. Como det M = abc - abc = 0, M-1 no existe. Por tanto, T no es invertible. EJEMPLO3
Figura 4.4.2
a) Corte. b) Corte con vectores.
(Reconsideración del esfuerzo cortante o corte) Imagínese un cubo de gelatina sostenido con las manos como se aprecia en la vista (lateral) de la figura 4.4.2a. Supóngase que la mano de arriba se mueve k unidades hacia la derecha (k es pequeño). Entonces la altura del bloque de gelatina no cambiará mucho, y la vista lateral será la de un paralelogramo. Esta acción mecánica conduce al corte. En la figura 4.4.2b se han colocado unos vectores en la cara de la gelati-
ALGEBRA LINEAL CON APLICACIONES
320
na. Suponiendo que el cortante es una transformación lineal S, hállese una matriz que represente a S y muéstrese que S es invertible. (La invertibilidad es razonable: para "deshacer" el cortante podemos simplemente mover la parte superior hacia atrás, a su posición original.) Solución
Como se dijo antes, el principio básico para hallar representaciones matriciales es que una transformación lineal está determinada por su acción sobre los elela acción de es una base para mentos de la base. Como S sobre (1, 0) y (0, 1) puede ser aplicada:
Por tanto, la matriz M de S con respecto a
es
La matriz M es invertible; así, por el teorema 4.4.2a, S es invertible. Nótese que
lo cual representa el cortante con la cara sup: ior del cubo moviéndose -k unidades hacia la derecha o lo que es lo mismo k unidades hacia la izquierda. Esto, por supuesto, tiene sentido: para deshacer un movimiento de la mano superior hacia la derecha, simplemente muévase hacia la izquierda la misma distancia. EJEMPLO4
Solución
Considérese un cuadrado como se muestra en la figura 4.4.3. Sea R una rotación antihoraria alrededor de c de 90°. Muéstrese, usando matrices, que cuatro aplicaciones sucesivas de R dan por resultado la transformación identidad. Hallamos la matriz canónica de R y calculamos su cuarta potencia. Como R(1, 0) = (0, 1) - 0(1, 0) + 1(0, 1) y R(0, 1) = (- 1, 0) = - 1 ( 1 , 0) + 0(0, 1), la matriz canónica es
Pero
TRANSFORMACIONES LINEALES Y SUS MATRICES
321
Figura 4.4.3
Cuadrado en rotación.
Clasificación de las transformaciones lineales Se ha visto que si la matriz A es invertible y una matriz B es similar a A, entonces B también es invertible. Es decir, la similaridad preserva la invertibilidad. A consecuencia del teorema 4.4.2a, puede decirse que una transformación lineal T es invertible si cualquier representación matricial de T es una matriz invertible. Debido a que hay otras propiedades de las matrices que se preservan ante la similaridad, se da la definición que sigue. D E F I N I C I Ó N 4.4.3
EJEMPLO5
Solución
EJEMPLO6
Solución
una propiedad de las matrices que se preserva ante la similaridad. Se disi la matriz tiene la propiedad ce que una transformación lineal en alguna base. que representa a T tiene la propiedad Sea
Muéstrese que la propiedad de la idempotencia se preserva ante la similaridad. Pero Sea A idempotente (es decir, A2 = A), y sea B similar a A: B = Por tanto, B es idempotente. Muéstrese que la transformación lineal es idempotente.
de proyección
Por el ejemplo 5, la similaridad preserva la idempotencia. Todo lo que se necesita hacer es hallar una representación matricial de T que sea una matriz idempotente. Investigamos la matriz canónica, que es la más fácil de calcular. Es
Pero M2 = M, lo cual indica que T es idempotente.
Otra propiedad que se preserva ante la similaridad es la nilpotencia.
322
ÁLGEBRA LINEAL CON APLICACIONES
F. J L- M P L O 7
Muéstrese que la nilpotencia se preserva ante la similaridad. Luego muéstrese que la transformación lineal de desplazamiento hacia la izquierda definida por es una transformación nilpotente.
Solución
Sea A nilpotente de exponente k, de modo que Si B es similar a A, entonces por el teorema Así las cosas, es nilpotente de exponente k. La matriz canónica para T es
Las potencias de M son
Por tanto, T es nilpotente con exponente 4, lo que quiere decir que cuatro aplicaciones sucesivas de T producen el vector cero. Nótese que T no es invertible ya que M no es invertible. La no invertibilidad tiene sentido, ya que cuando se produce el desplazamiento hacia la izquierda se pierde completamente la información acerca de la primera componente. Ecuaciones lineales (repetición) Como se dijo al comienzo de esta sección, el problema de resolver
en V, es una generalipara x en V, dada la transformación lineal zación del primer problema básico del álgebra lineal. Cuando V es de dimensión finita, el problema se reduce al primer problema básico de resolver ecuaciones lineales una vez que se ha asignado una base a V y se ha obtenido una matriz que represente a L. En ese caso la ecuación L(x) = y tiene una solución única si y sólo si ML es invertible. Cuando ML no es invertible, dim (ker L) donde p es una solución partiy la solución general es de la forma es una solución del problema homogéneo asociado cular de don(véase el teorema 1.5.5). Para mostrar esto, considérese L de L es la derivación. Se desea resolver L(f) = g. La matriz canónica para L es
TRANSFORMACIONES LINEALES Y SUS MATRICES
323
La matriz no es invertible, por lo que no puede esperarse una solución única. Sea
Entonces,
Cuando no está en la imapuede tener una solución si y sólo si gen de L. Pero cuando c = 0, g está en la imagen de L, y empleando la ecuación matricial
se halla
donde la constante k donde k es arbitrario. Es decir, es arbitraria (recuérdense las antiderivadas y la "constante de integración" ares una solución particular de bitraria). Nótese que Por tanto, la solución gees la solución más general de es de la forma neral, que existe sólo cuando g no es una cuadrática donde h es el núcleo de L. En un problema matricial puro considérese
Las ecuaciones son equivalentes a
ÁLGEBRA LINEAL CON APLICACIONES
324
En consecuencia, la solución existe pero no es única. Se obtiene una solución particular poniendo z = 1 y w = 1, lo que da y = 3 y x = -2. Inspeccionando el sistema homogéneo asociado
se obtiene una solución
Por tanto, la solución más general es
Los ejemplos precedentes explican el teorema siguiente, el cual se dará sin demostración. T E O R E M A 4.4.3
Sea V un espacio vectorial con dim
y considérese la ecuación lineal
donde es lineal, dim (imagen de L) 1 y y está en V. Si y está en la imagen de L, entonces a) la ecuación tiene una solución única, o bien b) la ecuación admite un número infinito de soluciones de la forma p + h, donde h es la solución general de es cualquier solución particular de Si y no está en la imagen de L, entonces la ecuación no tiene solución. Para finalizar, se considerará un caso que puede surgir en las aplicaciones: intentar resolver L(x) = y cuando y no está en la imagen de L. El teorema 4.4.3 indica que no puede esperarse una solución en el sentido usual, pero que en caso de poder definir un producto interno en V, podría llamarse solución aproximada a un vector si
Considérese el problema de resolver
TRANSFORMACIONES LINEALES Y SUS MATRICES
el cual no tiene solución. Definiendo
325
mediante
se ve que
el lado derecho de las ecuaciones no está en la imagen de L. Usando el producse tiene to interno canónico en
Los métodos del cálculo muestran que esta expresión adquiere su valor mínimo si x1 + x2 = 3/2; esto no da una solución aproximada única. Una forma de evitar este problema consiste en exigir que la solución aproximada sea de norma mínima (en este caso, la más cercana al origen). (véase la figura 4.4.4). Hallar soCon este requerimiento se obtiene luciones de norma mínima lleva a los conceptos de inversas generalizadas y regularizarían, que el lector o lectora interesados podrán hallar en textos tales como Regression and the Moore-Penrose Pseudoinverse, de A.E. Albert (Academic Press, Nueva York, 1972). Figura 4.4.4
Solución aproximada de norma mínima.
En el dominio de
326
P R O B L E M A S 4.4
ÁLGEBRA LINEAL CON APLICACIONES
En los problemas del 1 al 6 se dan una transformación lineal y una propiedad o propiedades (similaridad preservada). Determínese si la transformación dada tiene la propiedad dada. invertibilidad, idempotencia invertibilidad, idempotencia invertibilidad, nilpotencia T es rotación de 180°; invertibilidad invertibilidad, nilpotencia invertibilidad, idempotencia Considérese un triángulo equilátero
Figura P4.4.7
con centro C. Sea R una rotación antihoraria alrededor de C de 120°. Muéstrese que tres aplicaciones sucesivas de R dan la transformación identidad. (Empléense matrices.) Sea T una rotación antihoraria alrededor de C de 240°. Muéstrese que Considérese T:
definida por
(T recibe el nombre de desplazamiento a la derecha.) ¿Es T invertible? ¿Es nilpotente? ¿Es idempotente? Considérese
definida por
¿Es T invertible? ¿Es nilpotente? ¿Es idempotente? Si A es una matriz involutoria (A2 = I) y B es similar a A, ¿es B involutoria?
TRANSFORMACIONES LINEALES Y SUS MATRICES
327
12. Si A es una matriz ortogonal y B es similar a A, ¿es B ortogonal? 13. Si A es una matriz simétrica, P es ortogonal y
¿es B simétrica?
14. Digamos que una matriz es diagonalizable si es similar a una matriz diagonal D. Si B es similar a A, ¿es B similar a una matriz diagonal? 15. Sea L un operador lineal invertible de V a V, y sea un conjunto linealmente independiente en V. Muéstrese que el conjunto es linealmente independiente en la imagen de L.
4.5 PARANGÓN CON EL CÁLCULO Dos de las transformaciones lineales más importantes en las matemáticas aplicadas son la derivación y la integración definida, que se estudian en cálculo. Las ya conocidas reglas2
se cuentan entre las más útiles para calcular derivadas e integrales. Estas reglas son sencillamente enunciados de linealidad. De hecho, si la derivación se indica mediante una D, las dos primeras reglas anteriores se expresan así:
E J E M P L O
1
Solución
Sea D la transformación de derivación. Muéstrese que con la base canónica tibie. Considérese a Hágase ver que D es nilpotente. matriz de D con respecto a
no es inverHállese la
ker D es Para mostrar que D no es invertible, se mostrará que dim (ker D) el conjunto de los polinomios/ para los cuales D(f) = 0 (la función cero). Es decir, el núcleo es el conjunto de todos los polinomios cuya derivada es cero. Según el cálculo, este conjunto es el de las funciones constantes. Entonces ker 2
Las cuales, por supuesto, están contenidas en teoremas en los que f y g deben satisfacer ciertas condiciones.
ÁLGEBRA LINEAL CON APLICACIONES
328
D = gen matriz, se calcula
1. En consecuencia, D no es invertible. Para hallar la
para hallar
Obsérvese que M no es invertible, como era de esperarse, ya que D no es invertible. Como M4 = 0, la matriz M es nilpotente y, por tanto, D es nilpotente de orden 4. Éste es un modo lineal algebraico de decir que, si un polinomio cúbico se deriva 4 veces o más, lo que se obtendrá será la función cero. Algunos estudiantes de cálculo pondrán en tela de juicio la proposición "D no es invertible", ya que "todo mundo sabe que la derivación y la integración son operaciones exactamente opuestas". Hay que tener cuidado a este respecto, ya que el proceso de antiderivación incluye la adición de una constante arbitraria. Si A denota la antiderivación, entonces, por ejemplo, A(2x) donde c es una constante arbitraria. Si A fuese una inversa de D, se sin embargo, que es debería tener igual a solamente cuando Así que en general en consecuencia, A y D no son inversas la una de la otra. A pesar de esto, los ejemplos siguientes muestran que para algunos espacios vectoriales la antiderivación es la inversa de la derivación. EJEMPLO2
Muéstrese Sea V el subespacio de definido por que dim V = 3. Muéstrese que la imagen de D con dominio restringido a V es Defínase como la antiderivación con la constante arbitraria igualada a cero. Muéstrese que para cualquier
Solución Una base natural de V es
ya que cualquier polinomio cúbico tiene la propiedad si y sólo si Por tanto, dim V = 3. Ahora se calcula la imagen de D. Esta es generada por las imágenes debidas a D de los vectores base para V; se t i e n e
TRANSFORMACIONES LINEALES Y SUS MATRICES
329
por lo que imagen de D = gen La imagen de D se compone de todas las combinaciones lineales posibles de lo cual es Para mostrar que se calcularán las matrices de usando las bases naturales de V Se halla
Por tanto,
En este ejemplo se ha Se ve también que por lo que forzado a que la constante arbitraria de antiderivación sea cero. El ejemplo 2 muestra el principio general de que para "invertir" la antiderivación es necesario imponer ciertas condiciones sobre el dominio de D. En el ejemplo 2 esta condición fue f(0) = 0. En general, a tales condiciones se les puede llamar condiciones iniciales; surgen en problemas en el área de las matemáticas conocidas como ecuaciones diferenciales. En algunos libros se dice que, al resolver una ecuación diferencial, se está integrando la ecuación. Se emplea esa terminología debido a la relación inversa que se acaba de ver. EJEMPLO 3
Muéstrese que la transformación
definida en C[0, 1] por para todo x en [0, 1]
es lineal. Solución
Sean f y g funciones en C[0, 1]. Se tiene
330
ÁLGEBRA LINEAL CON APLICACIONES
es lineal. Nótese que
para todo f.
El teorema fundamental del cálculo puede enunciarse en esta forma: es continua en [0, 1], entonces para una
Usando nuestra notación de D y
fija y cualquier
se ve que la última ecuación es
Por tanto, es la inversa de D si y sólo si De nuevo se ve que hay una condición extra para garantizar la invertibilidad de la derivación. Para mostrar esto último, se considerará una ecuación diferencial sencilla: hállese una función y(x), en que satisfaga
Sabemos que cualquier función de la forma y(x) = Cex satisface a esta ecuación. Como C es arbitraria, no se ha resuelto el problema en forma única. Sin embargo, si se impone una condición adicional tal como y(0) = 3, se hallará ay(x) = 3ex como la única3 solución del problema. La unicidad de las soluciones de una ecuación diferencial y la invertibilidad del operador de derivación están íntimamente relacionadas. Las transformaciones lineales también aparecen en el cálculo de varias variables. Recuérdese el gradiente: sea Se tiene
y las propiedades
1
Esto se demuestra en los cursos de ecuaciones diferencíales.
TRANSFORMACIONES LINEALES Y SUS MATRICES
331
son fáciles de comprobar. Por tanto, la operación gradiente es una transformación lineal del espacio de todas las funciones con valor real de tres variables con derivadas continuas, al espacio vectorial de ternas ordenadas de funciones continuas de tres variables. El jacobiano es otro operador lineal que se estudia en el cálculo de varias variables. Es generado por una matriz. Si f es una función definida por
entonces el jacobiano de f es la matriz de funciones
En cada punto es una es una matriz fija de 2 x 2. Si matriz invertible, entonces f es invertible en alguna vecindad de En esta forma la invertibilidad local de una función f no lineal se estudia determinando la invertibilidad de una transformación lineal asociada (generada por el jacobiano). EJEMPLO4
Considérese la transformación no lineal definida por y, x sen y). Hállese el jacobiano de f. ¿Dónde es f localmente invertible?
Solución
Esta matriz es invertible si y sólo si Por tanto, se dice que f es ¡ocalmente inEs decir, vertible en una vecindad de cualquier punto Estos ejemplos muestran el hecho de que las operaciones de derivación e integración son la fuente de muchas transformaciones lineales en matemáticas aplicadas. P R O B L E M A S 4.5
1. Sea V el conjunto de todas las funciones f(x) para las cuales existe Muéstrese que V, con las definiciones usuales de adición y multiplicación escalar para funciones, es un espacio vectorial. ¿De que
332
ÁLGEBRA LINEAL CON APLICACIONES
manera depende la estructura de espacio vectorial de la linealidad de la transformación definida por 2. Sea f una función fija en Muéstrese que
Defínase es un operador lineal.
mediante
3. Considérese el operador lineal del problema 2. El núcleo de Lf es el conjunto de todas las funciones g ortogonales a f [donde el producto punto Muéstrese que si sen x, entonces n un entero positivo, esta en el núcleo de 4. Sean f(x, y) = (x2, y2) un operador no lineal que va de E2 a E2. Empléese el jacobiano para determinar la invertibilidad local de f. es una trans5. Muéstrese que definida por formación lineal. Hállese la matriz canónica de D2. Muéstrese que esta matriz es el cuadrado de la matriz de D obtenida en el ejemplo 1. 6. Sea V el conjunto de todas las funciones f: convergente a la función para todo x. Sea
con serie de Maclaurin
y defínase
Muéstrese que V en estas operaciones es un espacio vectorial (es conveniente recordar los teoremas de las series de pontencias convergentes). 7. Considérese el espacio vectorial V del problema anterior. Se sabe, del calculo, que si es derivable en entonces Por tanto,
¿Cuál sería el operador inverso de D?
8. Con respecto al problema 7, muéstrese cómo podría considerarse la "matriz infinita"
TRANSFORMACIONES LINEALES Y SUS MATRICES
333
como la matriz de D. [Sugerencia: ¿cuál podría ser una buena elección para una "base" de V?] 9. Recuérdese que para
puede definirse el rotacional de f, cuando como
Muéstrese que el rotacional es una transformación lineal del espacio de las ternas ordenadas de funciones continuamente derivables de tres variables, al espacio de las ternas ordenadas de funciones continuas de tres variables. 10. Para una función
dada por
la divergencia de f se define como
Muéstrese que div es una transformación lineal del espacio de las ternas ordenadas de funciones continuamente derivables de tres variables al espacio de funciones continuas con valor real de tres variables. 11. Sea V el espacio de todas las funciones con valor real junto con las operaciones usuales de adición y multiplicación por un escalar. a) Muéstrese que T: V definida por para todo
en [0, 1]
es lineal. b) Muéstrese que g, definida por
está en ker T. c) ¿Es invertible T? 12. Sea V = C[0, 1] y defínase T como en el problema 11a . ¿Es T invertible con este dominio? (Compruébese el núcleo.)
ÁLGEBRA LINEAL CON APLICACIONES
334
R E S UM E N
PROBLEMAS A D I C I O N A I, E S
Se definieron y luego se analizaron las transformaciones lineales, concepto importantísimo en las matemáticas aplicadas, considerando el núcleo y el recorrido de la transformación, así como la matriz de representación de la transformación. Hallar la matriz que representa a una transformación es el tercer problema básico del álgebra lineal. Las transformaciones lineales de un espacio vectorial hacia sí mismo se pueden clasificar en forma definida, ya que ciertas propiedades de las matrices son invariantes ante las transformaciones de similitud (invertibilidad, nilpotencia e idempotencia son sólo tres de ellas), y todas las matrices de representación de una transformación de son similares. La transformación de similitud P en estos casos es simplemente una matriz de transición, tal como se definió en el capítulo 3. Teniendo ya las ideas del álgebra matricial, las transformaciones lineales y los espacios vectoriales en nuestro acervo, estamos listos para acometer el estudio de dos problemas de importancia extrema en el álgebra lineal: el problema de los vectores y los valores característicos y el problema de la diagonalización. En el capítulo 5 se emplearán los determinantes, las inversas, los sistemas de ecuaciones homogéneas, los espacios vectoriales, bases, dimensión, dependencia e independencia lineal, similitud y ortogonalidad para resolver estos problemas. De esta manera, los resultados de los primeros cuatro capítulos por fin se conjuntarán para resolver problemas de importancia teórica y práctica. 1. Defínase mediante neal. Descríbase el núcleo de
Muéstrese que T es li-
2. Defínase mediante neal. Descríbase el núcleo de L.
Muéstrese que L es li-
3. Compárese la dimensión del espacio vectorial de matrices simétricas de n x n con la dimensión del espacio vectorial de las matrices triangulares superiores de n x n. 4. Sea A una matriz invertible de n x n. Defínase ¿Es T lineal? ¿Es T uno a uno? 5. Sea una matriz con y defínase PA. Muéstrese que T es lineal. ¿Es T uno a uno? 6. Supóngase que c está en mediante T(X) =
mediante como
y que A está en Defínase Muéstrese que T es lineal.
7. Sea A una matriz cuadrada. Considérese la matriz B = I + A. Hágase la multiplicación B [I -A + A2 - A3 + ... + (-1 )nAn] para varios valores de n. Si A es nilpotente de exponente k, muéstrese cómo se puede usar la suma entre corchetes para calcular (1 + A) -1 . 8. Sea A una matriz cuadrada tal que A n tienda a la matriz cero cuando n aumente sin límite. ¿Cómo podría "construirse" (I + A ) - 1 usando una suma como la del problema 7?
TRANSFORMACIONES LINEALES Y SUS MATRICES
335
9. Descríbase la transformación lineal problemas 1 y 2. ¿Es 10. Defínase N: mediante mas 1 y 2, calcúlense
donde
son las de los
Usando L y T de los probleCompárense Compáren-
se
11. Las transformaciones lineales se pueden indizar mediante una variable. Por ejemplo, si una partícula está girando alrededor del origen del plano con velocidad angular constante la posición de la partícula está definida por
donde
es el vector de la posición inicial. Obsérvese que la matriz A(t) de 2 x 2 que aparece en la ecuación es una función matricial. Muéstrese que para todo t, a(t) es invertible. Muéstrese que para todo t, A(t) es ortogonal. 12. La matriz
se usa en ecuaciones de diferencias para determinar distribuciones de edad en poblaciones; la matriz representa una transformación lineal del estado de las distribuciones de edad en un tiempo de observación al siguiente. Los bk representan tasas de nacimiento y los dk representan tasas de de fallecimiento en el k-ésimo nivel de edad. Calcule det A para diferentes valores de n. ¿Puede usted hallar una fórmula para det A para una n cualquiera? 13. En mecánica, cuando un cuerpo está sujeto a fuerzas, puede ocurrir un cambio en las posiciones relativas de sus partículas. Por ejemplo, cuando una varilla se dobla, cambian las posiciones relativas de los puntos sobre la superficie curva. A este cambio en la posición relativa se le conoce como deformación. El término deformación homogénea se refiere a la deformación en la cual las nuevas coordenadas de un punto material, dadas por Y están relacionadas con las coordenadas antiguas, dadas por X en en
336
ÁLGEBRA LINEAL CON APLICACIONES
mediante Y = AX, donde A es una matriz real de 3 x 3. Muéstrese que para la deformación homogénea las rectas siguen siendo rectas. 14. Muéstrese que en el caso de la deformación homogénea, las rectas paralelas siguen siendo paralelas. 15. El método de Newton para resolver ma de resolver
se puede extender al proble-
Recuérdese que el paso iterativo del método de Newton es
En el caso de dos ecuaciones
se tiene
Aplíquese esto a
tomando como valores iniciales
Complétense los tres pasos de la iteración. Las soluciones exactas son
5.1 IMPORTANCIA DE LA SIMILARIDAD DIAGONAL; APLICACIÓN A CADENAS DE MARKOV Las cadenas de Markov son una herramienta poderosa para la predicción de eventos futuros. Su uso eficaz incluye el cálculo de potencias grandes de matrices. Tales cálculos pueden ser tediosos (si se hacen en forma manual). Con información adicional acerca de la matriz se puede facilitar el trabajo, como se verá en los ejemplos 1 y 2. EJEMPLO 1
Solución
Calcúlese A6, donde
Por definición,
ÁLGEBRA LINEAL CON APLICACIONES
338
EJEMPLO 2
Calcúlese A6, donde
si en esta ocasión se sabe que
donde
Solución
Sea
Como
se ve que
El ejemplo 2 muestra que si una matriz A es similar a una matriz diagonal D, entonces el cálculo de An se puede efectuar calculando Dn, lo cual es fácil. En este punto surgen dos preguntas que exigen una respuesta: 1. Dada la matriz A, ¿es posible hallar P y D tales que A = PDP-1? 2. ¿Cómo se usan las potencias de las matrices en las cadenas de Markov? Primero se contestará la pregunta 2; la pregunta 1 se responderá en las secciones 5.2 y 5.3. Antes se hablará en términos sencillos de las cadenas de Markov. Las cadenas de Markov se emplean para analizar sistemas que en un momento dado pueden estar en uno de un número finito de estados. Por ejemplo,
VALORES CARACTERÍSTICOS, VECTORES CARACTERÍSTICOS Y DIAGONALIZACIÓN
339
una persona puede tener una deuda o no tenerla; el clima puede estar seco o húmedo; un sistema mecánico puede estar en equilibrio o bien fuera de equilibrio. En cada caso el sistema puede cambiar de un estado a otro. Además, hay una probabilidad de transición de un estado a otro entre tiempos de observación sucesivos. El objetivo del análisis de Markov es calcular la probabilidad de que un sistema se encuentre en un estado en particular en un tiempo futuro y determinar el comportamiento del sistema a largo plazo. DEFI N 1 C I O N 5.1.1.
Una probabilidad1 es un número p tal que Intuitivamente, la probabilidad empírica de un evento E en un experimento es
Obsérvese que los valores máximo y mínimo de p son 1 y 0, respectivamente. EJEMPLO 3
Solución
Una moneda se lanza 1 000 veces y, después de caer, se observa el resultado, cara o cruz. Las observaciones dan 700 veces cara y 300 veces cruz. ¿Cuál es la probabilidad empírica de que al lanzar la moneda una sola vez se observe cara? ¿Puede considerarse que la moneda no está "cargada"? La probabilidad empírica de cara es 0.7. La moneda está "cargada" ya que, por experiencia, se sabe que con una moneda balanceada debería obtenerse 500 veces cara y 500 veces cruz, aproximadamente. La idea de la probabilidad empírica hace posible definir el concepto de una cadena de Markov.
DEFINICION 5.1.2.
EJEMPLO 4
Sean los estados posibles de un sistema se Supóngase que observa a los tiempos dados Una cadena de Markov es un proceso en el cual la probabilidad empírica de que se halle en un estado particular al tiempo de observación depende solamente del estado en el que se halle al tiempo Considérese el sistema de un estudiante
quien puede estar en los estados
calificación calificación 1
Aquí se está empleando una noción intuitiva de probabilidad; para un desarrollo detallado, véase un texto de probabilidad. * En la escala GPA, la calificación máxima es 4. (N. del T.)
340
ÁLGEBRA LINEAL CON APLICACIONES
El resultado de las observaciones en el nivel de enseñanza media es que si se halla en el estado s1 en un semestre, entonces estudiarán más arduamente el próximo semestre y lograrán el estado s2 con una probabilidad de 0.8 y el estado s1 con una probabilidad menos de 0.2. Pero, si, se encuentra en el estado s2 en un semestre, el semestre siguiente se relajará y caerá debajo de 3.0 con una probabilidad de 0.3, y estará por encima de 3.0 con una probabilidad de 0.7. Éste es un ejemplo de una cadena de Markov con tiempos de observación en un seal final de cada semestre. Se está suponiendo que el desempeño de mestre está determinado sólo por su motivación debida a su calificación promedio (GPA) del semestre anterior. Las probabilidades en el ejemplo 4 se llaman probabilidades de transición y pueden disponerse en una matriz
Así, 0.8 es la probabilidad de transición de cambiar del estado s1 al estado s2, etc. Obsérvese que la suma de las columnas es 1. Esta matriz recibe el nombre de matriz de transición para la cadena de Markov. La importancia de la matriz de transición reside en que se puede emplear para hallar la probabilidad de encontrarse en los estados s1 o s2 en tiempos posteriores. Para ejemplificar esto, supóngase que el o la estudiante obtiene un GPA de 2.5 en el primer semestre. Se sabe que el estudiante se encuentra en el estado ' esto se puede representar mediante un vector de estado de como
La primera ranura se llena con la probabilidad de que se encuentre en y la segunda ranura con la probabilidad de que se halle en s2. Al multiplicar 5 por M se obtiene
Recordando nuestro ejemplo se ve que
representa las probabilidades de estar en st y s2 después de un semestre con GPA 0). Muéstrese que el sistema de primer orden que modela la difusión es
son las cantidades de sal en las células 1, 2 y 3, respectivadonde mente. Muéstrese que la matriz del sistema tiene un valor característico de multiplicidad 2. 12. Las ecuaciones de movimiento del sistema mostrado abajo son (despreciando la gravedad)
son los desplazamientos de las masas donde vamente, con respecto al equilibrio.
respecti-
404
ALGEBRA LINEAL CON APLICACIONES
a) Para características.
hállense las frecuencias
b) Para muéstrese que los valores característicos de A son negativos, probando así que el sistema es estable. c) Para
RESUMEN
¿es estable el sistema?
La representación de una transformación lineal mediante una matriz diagonal es ventajosa, pero no es posible lograrla para todas las transformaciones. El problema se reduce a preguntarse cuándo puede una matriz ser diagonalizada. Una matriz de n x n puede diagonalizarse si y sólo si tiene un conjunto de n vectores característicos linealmente independientes. Por tanto, la solución del problema de la diagonalización depende de hallar los valores y vectores característicos de la matriz. En las aplicaciones, los valores característicos están relacionados con las frecuencias de vibración y la estabilidad de los sistemas mecánicos. Las matrices simétricas reales siempre se pueden diagonalizar ortogonalmente, y las matrices hermitianas siempre se pueden diagonalizar unitariamente. Al efecturar estas diagonalizaciones puede ser necesario el procedimiento de Gram-Schmidt para construir una base ortonormal de vectores característicos de la matriz. Como resultado de lo estudiado en los cinco primeros capítulos, se han encontrado soluciones a los cinco problemas básicos de álgebra lineal:
VALORES CARACTERÍSTICOS. VECTORES CARACTERÍSTICOS Y DIAGONALIZACION
405
1. Solución de ecuaciones lineales. La eliminación gaussiana fue el primer método de solución, y se prestó atención a las cuestiones numéricas. 2. El problema de la base. Usando el concepto de la dependencia y la independencia lineal, se mostró cómo resolver este problema en una forma constructiva, "construyendo la base". 3. El problema de la representación matricial. Las transformaciones lineales se pueden representar mediante matrices; la solución incluye la representación de imágenes ante la transformación de los elementos de la base. 4. El problema de los valores y los vectores característicos. Este problema se resolvió empleando los métodos para la solución de ecuaciones lineales y determinantes. La solución de este problema es determinante para lograr la solución del último problema básico. 5. El problema de la diagonalización. Usando las técnicas de las soluciones de los cuatro primeros problemas básicos se resolvió este problema, el cual tiene muchas aplicaciones en la ciencia y en la ingeniería.
Ciertamente, un buen conocimiento de los métodos de solución de estos cinco problemas le dan al estudiante la capacidad de acometer estudios más profundos del álgebra lineal. Por sí mismos, estos métodos constituyen una herramienta para manejar problemas básicos de álgebra lineal, así como métodos elementales en la ciencia, la ingeniería y el análisis numérico. Como el lector habrá notado, los problemas y ejemplos de este capítulo están seleccionados de tal forma que sea razonablemente fácil calcular los valores y los vectores característicos. En general no sucede así, por lo que se han desarrollado métodos numéricos para resolver ese tipo de problemas. En el capítulo siguiente se analizarán dos de esos métodos.
PROBLEMAS ADICIONALES
1. ¿Es el conjunto de todas las matrices de n x n diagonalizables un subespacio de 2. Sea A una matriz de n x n diagonalizable. Analícese la solubilidad de 3. Hállense los polinomios característicos de
406
ÁLGEBRA LINEAL CON APLICACIONES
4. Hállense los polinomios característicos de
5. Sea la matriz definida por ecuación característica es
para toda i y j. Muéstrese que la
6. Supóngase que A y B son matrices de n x n y siendo D y E matrices diagonales. Compare AB con BA. 7. Si una matriz diagonalizable es nilpotente, ¿qué se puede decir de su traza? 8. Sea
Muéstrese que A tiene un valor característico igual a cero, con el vector característico correspondiente
¿Qué se puede decir acerca de los otros dos valores característicos? 9. Un vector un número
se llama vector raíz de orden k para la matriz tal que
si existe
Los vectores raíz son útiles al estudiar sistemas de ecuaciones diferenciales. Muéstrese que
VALORES CARACTERÍSTICOS, VECTORES CARACTERÍSTICOS Y DIAGONALIZACIÓN
407
es un vector raíz de orden 3 para
10. Muéstrese que
no tiene vector raíz de orden 2. 11. Si A es real y diagonalizable con todos sus valores característicos positivos, ¿implica eso que A tiene una raíz cuadrada? Es decir, ¿existe una matriz real B tal que A = B2? 12. En física matemática se emplean a veces las ecuaciones de Lagrange para estudiar sistemas vibratorios. En estas ecuaciones aparecen generalmente dos formas cuadráticas, por lo que se tiene el problema de diagonalizar las matrices de ambas formas cuadráticas simultáneamente. Si A y B son matrices simétricas reales y una de ellas, A o B, es definida positiva, entonces es posible diagonalizarlas simultáneamente. Es decir, existe una matriz P tal que PTAP y PTBP son diagonales. Muéstrese calculando PTBP y PTAP
que diagonaliza simultáneamente a
13. Considérese el sistema vibratorio con amortiguador de la figura AP5.13. El sistema de ecuaciones diferenciales para este sistema tiene la matriz
408
ALGEBRA LINEAL CON APLICACIONES
¿En qué condiciones los valores de k, c y m darán valores característicos complejos? Esto corresponde al caso de subamortiguamiento o amortiguamiento ligero: la masa oscila, con la amplitud que tiende a cero conforme transcurre el tiempo. La parte imaginaria del valor característico da la frecuencia de oscilación. 14. En el problema 12 de los problemas adicionales del capítulo 4 se presentó una matriz asociada con las distribuciones de edad en una población. Un vector característico asociado con el mayor valor característico positivo (si existe un valor característico así) se llama distribución de edad estable. Las componentes del vector característico dan las proporciones relativas de los grupos de edad. Por ejemplo, la matriz
representa una especie dentro de un intervalo de vida de 3 años (por ello la matriz de 3 X 3) que produce seis descendientes en el tercer año (el elemento al3), pero ninguno cuando es más joven. Muéstrese que A tiene el vector característico
correspondiente a su mayor valor característico positivo. Esto significa que, en la distribución de edad estable, la razón de los grupos de edad de 0 a 1, de la 2 y de 2 a 3 años es 6:3:1.
VALORES CARACTERÍSTICOS. VECTORES CARACTERÍSTICOS Y DIAGONALIZACIÓN
409
15. El circuito en la figura AP5.15 lleva a la consideración de un sistema de ecuaciones diferenciales que incluye la matriz
Figura AP5.15
¿Para qué valores de L, R y C tiene A valores característicos complejos con parte imaginaria diferente de cero? En ese caso, muéstrese que las partes reales de los valores característicos son negativas. Esto significa que las corrientes en el circuito decaen a cero en forma oscilatoria.
6.1 ESTABILIDAD DEL PROBLEMA NUMÉRICO DE VALORES CARACTERÍSTICOS En este capítulo se estudiará el problema enunciado a continuación.
En las secciones 6.2 y 6.3 se exponen dos métodos de solución para este problema. En este punto es conveniente hacer una advertencia: Si A y B son casi iguales, sus valores característicos no son necesariamente casi iguales. Otra forma de decir esto es como sigue: Pequeños cambios en A no necesariamente originan pequeños cambios en los valores característicos de A. Éstos son detalles importantes, ya que la forma de A almacenada en la computadora puede no ser exactamente igual a A. Para concretar, considérense las matrices
412
ÁLGEBRA LINEAL CON APLICACIONES
La matriz A tiene los valores característicos 1 y 1, y B posee los valores característicos 0 y 2. Aun cuando A difiere de B solamente por 0.001 en el elemento del renglón 2, columna 1, los valores característicos difieren por 1. Es decir, un cambio de solamente 0.001 en uno de los elementos de A generó un cambio del 100% en el valor característico. Para un ejemplo más extremoso, considérense las matrices
La matriz C difiere de A solamente por 0.001 en el segundo renglón, primera columna. Los valores característicos de A son 1 y 1, pero C ni siquiera tiene valores característicos reales ya que el polinomio característico es Lo que estos ejemplos enseñan es que cuando un error entra en los cálculos de los elementos de una matriz A y más adelante se intenta calcular los valores característicos de A, hay que observar cuidadosamente los resultados. No obstante, si A es simétrica, cambios pequeños en A no causarán, generalmente, cambios grandes en los valores característicos. Es por ello que en las aplicaciones en las que aparecen matrices simétricas, los métodos numéricos son usualmente muy eficientes para calcular los valores característicos requeridos1. Para hablar de cosas concretas, definiremos la norma de Frobenius de una matriz A como
T EOREMA D E ESTABILIDAD
C O R O L A R I O DE ESTABILIDAD
Sea A una matriz de n x n y sea E una "matriz de error" de n x n. Supóngase que A y E son reales y simétricas, y sea (es decir, es la "versión los valores característicos de con error" de A). Sean los valores característicos de Á. Entonces
Con las mismas hipótesis que para el teorema de estabilidad,
1
Hay ciertas matrices que se pueden usar para comprobar los métodos numéricos, Si el método da resultados correctos con estas matrices, aumenta la confianza en el método. Véase, por ejemplo, A Collection of Matrices for Testing Computational Algorithms de R. Gregory y D.L.. Karney, Wiley, N . Y . , 1969.
CÁLCULO NUMÉRICO DE LOS VALORES CARACTERÍSTICOS
413
para es Esto significa que el proceso de hallar estable: errores pequeños en A pequeña) causan errores pequeños en los valores calculados de pequeña). No podemos demostrar el teorema, pero el corolario se obtiene señalando que por el teorema
Así
Este corolario establece que si es menor que o igual a un número pequeño entonces todos los valores calculados de A + E estarán dentro de de los valores característicos verdaderos de A. O lo que es lo mismo, los errores pequeños en la matriz simétrica real A producen errores absolutos pequeños en el cálculo de los valores característicos. En el primer ejemplo de esta sección no se trabajó con una matriz simétrica. EJEMPLO 1
Supóngase que se necesita calcular los valores característicos de
pero que, debido a errores en el cálculo de los elementos de A, la computadora trabajará con
¿Cuál será la diferencia máxima entre los valores característicos calculados y los valores característicos de A? Solución Se tiene que .
Pero
de donde
Entonces
ÁLGEBRA LINEAL CON APLICACIONES
414
así que es seguro que
El error máximo será de 0.23664. EJEMPLO2
Supóngase que se desea calcular los valores característicos de
en una computadora que guarda solamente seis dígitos significativos. ¿Qué cota hay para el error en el cálculo de los valores característicos de A, suponiendo un error de 0.000001 en cada elemento de A? Solución
Supóngase que
donde
0.000001. Entonces, por el corolario de estabilidad,
Por supuesto esta estimación no toma en cuenta los errores introducidos por los cálculos empleados en un método particular para hallar los valores característicos. Lo importante está dicho: en general, errores pequeños en A no necesariamente originan errores pequeños en el cálculo de no obstante, si A es simétrica, con un error distribuido simétricamente, entonces errores pequeños en A sí originan errores absolutos pequeños en la determinación de
Finalmente, aun si el error absoluto es pequeño,
donde es pequeño, el error relativo podría ser grande. Por ejemplo, si entonces
CÁLCULO NUMÉRICO DE LOS VALORES CARACTERÍSTICOS
P R O B L E M A S 6.1
415
1. Considérense las matrices
donde
a) ¿Cuáles son los valores característicos de H? b) Muéstrese que es un valor característico de H + E. c) Muéstrese que d) ¿Por qué no se puede aplicar el corolario de estabilidad a H y a H + E? 2. Calcúlese la norma de Forbenius para las matrices siguientes: (matriz nula)
3. Con respecto al problema 2, ¿cuál es mayor?
4. Sea A una matriz de n x n. Si cero? 5. Sea/4
¿es A necesariamente la matriz
Defínase la norma 1 de A mediante
Sea
Calcúlense
¿Qué norma es mayor?
ÁLGEBRA LINEAL CON APLICACIONES
416
6. Supóngase que los valores característicos de una matriz simétrica A de n x n se van a calcular. Debido a un error en la entrada de los datos, a cada elemento de A se le ha sumado 0.0001. ¿Cuál es la cota de error para según el corolario de estabilidad? ¿Cómo cambia la cota de error conforme aumenta n? ¿Qué puede decirse de la estabilidad del problema característico para matrices grandes en comparación con matrices pequeñas?
6.2 MÉTODO DE LAS POTENCIAS El problema que se está considerando es éste: dada una matriz real A de n x n, hallar aproximaciones numéricas para los valores y los vectores característicos de A. En general, este problema característico numérico es difícil de resolver. En muchas aplicaciones, A puede ser simétrica o tridiagonal, o tener alguna otra forma o propiedad especiales. En consecuencia, la mayor parte de los métodos numéricos están diseñados para matrices especiales. El método de las potencias, que es el tema de esta sección, se puede usar cuando tiene n vectores característicos linealmente independientes Los valores característicos pueden ordenarse según su magnitud como
Cuando se ha efectuado este ordenamiento, terístico dominante de A.
EJEMPLO 1
Solución
recibe el nombre de valor carac-
Supóngase que los valores característicos de A son 2, 5, 0, -7 y —2. ¿Tiene A un valor característico dominante? Si es así, ¿cuál es dominante? Como
entonces A tiene un valor característico dominante de
Supóngase ahora que A satisface las condiciones (6.2.1) y (6.2.2). ¿Qué se puede afirmar respecto a A? Si Xo es cualquier vector, se puede escribir como
CÁLCULO NUMÉRICO DE LOS VALORES CARACTERÍSTICOS
417
donde es el conjunto de n vectores característicos linealmente independientes. Entonces
Y si la última ecuación se divide entre
Al ir aumentando m, los términos cercanos a cero (recuérdese que para m grande
se obtiene
se hacen más y más Por tanto,
esta última ecuación constituye una aproximación para Mientras Para obtener la no debe ser ortogonal a (Para garantizar que aproximación, nótese que además de (6.2.4) se debe tener, como m + 1 > m, que
Tomando ahora el producto punto en ambos lados de (6.2.4) y (6.2.5) con cualquier Y que no sea ortogonal a V1, se tiene
y asi
Finalmente, dividiendo se llega a
ÁLGEBRA LINEAL CON APLICACIONES
418
Las potencias de A son las que le dan el nombre al método de las potencias.
Evidentemente los conceptos de independencia lineal y base son esenciales para mostrar que el método de las potencias funciona. Una vez más la teoría del álgebra lineal proporciona los elementos para desarrollar un método numérico. EJEMPLO2
Solución
Aplíquese el método de las potencias para estimar el valor característico mayor que
Sea
Se calculan
2
Obsérvese que las componentes de los vectores calculados se están haciendo más grandes. Para superar esto, uno puede modificar el método de las potencias con un cambio de escala, el cual se describe en el problema 6.
CÁLCULO NUMÉRICO DE LOS VALORES CARACTERÍSTICOS
419
Ahora sea
En la ecuación (6.2.6) con m = 5:
Comprobando con los métodos del capítulo 5 se halla que
tiene error absoluto es el par característico dominante; la aproximación a = 0.0106..., lo cual es menos que el 0.3% de error relativo.
parecen ser casi paralelos al vector caEn el ejemplo 2, los vectores De hecho, esto siempre es así. Para verlo, obracterístico correspondiente a sérvese primero que para cualquier par característico de A se tiene
Así, si a ambos lados se toma el producto punto con V, se observa que
En la ecuación (6.2.6) Y se puede elegir como
para hallar
La última expresión concuerda con la ecuación (6.2.7) tomando es (aproximadamente) un vector caractePor tanto, es razonable pensar que rístico correspondiente a
ÁLGEBRA LINEAL CON APLICACIONES
,420
EJEMPLO 3
Solución
Aplíquese el método de las potencias al calcular una aproximación al par característico dominante para
Sea
Entonces
Nos detenemos aquí porque los vectores
tienden a un múltiplo de
Pero
Por tanto, un característico dominante es (aproximadamente)
Como el par característico dominante real es
el método ha funcionado bien en este ejemplo.
CÁLCULO NUMÉRICO DE LOS VALORES CARACTERÍSTICOS
421
No obstante que el método de las potencias ha funcionado bien en estos ejemplos, vale la pena decir algo acerca de los casos en los cuales este método pudiese fallar. Básicamente hay tres de tales casos: 1. La aplicación del método de las potencias cuando A no es diagonalizable. Recuérdese que A tiene n vectores característicos linealmente independientes si y sólo si A es diagonalizable. Evidentemente no es fácil decidir si una matriz A es diagonizable con sólo echarle un vistazo. 2. La aplicación del método de las potencias cuando A no tiene un valor característico dominante o cuando el valor característico dominante es tal que
es apenas menor que 1, y las potencias más altas de (En ese caso no tienden a cero rápidamente.) De nuevo no es fácil saber si A tiene este defecto con sólo un vistazo. 3. Si los elementos de A tienen un error significativo. Las potencias tendrán errores de redondeo considerables en sus elementos.
de A
He aquí una regla práctica para aplicar cuando se use el método de las potencias: 1. Aplicar el método, y si los números
tienden a un solo número 2. Comprobar si
entonces detenerse e ir al paso 2. es un par característico verificando
3. Si se cumple la condición del paso 2, aceptar que
es un par característico dominante.
EJEMPLO4
Solución
Compruébese la respuesta del ejemplo 3. El par característico propuesto es
ÁLGEBRA LINEAL CON APLICACIONES
422
Para comprobar se calcula
Se tiene
Por tanto,
así que
y la respuesta es aceptable. Mediante el ejemplo que sigue se muestran posibles fallas del método de las potencias.
EJEMPLO5
Aplíquese el método de las potencias a
con
Explíquense los resultados. Solución
Sea
CÁLCULO NUMÉRICO DE LOS VALORES CARACTERÍSTICOS
423
Entonces se tiene
Se ve que
por lo que
no está tendiendo a ser paralelo a ningún vector. Además,
En consecuencia, no hay aproximación a los valores característicos. El método de las potencias ha fracasado cuando
Si se toma
ÁLGEBRA LINEAL CON APLICACIONES
424
entonces resulta que
y el método de las potencias fracasa por las mismas razones que antes. También en este caso la aproximación para oscila entre Una explicación del fracaso es que A no tiene un valor característico dominante. De hecho, los valores característicos son 1 y — 1, y su magnitud es la misma. Cuándo detenerse en el método de las potencias Sería conveniente tener una regla que indicase cuándo detenerse al estar aplicando el método de las potencias. Normalmente habría que detenerse cuando fuese pequeña. por lo que sólo es posible Sin embargo, en un problema real no se conoce estimar Esto se puede hacer cuando A es simétrica.
TEOREMA
6.2.1
EJEMPLO6
Sea A una matriz simétrica real con valor característico dominante Entonces si donde como en el método de las potencias, se tiene
Aplíquese el método de las potencias a la matriz simétrica
Estímese el error usando
para
(Los valores característicos son 4 y 9).
CÁLCULO NUMÉRICO DE LOS VALORES CARACTERÍSTICOS
Solución
425
Tomando
se halla
Ahora usando
se tiene
La estimación del error es
A partir de la estimación del error sabemos que nuestro error es si mucho 0.26. En la práctica no nos detendríamos aquí ya que el porcentaje de error podría ser
426
ÁLGEBRA LINEAL CON APLICACIONES
el cual es demasiado grande. Ordinariamente, habría que continuar los cálculos hasta que el error estimado fuese menos que alguna tolerancia prescrita.
Cabe hacer dos observaciones acerca del ejemplo 6. En primer lugar, el error estimado es pesimista. La estimación es de 0.26, aunque 8.9865 dista sólo 0.0135 del valor característico dominante real que es 9. Es decir, la aproximación está mucho más cercana al valor característico real de lo que predice la estimación del error. Debido a esto, otra prueba de la precisión (aunque no totalmente confiable) consiste en calcular el error relativo
y detenerse si E es pequeño. De hecho, esta segunda prueba debe usarse para una matriz A no simétrica ya que la estimación dada en el teorema 6.2.1 es sólo para matrices simétricas. En segundo lugar, las componentes de los vectores característicos aproximados se hacen muy grandes. Para superar este problema, puede cambiarse la escala de los vectores característicos aproximados en cada etapa, multiplicando el vector característico aproximado por el recíproco de la mayor componente (en valor absoluto) del vector característico aproximado, y luego usar ese vector modificado en el paso siguiente (véase el problema 6). Si se repite el ejemplo 6 con este proceso de cambio de escala, se obtiene
Paso 1: Paso 2: Paso 3:
Paso 10: Paso 11:
CALCULO NUMÉRICO DE LOS VALORES CARACTERÍSTICOS
427
El valor característico aproximado es (véase el problema 6)
El vector característico aproximado, tal como se calculó líneas arriba, es cercano al real (cualquier múltiplo de)
E J E M P L O 7
Solución
Calcúlese
[de la ecuación (6.2.8)] en el ejemplo 2, para n .= 3, 4, 5.
Se tiene
Por lo tanto,
Si se hubiese decidido aceptar como el valor característico aproximado cuando entonces se aceptaría 4.0017604 como Pero si inicialmente se hubiese decidido aceptar entonces se cuando aceptaría 3.9926566. Cálculo de valores característicos no dominantes Cuando se ha calculado el (Recuérde A, puede desear calcularse par característico dominante Si A es simétrica, puede demostrardése que entonces se que si
y los vectores característicos tiene los valores característicos podría aplison vectores característicos de A. Por tanto, para hallar de Sin embargo, hay que hacer una advercarse el método de las potencias a introduno es exacto, el método de las potencias aplicado a tencia. Como
428
ALGEBRA LINEAL CON APLICACIONES
eirá cierto error. La aplicación del método de las potencias a recibe el nombre de método de la deflación.
E J E M P L O8
Solución
para hallar
Aplíquese el método de la deflación a la matriz del ejemplo 6 para hallar Supóngase que
Se forma
Ahora, aplicando el método de las potencias a
con
se tiene
Evidentemente, todos los vectores generados con el método de las potencias son múltiplos de
CÁLCULO NUMÉRICO OE LOS VALORES CARACTERÍSTICOS
429
Además,
Por lo tanto, el primer (y único, ya que A es de 2 x 2) valor característico no dominante para A es 4, con vector característico
De hecho, esto es correcto con exactitud. EJEMPLO9
Solución
tal como se calculó en el ejemplo 6. Resuélvase de nuevo el ejemplo 8 con Compárense los resultados con los del ejemplo 8. Se tiene
Pero
Así que
Ahora se aplica el método de las potencias con
ÁLGEBRA LINEAL CON APLICACIONES
430
para hallar
Como los vectores generados parecen ser múltiplos fijos de
se sabe que
El error relativo en el valor característico es muy pequeño, y se aceptará
como el primer par característico no dominante de A. Sin embargo, el vector característico es inexacto ya que
es el correcto. Los resultados son menos exactos que en el ejemplo 8 porque se comenzó con inexactos. E J E M P L O 10
Resuélvase de nuevo el ejemplo 9, utilizando
como se obtuvo en los cálculos posteriores al ejemplo 6.
CÁLCULO NUMÉRICO DE LOS VALORES CARACTERÍSTICOS
Solución
431
Esta vez,
Después de cuatro pasos, comenzando con
se halla
Las aproximaciones calculadas son más precisas esta vez porque se ha comenzado con valores más precisos de Para una matriz de n x n (simétrica), para calcular por deflación, se procede como sigue. Después de calcular se forma
tendrá los valores característicos 0, 0, Entonces serán vectores característicos de y los vectores característicos de A. El método de las potencias aplicado a dará como valor característico dominante de Para calcular simplemente se continúa el procedimiento. En general, el método de la deflación se hace más inexacto conforme se calculan más valores característicos, ya que se van introduciendo errores con cada valor y vector característicos y éstos se van acumulando conforme avanza el proceso. Afortunadamente, en muchas aplicaciones sólo se necesita el valor característico dominante de A. donde
P R O B L E M A S 6.2
En los problemas 1 al 5 empléese el método de las potencias para calcular pares característicos dominantes aproximados (si es que existe un par característico dominante). Si el método no funciona, dígase por qué.
6. El método de las potencias con cambio de escala. En los ejemplos de este capítulo se vio que el método de las potencias genera vectores con componentes muy grandes. Para evitar esto, en cada paso puede multiplicarse el vector
ÁLGEBRA LINEAL CON APLICACIONES
432
Esto se llama cambio de escala de X. Por ejemplo, el cambio de escala de
y el cambio de escala de
El método de las potencias con cambio de escala es como sigue: elíjase Paso 1. Calcular Paso 2. Calcular Paso 3. Calcular
versión con cambio de escala de versión con cambio de escala de versión con cambio de escala de
Se continúa en esta forma. Luego se tiene, en el paso m,
es un vector característico aproximado. Aplíquese el método de las potencias con cambio de escala a los problemas 1, 2 y 5. 7. Si una matriz tiene valores característicos complejos, ¿puede aplicarse el método de las potencias como se ha descrito en esta sección? 8. Empléese el error relativo de la ecuación (6.2.8) para estimar el error en los valores característicos dominantes calculados en los problemas 1, 2 y 5. 9. Utilícese la deflación para agilizar el cálculo de los valores característicos no dominantes para los problemas 1, 2 y 5.
6.3
MÉTODO QR La base del método QR para calcular los valores característicos de A es el hecho de que una matriz real de n x n se puede escribir como (Factorización QR de A) donde Q es ortogonal y R es triangular superior. El método es bueno para el cálculo de todos los valores característicos de una matriz. La construcción de Q y R es como sigue. Se construyen las matrices en forma tal que sea triangular su-
CÁLCULO NUMÉRICO DE LOS VALORES CARACTERÍSTICOS
433
perior. Estas matrices se pueden elegir como matrices ortogonales y se llaman matrices amas de casa. Como las P son ortogonales, la estabilidad del problema característico no empeora (esto se demuestra en textos de análisis numérico). Si
entonces
Por el momento se analizará la construcción de las P. Primero se dirá cómo se usa la factorización QR de A para hallar los valores característicos de A. Se definen sucesiones de matrices mediante este proceso: Paso 1. Se toma A 1 = A, Q 1 = Q y R 1 = R. Paso 2. Primero se toma A 2 = R 1 Q 1 luego A 2 se factoriza como A 2 = Q 2 R 2 (factorización QR de A2). Paso 3. Se toma A3 = R2Q 2 ; luego A3 se factoriza como A3 = Q3R3 (factorización QR de /13).
Paso m. Se toma (factorización QR de
luego
se factoriza como
del paso primero usando En el k-ésimo paso se halla la matriz Por tanto, en cada paso se efectúa anterior; luego, se factoriza como tenderá a una forma triangular o casi una factorización QR. La matriz triangular, y así sus valores característicos serán fáciles de calcular. Lo importante es que si los valores característicos se pueden ordenar como entonces lo siguiente es cierto:
La demostración de esto rebasa el ámbito de este libro. Antes de aplicar el algoritmo QR a algunos ejemplos, se analizará la factorización QR de una matriz A. La intención en la factorización QR es obtener primero P1 que, al multiplicarse a la izquierda por A, producirá ceros debajo de a11. Es decir, se desea que
434
ÁLGEBRA LINEAL CON APLICACIONES
Después de haber hecho esto, se halla P2 la cual producirá
El proceso se continúa hasta tener
El problema consiste en calcular las matrices P. Resulta que las matrices Pk se pueden elegir como matrices ortogonales. De hecho, la construcción es como sigue. Para construir Pk: 1. Tómese la columna k de la matriz
(solamente A si k = 0):
2. Normalícese este vector columna, y al nuevo vector denótese por
CÁLCULO NUMÉRICO DE LOS VALORES CARACTERÍSTICOS
3. Calcúlese D 4. Hágase
435
(tómese Además tómese
5. Escríbase
Nótese que 6. Fórmese la matriz
La matriz Pk servirá para encontrar una factorización QR de A. Estas matrices, por su forma, se llaman matrices amas de casa. Puede mostrarse que las matrices amas de casa son ortogonales.
D E F I N I C I O N 6. 3. 1
Una matriz ama de casa es cualquier matriz de la forma
don-
de
T E O R E M A 6.3.1
Demostración
Las matrices amas de casa son ortogonales. Se mostrará que HTH = I. Por definición, H será ortogonal. Obsérvese primeramente que H es simétrica:
436
ALGEBRA LINEAL CON APLICACIONES
Ahora bien
EJEMPLO 1
Hállese una factorización QR de
reteniendo cuatro dígitos a la derecha del punto decimal. Solución
La primera columna normalizada es
El elemento "diagonal" es 0.8165. Se desea que haya ceros debajo de él. Primero se calcula D:
Se eligió el signo menos (-) porque 0.8165 > 0. Ahora se toma
Entonces
437
CALCULO NUMÉRICO DE LOS VALORES CARACTERÍSTICOS
Se multiplica A por P1 y se obtiene
Para construir P2 , se observa la columna 2 de P1A:
Normalizado, esto da
En este caso D nos ( —) porque 0.5379 > 0. Se toman
— 0.5533. Se escoge el signo me-
Por tanto,
Por lo tanto,
y se tiene
* En realidad se obtuvo 0.0008, pero debido al redondeo se considero como cero.
438
ÁLGEBRA LINEAL CON APLICACIONES
Finalmente,
En consecuencia,
En este último ejemplo se ve que hallar la factorización QR de una matriz de 3 x 3 es tedioso si se hace a mano. Obviamente es necesaria una computadora para hallar factorizaciones QR y, por lo tanto, para aplicar el método QR para hallar valores característicos. Para una matriz de 2 x 2 puede hallarse una sola matriz ama de casa, por lo que se considerará la factorización QR para una matriz de 2 x 2 cualquiera
La primera columna normalizada es
Pero D por lo que puede escribirse D = -sign a, donde sign a = 1 si a 0 y sign a = - 1 si a < 0.
donde sing a = 1 si a 0 y sign a = - 1 si a < 0. Como p = —Dv1, se tiene que p = (sign a)v1. Para v2 se tiene
* En realidad, 0.0001, pero debido al redondeo se consideró cero.
CÁLCULO NUMÉRICO DE LOS VALORES CARACTERÍSTICOS
439
Por tanto,
Como P1 es simétrica, Q = P1
EJEMPLO2
Solución
Hállese una factorización QR de
Usando las fórmulas anteriores, se encuentra que
Empleando las fórmulas para el caso de 2 x 2, se calculan ahora los valores característicos de
mediante el método QR.
EJEMPLO 3
Utilícese el método QR para calcular los valores característicos de
(Los valores característicos exactos son 4 y 9.) Solución
Se emplean las fórmulas para el caso de 2 x 2 cada vez que sea necesaria una factorización QR. Las matrices calculadas se enlistan a continuación (redondeadas); después del paso 3, sólo se anota Am.
440
ÁLGEBRA LINEAL CON APLICACIONES
Paso 1:
Paso 2:
Paso 3: Paso 4: Paso 5: Paso 6:
Paso 12: Los valores característicos aproximados se encuentran en la diagonal. En el ejemplo 3, Am parece estar convergiendo a una matriz diagonal; por supuesto, los elementos de la diagonal son los valores característicos aproximados. Esto muestra el siguiente resultado importante:
TEOREMA 6.3.2
Sea A una matriz real de n x n cuyos valores característicos satisfacen
Entonces las matrices Am del método QR convergirán a una matriz triangular superior con elementos diagonales Si A es simétrica, las matrices Am convergirán en una matriz diagonal con los valores característicos sobre la diagonal. Si A no satisface las hipótesis del teorema 6.3.2, el método QR puede fracasar. Si la diferencia en las magnitudes de los valores característicos es pequeña, la convergencia del método QR puede ser lenta.
CÁLCULO NUMÉRICO DE LOS VALORES CARACTERÍSTICOS
EJEMPLO4
441
Aplíquese el método QR para intentar el cálculo de los valores característicos de
Los valores característicos exactos son 4.001 y 3.999. Solución
Después de calcular se halla
Se ve que tal como lo garantiza el teorema, Am está convergiendo a una matriz triangular superior y los elementos de la diagonal se dirigen hacia los valores correctos; no obstante, la convergencia es muy lenta. La lentitud en la convergencia se debe a que Como ya se ha visto, la convergencia del método QR puede llegar a ser muy lenta; esto significa costos monetarios debido al tiempo de computadora. Hay métodos para acelerar la convergencia del método QR; éstos se estudian en libros avanzados de análisis numérico. Finalmente, después de hallar los valores característicos de A, los vectores característicos correspodientes se pueden hallar resolviendo con algunas condiciones adicionales tales como P R O B L E M A S 6.3
En los problemas 1 al 5, obténganse factorizaciones QR para las matrices dadas.
6. Utilícese el método QR para hallar aproximaciones para los valores característicos de las matrices en los problemas 1, 3 y 4. 7. La matriz
tiene valores característicos complejos. Úsese el método QR para intentar calcular los valores característicos. ¿Qué sucede?
ÁLGEBRA LINEAL CON APLICACIONES
442
8. Lo mismo que en el problema anterior, pero con
RESUMEN
El método de las potencias y el algoritmo QR son dos métodos para el cálculo numérico de los valores característicos de matrices reales. La estabilidad de un problema característico numérico depende de la matriz con la que se esté trabajando. Si la matriz es simétrica con un error distribuido simétricamente, entonces los valores característicos calculados se aproximarán a los valores característicos verdaderos, suponiendo que todos los valores característicos son simples. De otra manera, los métodos numéricos pueden no servir para obtener la totalidad de los valores característicos. Por cuestiones de extensión del libro no ha sido posible presentar todos los métodos numéricos del álgebra lineal. Explicar todos estos métodos requiere todo un curso intensivo de análisis numérico. Pero los conceptos que se han analizado brevemente en las secciones dedicadas a los métodos numéricos son muy importantes: propagación de errores, aproximación, iteración, errores de redondeo, mal acondicionamiento y los fundamentos teóricos de los métodos numéricos. El capítulo que sigue es similar. Para comprender los métodos analizados se requiere un curso de optimización. Al no poder darnos el lujo de emplear tanto tiempo, nos contentaremos con presentar lo más esencial del algoritmo simple para problemas de programación lineal, esperando despertar en el lector el deseo de profundizar en el tema.
PROBLEMAS ADICIONALES
En los problemas 1 al 5 se muestran sistemas físicos y las matrices asociadas con las ecuaciones diferenciales de cada uno de los sistemas. Calcúlese el valor característico más grande (en magnitud). 1. Péndulos acoplados.
Tómese
CÁLCULO NUMÉRICO DE LOS VALORES CARACTERÍSTICOS
2. Masas unidas por resortes.
3. Un circuito eléctrico.
Empléense R = 0.25, L = 1 y C = 3.
4. Carros conectados por resortes.
443
444
ÁLGEBRA LINEAL CON APLICACIONES
Empléense
5. Difusión de un soluto.
Empléense
6. El teorema de Gershgorin señala que, para una matriz A de n x n, cualquiera de sus valores característicos debe estar sobre uno de los círculos en el plano complejo
Entonces para la matriz
se tienen los círculos como se ve en la figura AP6.6. El teorema de Gershgorin da una idea de cómo buscar los valores característicos, sean éstos reales o complejos. Aplíquese el teorema de Gershgorin a las matrices en los problemas 1 al 5.
CÁLCULO NUMÉRICO DE LOS VALORES CARACTERÍSTICOS
445
Figura AP6.6
7. Empléese el teorema de Gershgorin para demostrar que
no tiene valores característicos reales. Obsérvese que A es simétrica, pero no real simétrica. 8. Empléese el teorema de Gershgorin para de mostrar que
no tiene valores característicos con parte real positiva.
7.1
EJEMPLOS SIMPLES Un problema básico de la ciencia aplicada es la optimización; como ejemplo puede citarse la maximización de la salida de un proceso químico. A menudo el problema consiste en maximizar los valores de la imagen de una transformación lineal
EJ EMPLO 1
Una compañía química produce dos componentes, Quim A y Quim B . El Quim A se vende a $3 dólares por libra y Quim B a $2 dólares por libra. Si se producen x1 lb de Quim A y x2 lb Quim B por día, escríbase la transformación en la cual la ganancia está representada por los valores de la imagen.
Por tanto, la ganada se puede representar Solución La ganancia total es igual a la cual es una transformación lineal sobre doncomo de la ganancia son los valores de la imagen en Puede pensarse en esto como T: (espacio de la producción)
(espacio de las ganancias)
Si la compañía química del ejemplo 1 desea maximizar la ganancia diaria, lo que debe maximizarse es el valor de T. A menos que se proporcione más información, un ingeniero químico no podrá tomar una decisión basándose sólo en los valores de x1 y x2. Sólo se puede producir una cantidad finita de cada compuesto diariamente. Además, como sucede a menudo, la producción de un artículo limita la producción del otro, ya que la maquinaria, la fuerza de trabajo o los recursos deberán estar compartidos.
ALGEBRA LINEAL CON APLICACIONES
448
EJEMPLO
2
Solución
Con respecto al ejemplo 1, supóngase que la producción total máxima por día es de 3000 Ib, y que no puede hacerse más de 2000 lb de Quim A por día. Exprésense como desigualdades estas restricciones sobre la producción. Las restricciones son
Además de las restricciones ya enumeradas, se tiene Por tanto, para maximizar la ganancia diaria debida a Quim A y Quim B, la compañía de químicos deberá considerar el problema Maximizar Sujeta a Al problema de maximizar una función lineal de las variables decir, maximizar los valores de la imagen de una transformación lineal sujeta a restricciones en forma de desigualdades lineales se le llama programación lineal (PL). La expresión para T recibe el nombre de función objetivo, y a la región definida por las restricciones en forma de desigualdades se le llama región permisible. La región permisible (admisible) es simplemente el subconjunto de En que contiene las formas posibles de distribuir la producción. EJEMPLO
3
Solución
Grafíquese la región permisible del problema en los ejemplos 1 y 2. Menciónese varias formas posibles de distribuir la producción.
Cada desigualdad se gráfica por separado y luego se halla la intersección de las gráficas (véase la figura 7.1.1). La intersección de las regiones en la figura 7.1.1 se muestra en la figura 7.1.2. Cualquier punto en la región representa una distribución posible de la producción. Algunos ejemplos son (0, 0), (2000, 0), (0, 3000), (2000, 1000), (1000, 2000), (1000, 0), (2000, 500), (0, 2500), (1000, 1000), (500, 2000), (1500, 750) y (700, 300).
Los primeros cuatro puntos enumerados en el ejemplo 3 representan vértices, los segundos cuatro son puntos sobre la frontera y los últimos cuatro son puntos interiores. Se verá que los puntos de los vértices son los más importantes. Para problemas de PL en dos variables, la región permisible siempre tiene una frontera poligonal.
INTRODUCCIÓN A LA PROGRAMACIÓN LINEAL
449
Figura 7.1.1
Una observación clave para la solución de un problema de PL en dos dimensiones (tal como en el ejemplo presentado) es que T toma valores constantes sobre líneas rectas. En particular, para un número k, la ecuación ecuación que representa una recta en el plano A dichas rectas se les llama rectas de nivel para T. A lo largo de las rectas de nivel, la ganancia tiene el valor constante k; en la figura 7.1.3 se han dibujado algunas rectas de nivel. Nótese que las rectas son paralelas y que la ganancia aumenta según las rectas se desplazan hacia el primer cuadrante. Figura 7.1.2 Región accesible.
450
ÁLGEBRA LINEAL CON APLICACIONES
Ahora se superpone en la figura 7.1.3 la región accesible (véase la figura 7.1.4). En la figura 7.1.4 se ve que la máxima ganancia posible es de $8000, lograda con una distribución de la producción de 2000 lb de Quim A y 1000 lb de Quim B. Se dice que ésta es la distribución de producción óptima. Se ha hallado la recta de máxima ganancia constante que también interseca la región accesible. Figura 7.1.3
Rectas de ganacia constante
Figura 7.1.4 Rectas de ganancia constante y la región accesible.
INTRODUCCIÓN A LA PROGRAMACIÓN LINEAL
451
En el caso general de n productos se aplica el mismo método. En vez de rectas de ganancia constante se tendrán planos o hiperplanos de ganancia constante. La región permisible será un poliedro en el espacio enedimensional, en lugar del polígono en el espacio bidimensional. La distribución óptima de la producción será, igual que antes, la que ocurra en uno de los vértices del poliedro. Esto lo garantiza el teorema que sigue, el cual es un teorema fundamental de la programación lineal.
TEOREMA
7.1.1
una transformación lineal. Sobre el dominio restringido de un poliedro P, los valores máximos y mínimos de T ocurren en los vértices de P.
Sea
No podemos demostrar este teorema en general, pero podría generarse una demostración para el caso bidimensional observando las rectas de nivel de T. En la figura 7.1.5 se muestran algunos de los varios casos posibles para valores máximos y mínimos. El teorema dice que con el objeto de maximizar o minimizar a Ten una región permisible limitada, sólo se necesita hallar todos los vértices Figura 7.1.5 Algunas posibilidades en el problema de PL bidimensional. Las rectas son La dirección de k creciente se indica mediante la flecha.
ÁLGEBRA LINEAL CON APLICACIONES
452
luego se calculan man los valores mayor y menor.
EJE MP LO
4
Solución
Maximice y minimice
y de la lista resultante se to-
sujeta a las restricciones
Se gráfica la región accesible. Nótese que los lados de la región son las rectas Es decir, las fronteras se hallan simplemente cambiando todos los signos de desigualdad (restricciones) por signos de igualdad (ecuaciones), y se obtiene la región mostrada en la figura 7.1.6. Sus vértices son Ahora se calcula para hallar que
donde El máximo de T es 6 y ocurre en El máximo de T es —28 y ocurre en Obviamente también hay distribuciones de la producción en donde intervienen varios productos. Dado que ya no es posible graficar las regiones permisibles para cuatro o más productos, se hace necesario un método analítico para resolver el problema de la PL. Podría pensarse que la forma de hacer esto seria hallar todos los vértices de la región permisible y calcular el valor de T en los vértices. Sin embargo, si n es grande, éste es en sí un problema difícil. Un método ampliamente utilizado para resolver problemas enedimensionales de PL es el algoritmo símplex. En este método, en esencia, lo que se hace es seguir la pista de los valores de T conforme uno se desplaza de un vértice al vértice vecino, donde T tenga un valor mayor o igual. Una vez obtenido un vértice donde T toma valores menores o iguales que en todos los vértices circundantes, se ha hallado el vértice óptimo. Nótese que el algoritmo símplex puede fracasar
Figura 7.1.6 Región accesible para el ejemplo 4.
INTRODUCCIÓN A LA PROGRAMACIÓN LINEAL
453
(debido a limitaciones de tiempo o a que la región permisible no está limitada) en algunos casos, pero funciona bien en casi todos los problemas de PL que aparecen en la práctica.
PROBLEMAS 7.1
En los problemas 1 al 4 se dan una función objetivo lineal y algunas restricciones. Determínense los valores máximo y mínimo de la función objetivo.
5. En optimización, si la función objetivo es no lineal, entonces el máximo puede no ocurrir en uno de los vértices de la región permisible. Muéstrese que el máximo de sobre la región
ocurre en x = 4, y = 4, el cual punto no es un vértice. [Sugerencia: ¿qué aspecto tienen las curvas xy = k?] 6. En optimización, si la función objetivo es lineal pero las restricciones son no lineales, el máximo puede no ocurrir en un vértice. Muéstrese que el máximo de = x + y en la región Los "vértices" de la región accesible ocurre en el punto es lo que se llama punto son (0, 0), (0, 4) y (4, 0). Sin embargo, extremo de la región. 7. Idéese un ejemplo para el problema 5 con la palabra máximo sustituida por la palabra mínimo. 8. Idéese un ejemplo para el problema 6 con la palabra máximo sustituida por la palabra mínimo. 9. Una compañía fabricante de segadoras de césped hace dos tipos de segadoras: un modelo básico y un modelo autopropulsado. La compañía tiene una sola línea de ensamblado. A lo sumo se harán 150 segadoras del tipo básico al día y 120 segadoras del tipo autopropulsado. El objeto de estas restricciones es evitar la sobreoferta y el consecuente abatimiento de los precios. Debido a estas limitaciones se podrán hacer a lo sumo 200 segado-
454
ÁLGEBRA LINEAL CON APLICACIONES
ras por día. Las podadoras se venden a $180 dólares (modelo básico) y a $250 (modelo autopropulsado). ¿Qué distribución de la producción hará que la ganancia sea máxima? 10. Con respecto al problema 9 supóngase que, para introducir un nuevo modelo autopropulsado, éste se va a vender al menudeo a $170 dólares. ¿Qué distribución de la producción hará que la ganancia sea máxima? 11. La falta de fronteras de la región accesible puede ser importante. Considérese Maximizar Sujeta a Muéstrese que T no tiene un máximo en esta región accesible.
7.2
REFORMULACIÓN DEL PROBLEMA DE PL El algoritmo simplex es un método para resolver problemas de PL. Como preparación para el empleo del algoritmo, el problema de la PL se reescribirá en cierta forma particular. Se considerará en detalle el problema Maximizar Sujeta a
donde El problema consiste en hallar vectores
cuyas componentes maximicen a T y satisfagan las desigualdades dadas. En notación más breve, el problema se puede enunciar como
El problema (7.2.2) es, por supuesto, difícil. El enfoque del algoritmo símplex se basa primeramente en cambiar el problema difícil por uno cuya solución podamos encontrar, es decir, ecuaciones lineales. Las "variables suaves" se introducen en las desigualdades mediante la regla
INTRODUCCIÓN A LAPROGRAMACIÓN LINEAL
455
Así las restricciones en forma de desigualdades se cambian por restricciones en forma de ecuaciones. Si a las variables se les asigna otro nombre de acuerdo con
en-
tonces se tienen las restricciones en la forma abreviada
donde
son particionadas:
Por supuesto,
EJEMPLO 1
Solución
para el ejemplo 1 de la sección 7.1.
Hállense matrices El problema era Maximizar Sujeta a Por tanto,
Introduciendo las variables suaves se tiene Maximizar Sujeta a de manera que
Hasta aquí todo lo que se ha hecho es reescribir el problema de la PL. Está en la forma
456
ÁLGEBRA LINEAL CON APLICACIONES
Maximizar
donde
Sujeta a Ahora sea
(es decir,
es la j-ésima columna de
Con esta notación, (7.2.3) se puede escribir como (hallar la Y para) Maximizar con
EJEMPLO
2
Escríbase el problema del ejemplo 1 en la forma (7.2.4).
Solución
Además
Desarrollando (7.2.4) resulta
Maximizar
maximizar
INTRODUCCIÓN A LA PROGRAMACIÓN LINEAL
457
En la forma (7.2.4) el problema de la PL se convierte en:
De este modo el problema de la PL se ha reformulado como un problema de seleccionar una combinación lineal particular de vectores para representar a un vector dado.
PROBLEMAS
7.2
1. Reescríbase el problema 1 de la sección 7.1 en la forma (7.2.4). 2. Reescríbase el problema 2 de la sección 7.1 en la forma (7.2.4). 3. Reescríbase el problema 3 de la sección 7.1 en la forma (7.2.4). 4. Reescríbase el problema 4 de la sección 7.1 en la forma (7.2.4). 5. Reescríbase Maximizar Sujeta a
en la forma (7.2.4).
7.3 INDEPENDENCIA LINEAL, SOLUCIONES ACCESIBLES DE PL Y EL ALGORITMO SÍMPLEX A los vectores y que satisfacen las restricciones
de (7.2.4) se les llama soluciones accesibles (permisibles) de (7.2.4). Cualquier solución accesible que maximice PT Y se llama solución accesible óptima. Las soluciones accesibles óptimas son soluciones para el problema de PL original. Las soluciones accesibles tienen una propiedad importante. Para poder analizarla, los valores de yj en
ÁLGEBRA LINEAL CON APLICACIONES
458
se llamarán pesos de las Es decir, es el peso de y así sucesivamente. Además, a Y se le denomina el vector de peso. La propiedad fundamental de una solución accesible óptima es la siguiente:
Este teorema se puede demostrar con algunos conceptos que están más allá del alcance de este texto, conceptos tales como conjuntos convexos, puntos extremos y funcionales lineales. El teorema establece que una solución accesible no puede ser óptima si los vectores con peso positivo forman un conjunto linea/mente dependiente.
EJEMPLO
1
El problema del ejemplo 1 de la sección 7.1 tiene la forma (7.2.4)
Para tener una solución accesible óptima, a lo más dos de los pesos pueden ser diferentes de cero ya que los vectores 1, 2, 3, 4, son todos de cuya dimensión es 2. La solución hallada anteriormente, obliga a que Por tanto, el conjunto de vectores A con peso positivo es
el cual es linealmente independiente.
EJEMPLO
2
Con respecto al ejemplo 1, podría elegirse arbitrariamente = 3000 2000 y tener
satisfecha, con el conjunto de vectores con pesos positivos
linealmente independientes. Sin embargo, PT Y = 0 y evidentemente no está maximizado. Con este ejemplo se recalca el hecho de que la independencia li-
INTRODUCCIÓN A LA PROGRAMACIÓN LINEAL
459
neal de los vectores con pesos positivos no se suficiente para dar una solución accesible óptima Y. La pregunta ahora tiene que ser ¿cómo calcular Y que sea solución de (7.2.4)? En términos generales, se puede hacer lo siguiente: 1. Comenzar con una solución accesible
Es decir, hacer ta forma se satisfacen las restricciones. Los vectores simplemente forman la base canónica para
En eshasta Llámese
2. Cambiar la base eliminando un vector de ella y añadiendo uno de los en tal forma que para obtener una nueva base vectores haga que el nuevo vector de peso, llámese éste (¡De nuevo el problema de la base!) 3. Repetir el procedimiento hasta que en el paso S pueda aumentar sin más cambios de base. Puede demostrarse que este procedimiento dará resultados; aun cuando no se demostrará, lo aplicaremos a un ejemplo. Comenzamos con
la matriz
y la base
460
ÁLGEBRA LINEAL CON APLICACIONES
los dos últimos vectores en podría hacer lo siguiente:
Nótese que
Para construir
se
1. Emplear
entonces la restricción da 2. Emplear
entonces la restricción da
lo cual da
- 1000, que viola la restricción
3. Emplear
entonces la restricción da
y se tiene
En este caso
Como 6000 en el caso 1 y en el caso 3, cualquiera de los dos puede tomarse como una base para Se elige
Ahora queremos construir
Elegimos las
como
pero ésta no es una base no se emplea porque ya se usó al construir Para
INTRODUCCIÓN A LA PROGRAMACIÓN LINEAL
461
hallamos de la restricción que
y obtenemos Si tratamos de hallar sólo obtendremos bases que ya han sido construidas y que dieron valores menores para P T Y. Entonces la solución del problema de PL es
tal como se obtuvo antes usando métodos geométricos. El procedimiento recién aplicado sería demasiado engorroso en problemas grandes. Un algoritmo para simplificar los cálculos es el algoritmo simplex. Se basa en la búsqueda de bases, tal como se acaba de hacer. A continuación se enunciará el método y se usará en algunos ejemplos.
Algoritmo simplex
Considérese este problema de un máximo:
Maximizar Sujeta a
1. Escriba la tabla simplex inicial [la cual es una matriz de (m + 1) x (m + n + 2)]
2. Seleccione un elemento negativo en el primer renglón, y llame columna pi vote a la columna en la que se encuentre. 3. Seleccione un renglón pivote enumerando todos los cocientes obtenidos al dividir cada elemento positivo de la columna pivote entre los elementos correspondientes de la última columna, y tomando aquel renglón que dé el cociente más pequeño.
462
ÁLGEBRA LINEAL CON APLICACIONES
4. El elemento común al renglón pivote y la columna pivote se llama pivote. Aplicando operaciones de renglón, iguale el elemento pivote a 1 y obtenga ceros por encima y por debajo del pivote. 5. Si no hay elementos negativos en el renglón 1, deténgase e inicie paso 6. En caso contrario repita los pasos 2, 3 y 4. 6. Llame tabla simple final a la tabla resultante. El valor máximo de T en el problema de PL es el primer elemento de la última columna de la tabla símplex final. Una vez más se resolverá el problema de ejemplo, en esta ocasión con el algoritmo símplex. El problema es Maximizar Sujeta a
La tabla símplex inicial es
El paso 2 requiere elegir un elemento negativo del renglón 1. Una posibilidad es —3, haciendo así que la columna pivote sea la columna 2. Los cocientes del paso 3 son entonces el renglón pivote es el renglón 3. Las operaciones de renglón requeridas en el paso 4 son 3R3 + Rl y - R3 + R2. Esto da por resultado la tabla
Como todavía hay un elemento negativo en el renglón 1, se repiten los pasos 2, 3 y 4. El elemento pivote está en el segundo renglón y tercera columna. Usando 2R2 + Rl, se obtiene la tabla símplex final
y el valor máximo de T en el problema de PL es 8000, y x2 = 1000, x1 = 2000. Como otro ejemplo, considérese una compañía fabricante de productos químicos que usa tres productos, A, B y C, para hacer tres compuestos D, E y F. Las cantidades máximas de A, B y C disponibles por día son 75, 200 y 300
INTRODUCCIÓN A LA PROGRAMACIÓN LINEAL
463
libra de A y libras, respectivamente. Cada libra de D requiere libra de B; cada libra de E requiere de de libra por cada uno de A, B y C, y cada libra de F requiere de libra de B y de libra de C. El producto final se vende como sigue: D, a $2 dólares por libra; E, a $1 dólar por libra, y F a $3 dólares por libra. ¿Qué distribución de la producción hará que sea máxima la ganancia diaria? Sean las cantidades en libras de D, E y F, respectivamente, producidas al día. Entonces la ganancia es R = Ahora hay que deducir las restricciones que pesan sobre X. Debido a las limitaciones en A, B y C se tiene
El problema de maximizar R es un problemas de PL. La tabla símplex es
Usando —3 para identificar la columna pivote, el renglón pivote es el renglón 3; después de efectuar operaciones de renglón se tiene
En el paso siguiente, la columna pivote es la columna 2, y el renglón pivote es el renglón 2. Después de operaciones de renglón se obtiene la tabla símplex final
La ganancia máxima es de $1550 dólares. Empleando
para la distribución óptima de la prose halla ducción. La demostración de que el algoritmo símplex funciona bien para problemas de máximos se puede hallar en la mayor parte de los textos avanzados de
ÁLGEBRA LINEAL CON APLICACIONES
464
programación lineal. En esos textos también se pueden encontrar un tratamiento de los problemas de mínimos, el fenómeno de los ciclos y otras sutilezas del método símplex.
Epílogo El algoritmo simplex fue ideado por el matemático George Dantzing de la Universidad de Stanford en 1947, y ha sido la herramienta básica de los programas de PL desde entonces. En el verano de 1984, Narendra Karmarkar, un matemático de los laboratorios AT&T Bell, hizo el anuncio de un nuevo algoritmo, el cual sería significativamente más rápido que el algoritmo símplex. En diciembre de 1985 (IEEE Spectrum, diciembre de 1985, pp. 54 y 55) todavía existía una controversia en la comunidad matemática acerca de la supuesta rapidez del algoritmo de Karmarkar. La rapidez es determinante en algunas aplicaciones de la PL a problemas grandes, como la reprogramación de los horarios de las líneas aéreas cuando por efectos del clima hay que modificar los horarios normales. La aplicación exitosa a gran escala del nuevo algoritmo a problemas inaccesibles al método símplex determinará si los matemáticos aplicados aceptan el nuevo algoritmo como una herramienta valiosa. (Véase Business Week, septiembre 21, 1987, p. 68) Independientemente del resultado de la controversia, el revuelo causado por el algoritmo de Karmarkar muestra que las matemáticas y el álgebra lineal están lejos de ser disciplinas rígidas y anquilosadas; por el contrario, son áreas de estudio y aplicaciones llenas de vida y en crecimiento.
PROBLEMAS
7.3
1. Resuélvase el problema 1 de la sección 7.1 a) construyendo una base y b) usando el algoritmo símplex. 2. Resuélvase el problema 2 de la sección 7.1 a) construyendo una base y b) usando el algoritmo símplex. 3. Resuélvase el problema 3 de la sección 7.1 a) construyendo una base y b) usando el algoritmo simplex. 4. Resuélvase el problema 4 de la sección 7.1 a) construyendo una base y b) usando el algoritmo símplex. 5. Empléese el algoritmo símplex para resolver Maximizar Sujeta a
RESUMEN
El problema de la base es una herramienta fundamental en el desarrollo del algoritmo símplex para resolver un tipo de problema de optimización eonocido
INTRODUCCIÓN A LA PROGRAMACIÓN LINEAL
465
como problema de programación lineal. La literatura acerca de la PL es vasta; aquí el tema apenas se ha rozado superficialmente. Hace poco (1984) se inventó un nuevo algoritmo para resolver problemas de PL, conocido como algoritmo de Karmarkar. Este nuevo algoritmo promete ser más rápido para la solución de problemas de PL a gran escala.
Un número complejo z es un número en la forma a + bi, donde a y b son reales e i es la unidad imaginaria que tiene la propiedad El conjunto de los números complejos se denota por Se escribe z = a + bi, y a se llama la parte real de z y b la parte imaginaria de z. Para z = 3 - 5i, la parte real de z es 3 y la parte imaginaria de z es -5. Esto se escribe
Dos números complejos son iguales si y sólo si sus partes reales e imaginarias son iguales. El cero para Las reglas de adición, sustracción, multiplicación y división de los números complejos son las siguientes:
(formalmente se usan las leyes distributivas)
Entonces si
se tiene
ÁLGEBRA LINEAL CON APLICACIONES
468
El conjugado de un número complejo z = a + bi se escribe como
y se define
Nótese que si y sólo si b = 0, es decir, si y sólo si z es real. A continuación se enumeran propiedades importantes del conjugado: Si z1 y z2 son números complejos, entonces
Considérese, por ejemplo, los números usados anteriormente Se tiene La magnitud de
se indica por
y se define por
Si se asocia a + bi con el punto (a, b) Por tanto, es la distancia de cero al en los ejes de la figura 1.1, se puede apreciar que número complejo. Los números complejos junto con las operaciones definidas forman un campo numérico. Esto significa que tiene las mismas propiedades que Conmutatividad de la adición y la multiplicación Figura I.1
NÚMEROS COMPLEJOS
469
Asociatividad de la adición y la multiplicación
Identidad aditiva Inverso aditivo Identidad multiplicativa Inverso multiplicativo
Debido a la validez de estas operaciones, los cálculos con los números complejos difieren de los cálculos con números reales sólo en las operaciones en sí.
Para demostrar un enunciado acerca de los enteros positivos, puede utilizarse el principio de la inducción matemática (PIM). Sea P(n) una proposición acerca de los enteros positivos. Por ejemplo,
son todos ellos ejemplos de tales proposiciones. Para demostrar que P(n) es verdadera, el PIM dice que es suficiente hacer dos cosas: 1. Demostrar que P(n) es válida para el primer valor que pueda tomar n. Generalmente n = 1, aunque no necesariamente debe ser siempre así; por ejemplo, para (II.3) el primer valor de n es 4. Nota: ésta es la hipótesis de inducción. 2. Demostrar que
entonces P(k + 1) también es verdadera.
Puede parecer extraño que sea necesario demostrar sólo dos afirmaciones para mostrar la veracidad de una proposición para un conjunto infinito de valores de n. Considérense, sin embargo, las instrucciones siguientes para ensartar un número infinito de cuentas en un collar:
472
ÁLGEBRA LINEAL CON APLICACIONES
1. Si la cuenta anterior era roja, ensártese otra cuenta roja. 2. Primero ensártese una cuenta roja. Bastan dos instrucciones para completar el collar infinito. Como ejemplo, considérese (II.3) [(II. 1) ya se tomó en cuenta en el texto]. Entonces P(n) es
1. ¿Es cierto P(4)? Veamos: así que
y P(4) es verdadera. 2. Supóngase que P(k) es verdadera, es decir, supóngase que k! > 2k. Es necesario demostrar que P(k + 1) es cierta, es decir, debe probarse que (k + 1)! > 2k+1. Comenzando con k! > 2k, se multiplican ambos lados por k + 1 y se halla
Por lo tanto,
Debido al PIM es cierto que
Una de las aplicaciones de las ecuaciones lineales es el ajuste de curvas a datos que pueden representarse mediante puntos en el plano. Por ejemplo, si una persona lleva el registro de la presión de un gas a diferentes temperaturas, la información podría representarse como en la figura III. 1. Una razón para "ajustar" una curva a puntos de datos de este tipo es la de usar una curva que pase por todos los puntos de datos; a este proceso se le llama colocación. Otro método consiste en hallar la recta con respecto a la cual se agrupen los datos; esto se puede hacer mediante el proceso llamado regresión lineal de mínimos cuadrados. En la figura III.2 se muestran estas dos posibilidades. EJEMPLO
1
Solución
Figura III. 1
Hállese una función cuadrática p(x) = ax2 + bx + c que pase a través de los puntos (— 1, 6), (1, 4) y (2, 12) en el plano xy. Hay que hallar los coeficientes a, b y c en p(x). Como la gráfica de y = p(x) debe pasar por todos los puntos, se deberá tener
ÁLGEBRA LINEAL CON APLICACIONES
474
Figura III.2
Curva de colocación
Recta de "mínimos cuadrados"
Entonces las ecuaciones para a, b y c están representadas por la matriz aumentada
Esto se reduce por renglones a
y c = 2, b = -1,0 = 3. La función cuadrática es p(x) = 3x2 — x + 2 (véase la figura III.3). En el segundo ejemplo es preciso conocer las llamadas ecuaciones normales para los mínimos cuadrados. Estas ecuaciones se deducen en los cursos de cálculo; aquí simplemente se enunciarán.
en el plano xy, la Dados N puntos ecuación de la recta que mejor se ajusta por mínimos cuadrados es y = AX + B, donde A y B son las soluciones de las ecuaciones normales
AJUSTE DE CURVAS
475
Figura III.3
Figura III.4
Notes que la matriz de coeficientes es simétrica. De la regla de Cramer se deduce que este sistema siempre tiene una solución única si los valores de x son distintos. EJEMPLO
2
Hállese la recta que mejor se ajusta por cuadrados mínimos para el conjunto de puntos (0, 2), (1, 1), (2, 3) y (3, 6). Grafíquense los datos y la recta.
Solución Identificando
con (0, 2),
con (1, 1), etc., se tiene
y las ecuaciones normales son
por lo cual, La recta que mejor se ajusta por cuadrados mínimos es la cual, como se puede ver en la figura 111.4, sigue la tendencia de los puntos de datos El empleo de los métodos de colocación o el de mínimos cuadrados en un problema dado depende de la aplicación específica. La mayor parte de las veces los métodos de mínimos cuadrados son la mejor elección. Hay métodos de mínimos cuadrados en los cuales se usan funciones no lineales para ajustar da-
476
ÁLGEBRA LINEAL CON APLICACIONES
tos. En general, puede decirse que existen programas de computadora para llevar a cabo la mayor parte de los métodos de ajuste de datos. Dimensiones mayores Considérese un conjunto de puntos en el espacio tridiEn este caso, para la mensional descripción lineal de los datos, se puede intentar "ajustar" un plano a los puntos. El problema de los cuadrados mínimos se convierte, con z = Ax + By + C, en Minimizar (sobre todas las posibilidades
Igualando las derivadas parciales a cero para localizar los extremos posibles, se obtienen tres ecuaciones con tres incógnitas para las ecuaciones normales. Éstas se pueden resolver para determinar el plano que mejor se ajuste por cuadrados mínimos. Cuando el número de dimensiones excede a 3, es necesario hablar de "hiperplanos que mejor se ajustan por mínimos cuadrados", y las ecuaciones normales tienen una matriz de coeficientes de n x n si los datos están en En.
PROBLEMAS
1.1
1. a) No Lineal, f) No lineal.
b) No Lineal, c) Lineal, d) Lineal, g) No lineal. h) Lineal.
e) No Lineal,
3. Sea L el número de lotes de carne ordinaria y E el número de lotes de carne extra. Las ecuaciones son Grasa total = 10 = 1.5L + E Roja total = 80 = 8.5L + 9E La solución es L = 2, E = 7. 5. x = 2.1, y= -.9
7. x = 76/13, y = -5/13
9. B = 400C + 0.35T + 120H
PROBLEM AS
1.2
1.
arbitrario No hay solución arbitrario No hay solución. 3. a), b), d), g) y h) están en forma escalonada por renglones. c) No, ya que
e) No, porque
f) No, porque 5. En cada caso hay que eliminar variables. a) Sólo una solución, independientemente de los valores de a y b. hay un número inno hay solución; si b)Si finito de soluciones.
478
ÁLGEBRA LINEAL CON APLICACIONES
c) Sólo una solución, independientemente de los valoes de a y b. no hay solución; si d) Si mero infinito de soluciones.
0, hay un nú-
7. La reducción por renglones lleva a
Por tanto, si d — cb/a la condición es
se tiene una solución única. Equivalentemente,
9. La reducción por renglones como en el problema 7 lleva a
entonces se tiene una solución única.
Si ad - bc 11. Supóngase primero que
Entonces se puede reducir por renglones
Ésta es la forma escalonada reducida por renglones. Supóngase por otra parte que a = 0. Entonces se tiene ad - be = -bc = 0, así que b = 0 o c = 0. Si b = 0 y c = 0, se tiene la matriz
La cual se reduce por renglones a lonada reducida por renglones de
Si d = 0 se tiene
Si
se tiene la forma esca-
RESPUESTAS A LOS PROBLEMAS DE NUMERO IMPAR
Si b =
479
se tiene la matriz
La forma escalonada reducida por renglones es
Si b
0 y c = 0, se tiene la matriz
La forma escalonada reducida por renglones es
13. Sustitúyase:
15.
arbitrario
17. a) Véase la solución del problema 11. b) Sencillamente considérense todas las parejas. Compárese por ejemplo
Ninguna operación de renglón puede introducir un elemento diferente de cero en el primer renglón y primera columna de la primera matriz. Entonces estas dos matrices no pueden ser equivalentes por renglones. c) Supóngase que una matriz de 2 x 2 pudiera tener dos formas escalonadas reduccidas por renglones diferentes. Estas formas tendrían que provenir de la lista en b. Sea A la matriz original y sean B y C dos formas escalonadas reducidas por renglones. Entonces, por el resultado del problemas 16, como C es equivalente por renglones a A y A es equivalente por renglones a B, C tiene que ser equivalente por renglones a B, lo cual es una contradicción. 19. El último renglón consta solamente de ceros. Efectúense las operaciones de renglón -R1 + R2, - R1 + K3, . . ., -R1 + Rn. Luego
ÁLGEBRA LINEAL CON APLICACIONES
480
para obtener
Ahora ya es fácil colocar sólo ceros en los renglones del 3 al n. arbitrario
21.
23. Para la parte 1 supóngase que tanto,
es una solución del sistema. Por
A continuación multiplíquese la ecuación i por r para obtener para la i-ésima ecuación
Luego se factoriza: De(l),
en consecuencia,
Como todas las demás ecuaciones no cambian, es también una solución para ellas. Así, es una solución para el nuevo sistema. Este argumento es reversible si se multiplica por 1/r. En la parte 2, nótese que el intercambio de dos ecuaciones simplemente reorganiza el sistema, no habiendo ocurrido ninguna operación algebraica. P R O B L E M AS
1.3
(a) .0008. (b) .5480 x 107. (c) .7930. (d) .5000 x 104
RESPUESTAS A LOS PROBLEMAS DE NUMERO IMPAR
481
La solución exacta es del cálculo para a:
Usando - .6721R1 + R2 se tiene
Se tiene entonces
Así, después de redondear,
Nota: en b después de pivoteo parcial y sustitución en reversa la ecuación para es
Si se calcula (99.1 + 1) —0.1 se obtiene 99.9. Si se calcula 99.1 + (1 0.1), se obtiene 100. En el primer caso la sustracción de un número pequeño de un número grande conduce a una imprecisión. La solución exacta es x 1 = 100, x 2 = 1 y x 3 = 0.1.
No se obtiene
9. ventaja con el pivoteo.
ÁLGEBRA LINEAL CON APLICACIONES
482
PROBLEMAS
1.4
a) Renglón uno, columna dos. b) Renglón tres, columna dos. c) Renglón dos, columna uno. d) Renglón cuatro, columna uno. e) Renglón dos, columna tres. f) Renglón seis, columna uno.
Por ejemplo
No.
son posibles otros ejemplos.
Tómese a
Todos los elementos de B son cero.
No. Sean
Se pueden presentar otros ejemplos.
No es posible.
PROBLEMAS
1.5
RESPUESTAS A LOS PROBLEMAS DE NUMERO IMPAR
Todos son iguales siempre que Sí. Sean Pero siempre que (es decir, fuera de la diagonal). Por tanto, A + B es una matriz diagonal.
483
484
ÁLGEBRA LINEAL CON APLICACIONES
Sí. Sean
simétricas. Es decir, supóngase que para todo
Pero
Por tanto, A + B es simétrica.
a) El producto de matrices diagonales es diagonal. Sean A y B diagonales y C = AB. Entonces
Pero si
la suma se desarrolla como
y se ve que cada sumando es cero, ya que al menos uno de los factores en cada sumando tiene subíndices diferentes. Por tanto, cuando AB es diagonal.
b) No. Considérese
c) No. Considérese d) Sí. Sean siempre que
triangulares superiores, es decir, Sea C = AB y considérese
En el desarrollo de la suma, cuando
Pero cuando
Así, cuando
en la suma
Entonces
por lo que
485
RESPUESTAS A LOS PROBLEMAS DE NUMERO IMPAR
b) Sí. Sean A y B antisimétricas, de tal manera que AT = —A y BT = — B. Se tiene
por lo que A + B es antisimétrica. c) No. Sea A antisimétrica: A T = -A. (A 2 )T = (AA)T = A T AT = (-A) ( — A) = A2. Por tanto, A2 es simétrica. (Nota: A = 0 es simétrica y antisimétrica a la vez.) d) Sí. Sea A antisimétrica, esto es, AT = —A. Entonces (A3)T = (AT)3 = (—A)3 = — A3, por lo que A3 es antisimétrica. e) No mucho, a menos que AB = BA. Sean A simétrica y B antisimétrica, de manera tal que AT = A, BT = -B. Se tiene que (AB)T = BTAT = -BA. Si AB = BA, entonces (AB) T = -BA = -AB y AB es antisi métrica. f) En la diagonal solamente debe haber ceros. Después de todo, entonces cuando se tendrá y esto es posible si y sólo si 13. Si y sólo si AB = AB. Calculando, se tiene (A + B)(A -B) = A(A - B) + B(A - B) = A2 - AB + BA - B2 15. Calcúlese para comprobar. 17. a) No. Considérese D
b) Si D es una matriz escalar, AD = DA por el teorema 1.5.2, partes g y h 19. Sea
Como
es real, entonces
Entonces
486
ÁLGEBRA LINEAL CON APLICACIONES
Usando el problema 20, el sistema es
Para a) y b) simplemente realícense los cálculos.
la diagonal de unos se desplaza hacia el extremo superior derecho. An = 0. Entonces
Sea
Resuélvase No hay solución
RESPUESTAS A LOS PROBLEMAS DE NUMERO IMPAR
487
b) Resuélvase
d sin restricciones.
c) V puede ser cualquier matriz simétrica. 35. Como no hay renglones de ceros y el número de columnas es igual al número de renglones, la forma escalonada reducida por renglones por lo menos es como se muestra:
Como por la definición de forma escalonada reducida por renglones sólo pueden haber ceros arriba de cada 1 de comienzo de renglón, la forma tiene que ser 37.
A y C son simétricas B es antisimétrica B es 39. Utilícese la inducción. Para por conmutatividad, tesis de inducción es que (para n Para demostrar que ces, el último término es igual a funciona en la misma forma. para PROBLEMAS
1.6
Por otra parte, se tiene Utilizando El argumento
488
ÁLGEBRA LINEAL CON APLICACIONES
7. det (AB) = det A det B; det (AB) = det B det A. Pero det A, det B son solamente números complejos; en consecuencia, det A det B = det B det A. Por lo tanto, det (AB) = det (BA). 9. det (AB) = det
= 645
det A det B = (15)(43) = 645.
11. Utilícese la inducción. P(n) es: si A es de n x n, entonces det A 7 = det /I. 1. P(2) es verdadera. Sean
Por tanto, det A = det AT. 2. Supóngase que P(k — 1) es verdadera y demuéstrese que P(k) también lo es. Considérese
Nótese que y como por la hipótesis de inducción que det usando el último renglón para A
son de k - 1 x k - 1, se tiene Ahora
y usando la última columna para B,
13. det A*
15.
es evidentemente triangular superior, por lo que su determinante es el producto de los elementos de la diagonal. Entonces, det
RESPUESTAS A LOS PROBLEMAS DE NUMERO IMPAR
17. Como
489
det A. Entonces
19. El determinante debe ser cero. Como Entonces
21. No. Por ejemplo,
ambos tienen determinante cero, pero no son iguales. 23. El determinante es cero si n es impar. Se tiene
por lo que
Por otra parte, det AT = det A (siempre), así que
Si n es par no se puede afirmar nada. Sin embargo, si n es impar se tiene det A = -det A y, por lo tanto, det A = 0.
PROBLEMAS
1.7
490
ÁLGEBRA LINEAL CON APLICACIONES
5. ¡Al gusto del lector! 7. det (AB) = det A det B = (det A)0 = 0. Como det (AB) = 0, AB no es invertible. 9. A es no singular por lo cual A-1 existe. Multiplíquese AB = A C a ambos lados por A - 1 .
Obsérvese que la multiplicación fue desde la izquierda; a esto se le llama premultiplicar.
Como la inversa de una matriz es única, A T = A-1. 13. Como det
así que 1/det siendo positivo debe entonces ser igual a 1.
15. No. Sea A de 3 x 3 y antisimétrica, AT = -A. Además, det A T = det (—A) = ( — 1)3 det A = -det A. También det A T = det A, por lo que det A = — det A y deberá ser det A = 0. Generalización: si n es impar, Anxn es antisimétrica, entonces det A = 0 y A no es invertible (véase el problema 23 de los problemas 1.6). 17. Si A es nilpotente de exponente k, Ak = 0. Pero 0 = det 0 = det (A *) = (det A)k, por lo que det A = 0 y A es singular. 19. Si AB es invertible, det (AB) 0. Entonces (det A )(det B) 0 y ni det A ni det B pueden ser cero. Por tanto, las dos, A y B, son invertibles. 21. Se tiene A-1 - B-1. Multiplíquense ambos lados por B (desde la derecha):
RESPUESTAS A LOS PROBLEMAS DE NÚMERO IMPAR
491
Ahora multiplíquense ambos lados por A (desde la izquierda):
23. En la última sección se vio que cada determinante es diferente de cero, por lo que H2, H3 y H4 son invertibles. Empleando los valores de la última sección,
PROBLEMAS
1.8
Es. 3. a) No es. Para el segundo renglón c) No es. Para una matriz antisimétrica, todos los elementos de la diagonal son cero, d) Sí es.
5. No necesariamente. Considérese
ÁLGEBRA LINEAL CON APLICACIONES
492
Estas no son definidas positivas porque son simétricas con determinante negativo.
Éstas son simétricas y los "subdeterminantes" requeridos son positivos, por lo cual son definidas positivas, pero el primer renglón de cada una impide que sean DEDR.
PROBLEMAS ADICIONALES
1. Sí, agregando una ecuación inconsistente con una ecuación previa. Por ejemplo,
(CAPÍTULO 1)
tiene una solución única. Agréguese x + y = 3. 3. Si A es invertible la respuesta es sí, porque y B sólo tiene elementos reales. Si A no es invertible, entonces es posible tener soluciones complejas a menos que por alguna razón estén fuera de consideración. Por ejemplo,
tiene la solución
donde s es completamente arbitrario y podría dársele cualquier valor complejo. 5. No necesariamente. Considérese
Si A y B son reales A + iB puede seguir siendo no invertible. Considérese
RESPUESTAS A LOS PROBLEMAS DE NÚMERO IMPAR
493
7. No necesariamente.
pero
11. La matriz de dominancia es
Las fuerzas de los competidores del 1 al 4 son 7, 6, 4 y 8, respectivamente. Se predice que el competidor 4 podría ser el ganador, aunque en realidad hay varias posibilidades; ¿qué tal si los competidores 1 y 2 deciden trabajar en conjunto hasta eliminar al competidor 4? Encontes el competidor 2 podría confiarle el plan al competidor 3 y hacer el trato de que una vez que el competidor 4 hubiese sido eliminado, trabajasen juntos para eliminar al competidor 1.
494
ÁLGEBRA LINEAL CON APLICACIONES
Los circuitos combinados no son equivalentes.
En circuitos en paralelo, la colocación arriba o abajo de las cajas es intrascendente. PROBLEMAS
2.1
Entonces
La longitud de
13. Sea v = (a, b). Entonces rv = (ra, rb).
Los elementos de
15. Sean v =
Los elementos de
Por tanto, PROBLEMAS
2.2
son
son
RESPUESTAS A LOS PROBLEMAS DE NÚMERO IMPAR
7. Mediante cálculo directo
495
Similarmente
9. Colóquese el cubo en tal forma que una de las esquinas se halle en el origen y las tres aristas que parten de la esquina se encuentren sobre los ejes x, y y z. Si la longitud de cada lado es s, entonces la diagonal forma el vector (s, s, s). El ángulo entre la arista sobre el eje x y la diagonal es el ángulo entre (5, 0, 0) y (s, s, s).
Tómese (1) + (2).
a) Tómese (1) — (2) y úsese 13.
PROBLEMAS
2.3
por lo tanto
1. a) Dilatación, constante 3; b) contracción, constante c) dilatación, constante 2; rotación, radianes.
El orden puede invertirse. 3. Una posibilidad es una rotación de eje x1:
radianes y la proyección sobre el
ÁLGEBRA LINEAL CON APLICACIONES
496
Nótese que no funciona. Otra posibilidad es proyectar el eje radianes: primero y luego rotar
b) Rotación horaria de
radianes.
5. (a)
7. Si X1 > 0, x2 > 0, entonces
y f es la identidad. Si x1 < 0 y z2 < 0,
Pueden hacerse enunciados similares para los otros casos: x1 < 0, x2 > 0 (reflexión) y x1 > 0, x2 < 0 (reflexión). Es decir, en cada cuadrante, f está representada por una multiplicación matricial; f es "lineal en cada cuadrante". PROBLEMAS
2.4
RESPUESTAS A LOS PROBLEMAS DE NÚMERO IMPAR
497
es normal al plano y V = (2, 1, 3) es paralelo a la recb) La sustitución de las expresiones para x, y y z en
PROBLEMAS ADICIONALES ( C A P Í T U L O 2)
3. Las ecuaciones homogéneas son
Las ecuaciones reducidas son
La solución es 5. El sistema de ecuaciones se puede escribir
El sistema tiene una solución no trivial si el determinante de la matriz de coeficientes es cero. El determinante es cero independientemente del valor de k. Por tanto, el sistema se puede equilibrar para cualquier k. 7. Si A y B son fuerzas componentes y
El lado derecho representa la rotación del vector resultante. 9. Sean A y B las fuerzas componentes y sea Ck la matriz de contracción. EnEl lado derecho representa la contractonces ción del vector resultante.
498
P ROBLEM AS
ÁLGEBRA LINEAL CON APLICACIONES
3.1
1. 3. Elíjase, por ejemplo,
5. (3, -2, 1) = 3(1, 0, 0) - 2(0, 1, 0) + 1(0, 0, 1).
7. det
11. La ecuación es equivalente a
Éstas se reducen a
13. Sea
Ejemplo en
15. Sea
Ejemplo en
Sea
RESPUESTAS A LOS PROBLEMAS DE NUMERO IMPAR
PROBLEMAS
3.2
499
V es un espacio vectorial.
V es un espacio vectorial.
V es un espacio vectorial.
V es un espacio vectorial.
V es un espacio vectorial. V es un espacio vectorial. V no es un espacio vectorial. No se cumple la cerradura para la adición. Por ejemplo, I y -I están en V, pero I + - I = 0 no está en V. V no es un espacio vectorial. No se cumple la cerradura para la adición. Considérese, por ejemplo, el caso para n = 2:
Pero A2 = B2 + 0 por lo que A y B son nilpotentes. Sin embargo, (A + 0 y ninguna potencia de A + B es igual a cero. B) 2 = I 17. V no es un espacio vectorial. No se cumple la cerradura para la multiplicación por un escalar. Supóngase que A está en V de tal modo que A2 = I. Considérese 2A: (2A)2 = 4A2 = 4 I 19. V no es un espacio vectorial. La verificación es prácticamente la misma que en el ejemplo 7 de esta sección. 21. V es un espacio vectorial.
25. V es un espacio vectorial. 27. No. La existencia del vector PROBLEMAS
3.3
en 4 se da en 3.
1. W no es un subespacio porque W no es cerrado ante la multiplicación escalar. Por ejemplo, si A está en W, (- 1)A no está en W. 3. W es un subespacio. 5. W no es un subespacio porque no es cerrado ante la adición vectorial. Por ejemplo,
están en W pero su suma no lo está.
500
ALGEBRA LINEAL CON APLICACIONES
7. W es un subespacio. 9. W no es un subespacio. Obsérvese que los escalares pueden tener una parte imaginaria diferente de cero. Así, por ejemplo, si A está en W, iA no está en W y W no es cerrado ante la multiplicación por un escalar. 11. W es un subespacio.
13. W es un subespacio.
15. Como el conjunto de soluciones es un subconjunto W de las opera(recuérdese que un subespacio es un subcosciones usuales son las de junto que es espacio vectorial). Si X y Y son soluciones cualesquiera, entonces
por las leyes del álgebra matricial. Entonces W es un subespacio. 17. tr A =
Además
Para la última parte, sean AB =C, BA = D, de modo tal que
Ahora bien,
Trabajando con la última serie se intercambia el orden de las sumas y se emplea la conmutatividad en para obtener
Pero los subíndices son solamente índices mudos a los que se les puede dar cualquier nombre y eso no altera el valor de la suma. Sea entonces q = i, p = k y se halla
RESPUESTAS A LOS PROBLEMAS DE NÚMERO IMPAR
19. Supóngase que Entonces íá en W. Además,
501
están en W. Entonces
entonces
está en W. Si en el segundo caso no está en W porque
21. Si W es un subespacio, entonces n(0, 0, 0) está en W y las eucaciones en la definición deben ser válidas para alguna t. Si las ecuaciones son válidas para alguna t = T se tiene k 1 = -aT,k 2 = -bT y k 3 = -cT. Por
La cerradura no es difícil de mostrar. Si están en W, entonces
Además PROBLEMAS
3.4
(a, b, c) está en gen (S) si y sólo si c S es linealmente independiente. 3. a) (a, b, c) está en gen (S) si y sólo si c = a + ib; b) S es linealmente dependiente; c) (i, i — 1, — 1) = i( 1 , i , 0) + i(0, 1, i). 5. a) Gen (S) es E 2 ; b) S es linealmente dependiente; c) (7, 12) 7. a) (a, b, c) está en gen (S) si y sólo si (a, b, c) es un múltiplo escalar de (1, — 1,2); b) S es linealmente dependiente; c) (0, 0, 0) = 0(1, - 1, 2). 9. o) Gen (S) consiste en todas las matrices reales de 2 x 2 con traza cero; b) S es linealmente independiente. 11. Sean ver
por la matriz aumentada
Inténtese resoldos vectores de Las eucaciones resultantes están representadas
502
ÁLGEBRA LINEAL CON APLICACIONES
La reducción por renglones lleva a la ecuación 0 = (expresión en a, b, c) y (a, b, c) no puede ser arbitrario. y considérese 13. Sean = (0, 0) Las ecuaciones resultantes están representadas por la matriz.
Como hay menos ecuaciones que incógnitas, existe una solución no trivial. 15. Los elementos de gen (S) son de la forma a + bx2 donde a y b son arbitrarios. 17. Los elementos de gen (S) son matrices reales de la forma
donde a y b son arbitrarios. Evidentemente A es simétrica y tiene traza cero. 19. Sea S
linealmente dependiente y sea Considérese
Hay una solución no trivial para esta ecuación. De hecho, tomando se tiene
lo cual tiene una solución no trivial por la dependencia lineal de S.
21.
RESPUESTAS A LOS PROBLEMAS DE NÚMERO IMPAR
503
23. Si AB = BA, entonces AB - BA = 0 y [A, B] = 0; si [A, B] = 0, entonces AB - BA = 0 y AB = BA. PROBLEMAS
a) Es una base; b) no es una base; conjunto linealmente dependiente;
3.5
c) no es una base; no genera a E2; d) no es una base; conjunto linealmente dependiente; e) no es una base; conjunto linealmente dependiente. es una base que contiene a S. Hay otras
3.
soluciones posibles. Es una base que contiene a S. Hay otras soluciones posibles. es una base que contiene a S. Hay otras solu-
7.
ciones posibles. 9. S es linealmente dependiente y todo vector en S se puede escribir como una combinación lineal no trivial de los demás. La eliminación de uno cualquiera de los vectores da una base para gen S. 11. Elimínese x - x2. Si se elimina x + x2 el conjunto que queda es linealmente dependiente. 13. El conjunto
es una base de E5; dim E5 = 5.
es una base para
es una base de una base de
dim
dim
La base canónica para
es también
504
ÁLGEBRA LINEAL CON APLICACIONES
19. Fórmese la base S tal que el elemento en el i-ésimo renglón y j-ésima columna es 1 y todos los demás elementos son cero). S tiene n2 elementos, por lo que dim Una base para las matrices simétricas es, empleando la notación indicada,
por ejemplo,
El número de elementos en mensión del subespacio de las matrices simétricas es 21. La dimensión de ambas es mn. Constrúyanse bases utilizando los resultados de los problemas 15, 17 y 19 como guía. 23. a) rango de A = 2 ; b) rango de A = 4 ; c) rango de A = 2 .
25. Una base es S
27. a) (A B) se reduce a
por lo cual, rango de A = rango de (A\B) = 3 y existe una solución. b) (A \B) se reduce a
Por tanto, rango de A
rango de (A \ B) y no existe solución.
c) (A \B) se reduce a
Por tanto, rango de A = rango de (A \B) = 2 y existe una solución.
RESPUESTAS A LOS PROBLEMAS DE NUMERO IMPAR
PROBLEMAS
3.6
505
1. a) Es un producto interno, b) No es un producto interno; por lo que significa necesariamente que x es el vector cero.
0 no
c) No es un producto interno por lo que 0 no significa necesariamente que x es el vector cero. d) No es un producto interno; e) No es un producto interno; nótese que vector no es el vector cero.
pero el
f) No es un producto interno; nótese que vector no es el vector cero.
pero el
g) No es un producto interno; nótese que el vector no es el vector cero.
pero
h) No es un producto interno;
si y ya que Si por lo menos uno de los dos, a o b, es menor que sólo si cero, entonces no se cumple la propiedad 4) y no se tiene un producto interno.
Como Por tanto,
y luego si y sólo si
0 menos que
Nótese que
b) Para x elíjase (1, 1, 0) ya que evidentemente es ortogonal a (1, -1,2). Ahora sea y = (- 1, 1, 1), el cual es evidentemente ortogonal a (1, - 1, 2) y no es un múltiplo de (1, 1, 0). Por supuesto que se podría proceder
506
ÁLGEBRA LINEAL CON APLICACIONES
como sigue. Después de elegir se tomaría exigiéndose que lo cual implicaría Se tendría entonces Ahora se desea tenga sólo la solución trivial. Las ecuaciones son
que se reducen a
Se tendrá la solución trivial si y sólo si s mar cualquier valor. Entonces
mientras que r puede toes una posibilidad.
9. por tanto
11.
si y sólo si
son números reales. Entonces
De la definición de producto interno, si y sólo si Por tanto,
13.
15.
17. a) m = 2, n = 3. Para una matriz cuadrada y, por tanto,
Como
RESPUESTAS A LOS PROBLEMAS DE NÚMERO IMPAR
507
son reales. los elementos de las matrices de En consecuencia,
así que
lo cual es una suma de cuadrados de números reales. Por tanto, y es igual a cero si y sólo si Es decir, = 0 si y sólo si A = 0 .
PROBLEMAS
3.7
1. Para verificar la ortogonalidad muéstrese que todos los productos internos posibles son cero. Para obtener una base ortonormal, basta con normalizar todos los vectores. Es una base ortonormal de E3. Es una base ortonormal de E3.
3. c) y d) son matrices ortogonales.
es ortonormal, lo que se es cuatro. El conjunto 7. La dimensión de es demuestra calculando todos los productos internos posibles. Como
508
ÁLGEBRA LINEAL CON APLICACIONES
un conjunto de cuatro vectores linealmente independientes y dim es una base. Usando
Supóngase que Es decir,
se tiene
es ortogonal. Entonces Por tanto, A es ortogonal.
así que Por tanto b) Considérese
del problema 4. A es unitaria y det A = i. por lo que Como A sólo tiene elementos reales, det A
a) Como
se tiene det
Pero det det U det
b)Como U*U = I, se tiene det U* = 1 /(det U). A continuación se procede igual que en la parte a). 19. A es involutoria, así que do m un entero no negativo,
Si n es impar entonces
sien-
21. Una matriz idempotente no necesariamente es simétrica. Por ejemplo,
satisface A2 = A y A no es simétrica.
RESPUESTAS A LOS PROBLEMAS DE NÚMERO IMPAR
509
23. Al analizar A * A hay que recordar que los elementos de A * se han conjugado. Por lo demás, los pasos son exactamente los mismos. 25. Como las columnas deben ser ortonormales en
se tiene
Si a y b son reales, esto se reduce a la condición de que a + ib sea un número complejo de módulo uno.
PROBLEMAS
3.8
15. Sea x elemento de V. Síganse los pasos indicados. Entonces Dado que cualquier base debe tener n vectores, cada columna tiene n elementos.
ÁLGEBRA LINEAL CON APLICACIONES
510
PROBLEMAS
3.9
Como f y g son funciones con valores reales,
Como f y f' son continuas en [a, b], esta integral puede anularse si y sólo si/es idénticamente cero. 7.
a) Linealmente independiente; b) linealmente independiente; c) linealmente independiente. Considérese La función no tiene derivada en Si la ecuación debe tener una solución no trivial para todo x, entonces debe tener una solución no trivial para dos valores cualesquiera de x Sean éstos x = 1 y x = 8; se obtiene
El cual sólo tiene la solución trivial. Entonces la ecuación no puede tener una solución no trivial para todo x y S debe ser linealmente inindependiente. cos El conjunto de soluciones es un subespacio. Si f y g son soluciones entonces Por
RESPUESTAS A LOS PROBLEMAS DE NÚMERO IMPAR
511
la cerradura, el conjunto solución es un subespacio. Como son dos soluciones linealmente independientes de y" = y, entonces es evidente que dim gen
PROBLEMAS ADICIONALES ( C A P I T U L O 3)
1. V no es un espacio vectorial; V no es cerrado ante la multiplicación escalar. 3. Sí. El espacio V es enedimensional y la ecuación es equivalente a o bien Por tanto, Entonces el conjunto es un conjunto de n vectores linealmente independientes en un espacio enedimensional y debe ser una base. 5. El conjunto es una base para V. Como V es enedimensional, lo único que hay que demostrar es que S, al tener n elementos es una base, genera a V. Sea x un elemento de V. Como Enexisten constantes tales que tonces se puede escribir para ver que S genera V.
9. El conjunto de matrices ortogonales de n x n no es un subespacio de Por ejemplo, cuando n = 2,
es ortogonal pero 2/ no es ortogonal. 11. Supóngase que X y Y satisfacen AX = cX, AY = c Y. Se tiene que A(X + Y) = AX + AY = cX + cY = c(X + Y), por lo que V es cerrado ante la adición. Además A(rX) = rAX = rcX = c(rX) y V es cerrado ante la multiplicación escalar. Por tanto, V es un subespacio de 13. Con el producto interno dado, una base ortonormal es La mejor aproximación es
512
ALGEBRA LINEAL CON APLICACIONES
Nótese que
Ahora sustitúyase i por k como el índice de la suma.
P RO BL EM AS
4.1
Lineal. No lineal. Lineal. No lineal.
Lineal.
Lineal. No lineal. No lineal.
excepto cuando
No lineal. T ni siquiera está definida en P = 0. Lineal. imagen de por lo que ker T = = 3. dim (dominio de T) = dim E3 = 3. ker T no tiene base, la base canónica es suficiente para la imagen de T. ker T imagen de (T) Base para ker T Base para imagen de (T)
elemento de
ker T no tiene base. La base canónica es suficiente para la imagen de T. ker T imagen de
arbitraria, polinomios de grado dos con término constante igual a cero
RESPUESTAS A LOS PROBLEMAS DE NÚMERO IMPAR
513
base para ker T base para la imagen de T dim (dominio) = dim imagen de así que no tiene base. La base canónica es suficiente para la imagen de T. ker
Sea T: V
definida por
para todo
en V. Sea c cualquier esca-
Por tanto, Sea definida por cualquier escalar
para todo
donde
Pero Úsese la sugerencia. por el problema 14. Por tanto, Divídanse ambos lados entre q. Para mostrar que la imagen de T es un subespacio de W, sólo se requiere demostrar la cerradura. Sean elementos de la imagen de T. Esto significa que existen en V tales que Ahora en la imagen de T para se plantean las preguntas de cerradura: ¿está Se en la imagen de 77 Considérese cualquier escalar y está esPero V es un espacio vectorial, así que tiene tá en V. Entonces está en la imagen de T. Considérese ahora Como V es un espaSe tiene está definido y se enestá en V, por lo que ció vectorial, cuentra en la imagen de T.
23. (3, 0, 4) no está en gen ({(1, 0, 1), (2, 1, 0))). Esto se ve mostrando que (3, 0, 4) = c1(1, 0, 1) + c2(2, 1, 0) da origen a ecuaciones lineales inconsistentes. elemento de don25. Supóngase que la recta está dada por Se tiene de X y Y están en elemento de Pero los puntos que satisfacen forman una recta ya que la ecuación es una ecuación vectorial para una recta. PROBLEMAS
4.2
se reduce a
514
ALGEBRA LINEAL CON APLICACIONES
Entonces el rango de A es igual a 2. Las soluciones son Una base para el espacio solución es
Así, dim (espacio solución) + rango (A) = 1 + 2 = número de columnas de A. b) (A |0) se reduce a
Así, rango (A) = 2. Las soluciones son base para el espacio solución es
Una
Entonces dim (espacio solución) + rango (A) = 1 + 2 = 3. c) (A |0) se reduce a
Entonces rango (A ) = 2. Las soluciones son {(x, y, z, w) = ( — 4s -2t, 7s + t, 10s, 10t)}.- Una base para el espacio solución es
Entonces dim (espacio solución) + rango (A) = 2 + 2 = número de columnas de A.
RESPUESTAS A LOS PROBLEMAS DE NUMERO IMPAR
Directamente.
515
Usando M: canónica
Por tanto, para una base y supóngase que la Tómese el dominio imagen tiene la base canónica. En ese caso,
Por otra parte, si
es la base de la imagen,
la transformación cero. Es decir, para todo bases para el vector cero de W. Sean respectivamente. Entonces (en forma única). Entonces cada columna de M2 consiste únicamente en ceros.
Sea
Para cada valor de k, k Así, la columna k + 1 de M tiene n + 2 elementos, siendo todos cero excepto el elemento k + 2, que vale 1.
PRO BLE M AS
4.3
516
ALGEBRA LINEAL CON APLICACIONES
b) Las matrices de transición son como en lb.
RESPUESTAS A LOS PROBLEMAS DE NÚMERO IMPAR
517
a) Las trazas no son iguales. b) Ni las trazas ni los determinantes son iguales. c) Se tiene tr A = tr B, det A = det B; hay que hacer un poco más de tra bajo. Sea
y supóngase que PB = AP. Desarrollando los productos e igualando elementos de los matrices se obtienen las ecuaciones
lo cual significa que a = b = 0. Pero, entonces
la cual no es invertible. Entonces A no puede ser similar a B. Háganse las correspondencias.
Es decir, identifíquese la primera componente de un elemento en E2 con el coeficiente constante del polinomio de grado uno; identifíquese la segunda componente de un elemento de E2 con el coeficiente de x en el polinomio de grado uno. PROBLEMAS
4.4
La matriz canónica de T es
M no es invertible, pero M2 = M. Por tanto, T no es invertible pero sí es idempotente.
518
ÁLGEBRA LINEAL CON APLICACIONES
La matriz canónica para T es
M es invertible y M2 = I. Por tanto, T es invertible pero no es idempotente. La matriz canónica para T es
M es invertible.
Por tanto, M no es nilpotente. En realidad no hay que trabajar tanto. Recuérdese el siguiente problema que se tenía en un capítulo anterior: "mostrar que si A es nilpotente, entonces det A = 0". Entonces, si sabemos que M es invertible, sabemos que M no puede ser nilpotente. De cualquier manera T es invertible y no es nilpotente. La matriz canónica para una rotación de 120° es
Entonces
La matriz canónica para T es
RESPUESTAS A LOS PROBLEMAS DE NÚMERO IMPAR
519
Como det M = 0, M no es invertible. Conforme se calculan potencias más altas de m, la diagonal de unos se desplaza hacia la esquina inferior izquierda; Entonces T es nilpotente. T no es idempotente porque
Si A es involutoria y B es similar a A, entonces B es involutoria. Supóngase que Entonces Como es involutoria. por tanto, B es simétrica. Considérese la ecuación para determinar la independencia:
Usando la linealidad de L se tiene
Como el núcleo de L es solamente el vector cero, entonces
implica que la última ecuación La independencia lineal de 0. Por tanto, tiene solamente la solución es un conjunto linealmente independiente.
PROBLEMAS
4.5
Como V es un subconjunto del espacio vectorial de todas las funciones desólo es necesario mostrar la cerradura. Sean g y f funciones finidas en con
¿Tiene f + g un límite en a? Del cálculo se tiene el teorema según el cual
Entonces f + g tiene un límite en a y f + g está en V. Similarmente, rf es elemento de V Nótese que los teoremas del cálculo referentes a los límites en un punto a se pueden escribir abreviadamente de acuerdo al enunciado del problema
520
ALGEBRA LINEAL CON APLICACIONES
Es decir,
es una transformación lineal de V a
Por identidades trigonométricas, cos (nx - x) — cos (nx + x) = cos nx cos x + sen nx sen x — (cos nx cos x — sen nx sen x) = 2 sen nx sen x. Así.
Del cálculo se deduce que
Entonces La
matriz canónica para D2 es
que es igual a M2. Podría intentarse
Pero se ve que la "constante de integración" c es un problema. Si restringimos nuestra atención al subconjunto de funciones en V con f(0) = 0 entonces c = 0 y en ese caso l podría invertir la acción de D.
rot
RESPUESTAS A LOS PROBLEMAS DE NUMERO IMPAR
521
Y ahora se usa la linealidad de la derivada parcial.
Como g no es el vector cero pero está en el núcleo de T, ker no es invertible. PROBLEMAS ADICIONALES
(CAPÍTULO 4)
tal que El núcleo de T es toda subespacio de matrices simétricas.
el núcleo es el
dim (matrices simétricas de n x n) dim (matrices triangulares superiores de n x n) Las dimensiones son iguales.
que es Para saber si T es uno a uno se analiza No puede simplemente multiplicarse por ya que P podría no ser invertible. Por ejemplo, si
satisface
pero P no es invertible. Obsérvese que, si se elige
522
ALGEBRA LINEAL CON APLICACIONES
PA = 0 pero uno a uno.
Entonces en general no puede afirmarse que T sea
entonces
Si
Por tanto, si A es nilpotente de exponente k, existe y
det
Por tanto,
es la transformación cero. Además,
Por tanto,
también es la transformación cero y para todo t, así que A (t) es invertible
para todo t. Además para todo t por lo que A (t) es ortogonal para todo t. Supóngase que una recta tiene la ecuación vectorial Entonces Los puntos descritos por R se transforman en los puntos Esta es la ecuación de una recta.
Pero
se tiene entonces
RESPUESTAS A LOS PROBLEMAS DE NÚMERO IMPAR
523
o bien
que se reduce a
Por tanto, usando Usando una calculadora, 1.00000000, con la precisión de la calculadora. Nótese que si se comienza con el método de Newton dará la solución Así pues lo que se tome como punto inicial en el método de Newton afecta el resultado que se obtenga con ese método. Tal como sucede en cálculo, el método de Newton no siempre funciona, pero cuando lo hace lo hace bien.
PROBLEMAS 5.1
Sea S 1 = estado "usuario de detergente líquido", y sea S 2 = estado "usuario de detergente en polvo". La matriz de transición es Esta semana
Próxima semana El estado inicial es
del mercado. Si la Después de 4 semanas el detergente líquido tendrá entonces campaña de publicidad lleva a un área de mercado de más de la agencia hizo un buen trabajo. El estado del domingo es
ALGEBRA LINEAL CON APLICACIONES
524
La probabilidad de un día seco no es mucho mayor que la probabilidad del sábado. PROBLEMAS
5.2
En cada una de las respuestas, el vector característico dado puede obviamente ser sustituido por cualquier múltiplo no nulo de él. Pares característicos
Pares característicos
Pares característicos Pares característicos Pares característicos Pares característicos Pares característicos Pares característicos
Pares característicos
Pares característicos
Tómese
por lo que Se sabe que
y así Multiplíquese por Pero Ahora divídase entre para obtener
RESPUESTAS A LOS PROBLEMAS DE NUMERO IMPAR,
525
El determinante de una matriz triangular es exactamente el producto de los elementos de la diagonal. La matriz es aún triangular y los elementos de la diagonal son Por tanto, det Evidentemente las soluciones de det los elementos de la diagonal de A. ya que Además, det det B para cualquier matriz cuadrada B, así que det y los valores característicos de A y satisfacen la misma ecuación característica. Por tanto, tienen los mismos valores característicos. det
Sea Entonces característico de A siempre que Se tiene
Por tanto, es un valor sea un valor característico de A.
por el problema 8. Supóngase ahora que y muéstrese que
Por tanto, por inducción,
es un par característico de A".
Por nilpotenun valor característico de A tal que Por otro lado, según el problema cía, para alguna debe ser por lo que Pero como Sea
PROBLEM AS
5.3
e) Los valores característicos son 1, 2, y 3, en 3 teniendo multiplicidad 2. es la solución para Para
526
ALGEBRA LINEAL CON APLICACIONES
Entonces se pueden elegir vectores característicos linealmente independientes como
Se tiene entonces
(g) No diagonalizable; 1 es un valor característico de multiplicidad 3 con espacio característico de dimensión 1.
(j) No diagonalizable; es un valor característico de multiplicidad 2 con un espacio característico de dimensión 1.
RESPUESTAS A LOS PROBLEMAS DE NÚMERO IMPAR
527
Por lo tanto,
por la invertibilidad de A). (Recuérdese el problema 10 de la última sección.) existe; de hecho los elementos diagonales de D son Por tanto, En consecuencia, es diagonalizable. 7. Siendo positivos todos los elementos de A, la traza de esta matriz debe ser positiva. Como A es diagonizable y la traza es invariante ante la similariPor tanto, ya que dad, traza de A traza de D son reales, uno de los valores características debe ser positivo para que la suma sea positiva. 9. Sea Como se tiene Entonces Si.
Las
Por tanto, todo valor característico X debe tener la propiedad únicas posibilidades son 1 o — 1 .
no es necesariamente una diagonalización de no se tendrá y a menos que necesariamente una diagonalización de A + B. Considérese
no es
Las dos son diagonizables (véanse los ejemplos 2 y 11) pero su suma
no es diagonalizable.
528
PROBLEMAS
ÁLGEBRA LINEAL CON APLICACIONES
5.4
7. Aplíquese el procedimiento de Gram-Schmidt al espacio característico correspondiente a
9. det
Las raíces son que son complejas excepto si los cuales son valores no permitidos. Si se permiten valores característicos complejos se tiene
Entonces A es diagonalizable si se admiten valores característicos complejos.
15. Calcúlense todos los productos internos canónicos posibles de renglones distintos.
RESPUESTAS A LOS PROBLEMAS DE NÚMERO IMPAR
529
17. Como A es real simétrica es diagonalizable, y la diagonal de D consiste en los valores característicos de A. El determinante es invariante ante similaridad, así que det A = det D 19. A es diagonalizable con
donde
Pero
Por tanto
es una raíz cuadrada de S. Así,
PROBLEMAS
5.5
530
ÁLGEBRA LINEAL CON APLICACIONES
7. Valores característicos repetidos. 9. (3) Y(0)
11. La tasa de cambio de la concentración de sal en una célula es proporcional a la diferencia en las concentraciones de sal en las células adjuntas. Entonces
Multiplicando por el volumen v:
Los valores característicos son PROBLEMAS ADICIONALES (CAPÍTULO 5)
0, 3K; este último de multiplicidad 2.
1. No. La suma de matrices diagonalizables no es necesariamente diagonalizable, como se vio en un problema anterior. Por tanto, el conjunto de las matrices diagonalizables no es cerrado ante la adición.
y efectúense las siguientes operaciones de renglón y de coluego La matriz resultante es triangular inferior y el producto de los elementos de la diagonal es
5. Fórmese lumna:
Si A debe ser nilpotente, alguna de las poten7. A cias de D debe ser cero. Esto sólo es posible si D = 0. Entonces traza de A = traza de D = 0. 9. A
RESPUESTAS A LOS PROBLEMAS DE NUMERO IMPAR
531
A3 = 0 por lo cual
11. Sí
con
Por la positividad de los valores característicos se
puede formar
y así, raíz cuadrada de A.
En consecuencia,
13. La ecuación característica es
Se tendrán soluciones complejas si
15. La ecuación característica es ciones son
Existen soluciones complejas si
PROBLEMAS
6.1
1. a) H tiene el valor característico 1, de multiplicidad 10. b) La ecuación característica para H + E es
es una
Las soluciones son
Esto da
cuyas solu-
Esto lleva a
532
ÁLGEBRA LINEAL CON APLICACIONES
satisface la ecuación.
Nótese que
pero
no es menor que
d) H y E no son simétricas. 3. Considérese una matriz A como un vector es simplemente la forma canónica de Razonando en esta forma, por la desigualdad del triangulo. Entonces para dos matrices de n x n cualesquiera. En consecuencia,
en
La norma 1 es mayor.
PROBLEM AS
6.2
1. Después del paso en el que se ha calculado A6, el par característico dominante aproximado es
3. No hay par característico dominante. Todos los valores característicos de A son complejos. 5. Después del paso en el que se ha calculado A6, el par característico dominante aproximado es
7. Tal como se ha mencionado en esta sección, con el método de las potencias no es posible hallar valores característicos complejos. No obstante, es posible modificar el método. Considérese, por ejemplo,
RESPUESTAS A LOS PROBLEMAS DE NUMERO IMPAR
533
El par característico dominante es
Se elige
y se calculan AX0, A2X0, ..., igual que antes. Usando el truco del cambio de escala, se descubre que las versiones correspondientes de A6X0 y A7X0 son
por lo que se puede elegir
como un vector característico aproximado. Luego se calcula
y se determina si es casi un múltiplo de
Se tiene
y 2/.992i = 2.016/, 2.008i/1 = 2.008i. Estos cocientes son casi iguales. Podría tomarse su promedio 2.012i como valor característico aproximado. Se ve, pues, que puede haber un método de las potencias cuando hay valores característicos complejos. Sin embargo, si todos los elementos de A son reales y sus valores característicos son complejos, éstos deberán ocurrir en pares conjugados, lo cual es un problema, por lo menos en cuanto a la dominancia. En cualquier caso es necesario emplear aritmética compleja en la computadora.
534
ALGEBRA LINEAL CON APLICACIONES
no pudieron ser calculados; la causa de esta dificultad es la falta de simetría.
P R O B L E M AS
6.3
El método no converge; se cicla. PROBLEMAS ADICIONALES
1. Los valores característicos son - 15.88 y — 15.92. 3. Los valores característicos son —1 y -1/3.
(CAPÍTULO 6)
5. Los valores característicos son 0, — 1.2324k1 y — 2.4342k1, siendo aproximados estos dos últimos valores. 7. Ninguno de los círculos
tiene circunferencia o interior que interseque al eje real. PROBLEMAS
7.1
1. El máximo es 12 y ocurre en (4, 0). El mínimo es -8 y ocurre en (0, 4) 3. El máximo es 0 y ocurre en (0, 0). El mínimo es -38 y ocurre en (3, 7).
RESPUESTAS A LOS PROBLEMAS DE NÚMERO IMPAR
535
5. La gráfica de xy = 16 toca la región permisible en (4, 4). Si xy = x> 16, entonces xy = k no interseca a la región permisible en ningún punto. 7. Considérese T = — xy con la misma región accesible que en el problema 5. 9. Produciendo 80 modelos básicos y 120 modelos autopropulsados se maximiza la ganancia con un valor de $44 400. 11. Las rectas x + y = k intersecan a la región accesible para toda k,
PROBLEM AS
7.2
Maximizar Sujeta a
maximizar
ÁLGEBRA LINEAL CON APLICACIONES
536
Maximizar Sujeta a
5. Maximizar Sujeta a
PROBLEMAS
7.3
RESPUESTAS A LOS PROBLEMAS DE NUMERO IMPAR
537
Adición: de matrices, 49 de transformaciones lineales, 304 de vectores en el plano o en el espacio, 135 Álgebra de matrices, 59 Ángulo: entre vectores (producto interno), 237 entre vectores en un plano o en el espacio, 142 Aplicaciones: absorbedores por et as, 46 análisis estructural, 8 cajas negras (circuitos eléctricos), 50, 127, 128 códigos lineales, 201, 223 colocación, 473 columna de absorción, 131 confiabilidad de un componente, 6 corte cortante, 151 deformación homogénea, 335 (prob. 13) difusión, 393 distribución de edad estable, 408 estimación de parámetros, 106 geometría, 6 gráficas por computadora, 163 jerarquización de competidores, 127 (prob. 10) matrices de espín, 59 matriz de dispersión, 128 (prob. 14) navegación, 358 planeación óptima, 8 producción, 152 robótica, 358 sistemas vibratorios, 400 tensor de esfuerzos, 73 teoría de gráficas, 46
Base: canónica de En, 222 de un espacio vectorial, 216 Base canónica de En, 222 Base ordenada, 255 Base ortonormal, 238 Cn, 192 Cmn 193 C[a, b], 266 producto interno en, 272 Cn[a, b], 266 Cadena de Markov, 339 estado de equilibrio, 356 regular, 356 Columna de una matriz, 47 Combinación lineal de vectores, 202 Composición de transformaciones lineales, 314 Conjugado de una matriz, 72 Conjunto ortonormal, 238 Conmutador de dos matrices, 215 Contracción, 155 Coordenadas de un vector, 255 Cuadrados mínimos, 473 Delta de Kronecker, 63 Dependencia lineal, 207 Descomposición LU, 114 Desigualdad de Cauchy-Schwartz, 236 Desigualdad de triángulo, 236 Determinante: cálculo de, 81 mediante reducción por renglones, 86-90 de un producto de matrices, 92
540
ÍNDICE
definición de, 80 y la regla de Cramer, 91 Diagonalización ortagonal, 380 Diagonalización simultánea, 407 (prob. 13) Diagonalización unitaria, 388 Diferencia: de matrices, 49 de vectores en el plano y en el espacio, 136 Dígitos significativos, 37 Dilatación Dimensión de un espacio vectorial, 220 Distancia entre vectores, 236 E n , 179 Ecuación: de un plano, 168 de una recta, 168 Ecuación característica, 351 Ecuación no lineal, 3 Ecuación(es) lineal(es): definición de, 2 descomposición LU, 114 homogéneas, 11 iteración de Gauss-Seidel, 119 matriz aumentada de, 19 método de eliminación, 11 no homogéneas, 11 pivoteo parcial y, 39 pivoteo total y, 42 sistema de, 5 Ec. (1.1.3) solución de, 3 Ecuaciones homogéneas, 11 Ecuaciones no homogéneas, 11 Eliminación de variables: Gaussiana, 21 Gauss-Jordan, 25 Eliminación gaussiana, 21 con pivoteo parcial, 39 con pivoteo total, 41 Equivalencia por renglones, 23 Error: absoluto, 38 por redondeo, 38 relativo, 38 Error de redondeo, 38 Espacio característico (propio), 352 Espacio con producto interior, 236 Espacio euclidiano de dimensión n, 179 Espacio generado por un conjunto de vectores, 204 Espacio renglón de una matriz, 228 Espacio vectorial, 185 base de un, 216 base ordenada de, 255 dimensión de un, 220
generado finitamente, 216 subespacio de, 195 Forma escalonada por renglones, 24 Formas cuadráticas, 384 Igualdad de matrices, 47 Imagen de una transformación lineal, 285 Independencia lineal, 207 Invariantes bajo transformaciones de similaridad, 310, 321, 348, 370 Iteración de Gauss-Seidel, 119 convergencia de, 122 Jacobiano, 331 Longitud de un vector en un plano o en el espacio, 134 Mmn 187 Matrices de Hadamard, 392 (prob. 15) Matrices de Pauli (espín), 59 Matrices mal acondicionadas, 117 Matrices similares, 308 Matriz: antisimétrica, 76 (prob. 11) con diagonal estrictamente dominante sobre los renglones, 124 (prob. 3) conjugada de, 72 cuadradas, 47 de Hilbert, 111 (prob. 23) de Jacobi, 67 de Pauli (espín), 59 de Seifert, 79 (prob. 33) de transición, 258 de una transformación lineal, 298 definición de, 19 definida positiva, 113 determinante de, 81 diagonal, 65 diagonalizable, 362 diferencia de, 49 dominancia, 127 (prob. 10) elemental, 103 en forma escalonada por renglones, 23 equivalente por renglones, 23 escalar, 63 escalar múltiple de, 48 esparcida, 119 idempotente, 95 (prob. 17) identidad, 63 igualdad, 47 inversa, 96 invertible, 102 involutoria, 95 (prob. 18) mal acondicionada, 117
ÍNDICE
nilpotente, 95 (prob. 19) no singular, 102 nula, 63 orden de, 47 ortogonal, 247 particionada, 78 (prob. 32) potencia de, 71 producto de, 52 raiz cuadrada, 34 simétrica, 68 similar, 309 singular, 102 suma, 49 transpuesta, 67 transpuesta conjugada de, 72 traza, 201 (prob. 3) triangulo inferior, 67 triangular superior, 67 tridiagonal, 66 unimodular, 252 (prob. 13) unitaria, 249 Matriz ama de casa, 435 Matriz antisimétrica, 76 (prob. 11) Matriz aumentada, 19 Matriz cuadrada, 47 Matriz de coordenadas, 255 Matriz de Hilbert, 111 (prob. 23) Matriz de incidencia, 45 Matriz de Jacobi, 67 Matriz de transición, 258 Matriz definida positiva, 113 Matriz diagonal, 65 Matriz diagonalizable, 362 Matriz elemental, 103 Matriz escalar, 63 Matriz esparcida, 119 Matriz Hermitiana, 73 Matriz idempotente, 95 (prob. 17) Matriz identidad, 63 Matriz inversa, 96 cálculo de, 101 de un producto, 102 de una transpuesta, 103 Matriz invertible, 102 Matriz involutoria, 95 (prob. 18) Matriz nilpotente, 95 (prob. 19) Matriz no singular, 102 Matriz nula, 181 Matriz ortogonal, 247 Matriz particionada, 78 (prob. 32) Matriz representativa canónica, 299 Matriz simétrica, 68 Matriz singular, 101 Matriz triangular inferior, 66 determinante de, 84
541
Matriz triangular superior, 67 determinante de una, 84 Matriz tridiagonal, 67 Matriz unimodular, 252 Matriz unitaria, 249 Método de las potencias, 418 Método QR, 433 Métodos numéricos para el cálculo de valores propios: descomposición LU, 114 eliminación gaussiana con pivoteo parcial, 39 eliminación gaussiana con pivoteo total, 41 iteración de Gauss-Seidel, 119 método de deflación, 427 método de las potencias, 418 método de las potencias con cambio de escala, 426 método QR, 433 ,Múltiple escalar: de una matriz, 48 de una transformación lineal, 304 de vectores en el plano o en el espacio, 136 Norma de Frobenius de una matriz, 412 Norma de un vector, 236 Núcleo (kernel) de una transformación lineal, 283 Nulidad de una transformación lineal, 283 Números complejos (Apéndice I), 467 Operaciones de renglón, 23 Operaciones elementales por renglón, 23 Operador de coordenadas, 291 Operador de moméntum, 292 Orden de una matriz, 47
Pn, 188 Pivoteo parcial, 39 Pivoteo total, 41 Polinomio característico, 349 Polinomios de Laguerre, 274 (prob. 14) Polinomios de Legendre, 274 (prob. 12) Potencia de una matriz, 71 Problema de análisis geométrico, 154 Problemas fundamentales del álgebra lineal: cuarto (valores y vectores característicos), 346 primero (ecuaciones lineales), 5 quinto (diagonalización), 362 segundo (construcción de una base), 223 tercero (representación matricial), 296 Procedimiento de Gram-Schmidt, 246 Producto cruz en espacios vectoriales, 146
542
ÍNDICE
Producto de matrices, 53 Producto interior, 234 Producto punto de vectores en el plano o en el espacio, 144 Producto renglón-columna, 51 Programación lineal: algoritmo símplex, 461 función objetivo, 448 región permisible, 448 solución permisible, 457 solución permisible óptima, 457 teorema básico de la, 451 variables de alivio, 454 vector de peso, 457 Proyección, 155, 164, 249 Proyección ortogonal, 249 Punto fijo, 355 Rango: de transformación lineal, 286 de una matriz, 230 Rango columna de una matriz, 229 Rango de renglón de una matriz, 229 Regla de Cramer, 91 Renglón de una matriz, 47 Residual, 118 Rotación, 159 Solución: de ecuaciones lineales simultáneas, 5
mediante eliminación gaussiana, 21 de una sola ecuación lineal, 3 Solución no trivial, 12 Solución trivial, 12 Subespacio, 195 propio, 198 trivial, 198 Sustitución en reversa, 16 Transformación lineal: composición de, 315 definición de, 277 imagen (codominio) de, 285 invertible, 317 núcleo de, 283 nulidad de, 284 rango de, 286 representación matricial de, 298 Transpuesta de una matriz, 67 Trazo de una matriz, 201 (prob. 3) Unidad imaginaria, 3 Valor característico (propio), 346 Vector característico (propio), 346 Vector en un plano, 132 Vector normal, 167 Vector nulo, 181 Vectores ortogonales, 236 Vectores raíz, 406 (prob. 9)