¿Por qué está bien definida la dimensión de un espacio vectorial? ¿Cómo sé que todas esas bases deben tener el mismo número de elementos?

Los libros de texto estándar tratan este resultado realmente terrible, en mi opinión. Es común probar un resultado terriblemente técnico llamado “lema de intercambio” y luego deducir el resultado de esto. Para ser justos, se necesita hacer algo de trabajo. Sin embargo, la mayoría de los cursos de álgebra lineal ya han discutido la eliminación gaussiana en gran detalle cuando llegan a los espacios vectoriales, y este algoritmo proporciona fácilmente el paso técnico necesario.

Realmente hay una cosa menor que debes probar; el resto es solo un truco de notación. Si desea recordar cómo demostrar que la dimensión está bien definida, recuerde que todo lo que necesita hacer es probar el siguiente lema fácil. El resto es realmente bastante trivial.

Lema clave Si [math] v_1, \ ldots, v_m [/ math] son ​​vectores en [math] \ mathbb {R} ^ n [/ math] y [math] m> n [/ math], entonces son linealmente dependientes.

Prueba: escriba [math] v_i [/ ​​math] como vectores de columna y colóquelos en una matriz,

[matemáticas] A = (v_1 | \ cdots | v_m) [/ matemáticas].

Los vectores son linealmente dependientes si y solo si hay una solución distinta de cero [math] x \ in \ mathbb {R} ^ m [/ math] a la ecuación matricial

[matemáticas] A x = 0 [/ matemáticas],

donde el vector 0 a la derecha está en [math] \ mathbb {R} ^ n [/ math]. Pero este es un sistema lineal homogéneo de ecuaciones [matemáticas] n [/ matemáticas] en incógnitas [matemáticas] m> n [/ matemáticas], por lo que tiene una solución distinta de cero, por ejemplo, por eliminación gaussiana. QED

Para completar la prueba de que la dimensión está bien definida, suponga que [matemática] V [/ matemática] es un espacio vectorial y que [matemática] v_1, \ ldots, v_m [/ matemática] y [matemática] w_1, \ ldots, w_n [ / matemáticas] son ​​dos bases. Sin pérdida de generalidad, suponga [matemáticas] m> n. [/matemáticas]

Como las [matemáticas] w_i [/ ​​matemáticas] son ​​una base, podemos escribir las [matemáticas] v_j [/ matemáticas] en términos de las [matemáticas] w_i [/ ​​matemáticas]:

[matemáticas] v_j = a_ {1j} w_1 + \ cdots + a_ {nj} w_n [/ matemáticas].

Entonces los coeficientes de estas expansiones son vectores [math] m [/ math] en [math] \ mathbb {R} ^ n [/ math]. Por el lema, los vectores de coeficientes son linealmente dependientes. Pero entonces los [math] v_j [/ math] satisfacen la misma relación lineal que sus vectores de coeficientes, lo que contradice el hecho de que son una base.

Me limitaré a las dimensiones finitas en esta respuesta.

Suponga que tiene dos bases diferentes para un espacio vectorial [matemática] V [/ matemática]

[matemáticas] A = {a_1, a_2, \ ldots, a_n} [/ matemáticas]

[matemáticas] B = {b_1, b_2, \ ldots, b_m} [/ matemáticas]

Queremos mostrar que [matemáticas] n = m [/ matemáticas], y una buena manera de hacerlo es por contradicción. Suponga que [math] n> m [/ math], luego demuestre que esto viola alguna suposición.

Como todo lo que hemos dicho es que [matemáticas] A [/ matemáticas] y [matemáticas] B [/ matemáticas] son ​​bases, los supuestos que tenemos son

  1. Estos conjuntos son independientes.
  2. Estos conjuntos abarcan el espacio [matemática] V [/ matemática].

Intuitivamente, dado que [matemática] A [/ matemática] tiene más elementos, entonces si [matemática] B [/ matemática] es una base, [matemática] [[matemática] siente que debería romper la independencia, suposición 1. Tiene demasiados vectores. La base más pequeña [matemática] B [/ matemática] muestra que la dimensión es [matemática] m [/ matemática]. No puede ajustar más de [math] m [/ math] vectores en un conjunto sin que sean dependientes de alguna manera. Esa es la idea que queremos mostrar.

Mi pensamiento era hacer esto explícitamente. Encuentre una expresión directa para un vector en [math] A [/ math] en términos de los otros, o al menos describa un procedimiento para hacerlo. Quizás esto se pueda hacer primero escribiendo los elementos de [matemáticas] A [/ matemáticas] como combinaciones de [matemáticas] B [/ matemáticas], y pegándolos juntos de alguna manera. (Parece que no estoy solo pensando de esta manera. Es exactamente lo que escribió Vardhan Thigle. Sin embargo, decidió no llevarlo a cabo).

Esto resultó ser difícil para mí cuando lo intenté, y no tan simple o primitivo como recuerdo ser la prueba. Entonces, en lugar de pensar en [matemáticas] B [/ matemáticas] como una base y mostrar que [matemáticas] A [/ matemáticas] rompe la independencia, pensemos en [matemáticas] A [/ matemáticas] como una base, y mostrar que [ matemáticas] B [/ matemáticas] no puede abarcar el espacio.

La forma en que haremos esto es, pieza por pieza, construir una base que tenga todos los elementos de [math] B [/ math], más algunos adicionales. Si podemos demostrar que [math] B [/ math] es un subconjunto apropiado de alguna base, entonces seguramente [math] B [/ math] en sí mismo no puede abarcar [math] V [/ math].

Para hacer esto, pegue [math] b_1 [/ math] al final de [math] A [/ math] así que estamos viendo

[matemáticas] {a_1, a_2, \ ldots, a_n, b_1} [/ matemáticas]

Este conjunto ya no es independiente, ya que todo el punto de [matemática] A [/ matemática] es que podemos escribir

[matemáticas] b_1 = \ sum_i \ beta_i a_i [/ ​​matemáticas]

para algún conjunto de escalares [math] {\ beta_i} [/ math]. Para ser concreto, digamos

[matemáticas] b_1 = 2a_2 – a_3 + 0.7a_4 [/ matemáticas]

Lo que haremos a continuación es volver a convertir nuestro conjunto dependiente de gran tamaño en una base eliminando uno de los [math] a_i [/ ​​math]. En este caso eliminaremos [math] a_2 [/ math], por lo que tomamos el conjunto

[matemáticas] S = {a_1, a_3, a_4, \ ldots, a_n, b_1} [/ matemáticas]

(Asegúrese de eliminar uno de los [math] a_i [/ ​​math] que tiene un coeficiente distinto de cero en la ecuación para [math] b_1 [/ math]).

¿Es este conjunto [matemáticas] S [/ matemáticas] una base? Primero debemos asegurarnos de que es independiente. [math] b_1 [/ math] no se puede escribir en términos de las [math] a_i [/ ​​math] restantes porque hay una forma única de escribir cualquier vector en una base determinada. La forma única de escribir [matemáticas] b_1 [/ matemáticas] en términos de [matemáticas] A [/ matemáticas] involucraba [matemáticas] a_2 [/ matemáticas], y dejamos caer [matemáticas] a_2 [/ matemáticas].

Además, no hay forma de escribir algo como [math] a_3 [/ math] en términos de los otros elementos de [math] S [/ math]. Si hubiera, tendríamos una ecuación como

[matemáticas] a_3 = 4a_1 – a_4 + 6a_5 + \ ldots + 3b_1 [/ matemáticas]

eso no puede suceder, porque si sucediera, podríamos tomar nuestra ecuación para [matemáticas] b_1 [/ matemáticas], conectarla a lo anterior y mostrar que [matemáticas] a_3 [/ matemáticas] no es independiente del resto de la [matemática] a_i [/ ​​matemática]. (O, si observa de cerca, también podría terminar mostrando que las [matemáticas] a_i [/ ​​matemáticas] restantes no son independientes cuando deja [matemáticas] a_3 [/ matemáticas] fuera de las cosas. Piense en esto un poco más si es no está claro. La consecuencia es la misma: una violación de la suposición de que [math] A [/ math] es independiente).

Hemos demostrado que nuestro nuevo conjunto [math] S [/ math] es independiente. ¿Todavía abarca [matemáticas] V [/ matemáticas]? De hecho lo hace. Si [matemáticas] v \ en V [/ matemáticas], entonces

[matemáticas] v = \ sum_i v_i a_i [/ ​​matemáticas]

Hemos perdido [math] a_2 [/ math], pero si vuelves a nuestra ecuación para [math] b_1 [/ math], podemos reescribir [math] a_2 [/ math] como

[matemáticas] a_2 = \ frac {1} {2} (b_1 + a_3 – 0.7a_4) [/ matemáticas]

conectando eso a lo anterior, podemos escribir [math] v [/ math] en términos de [math] S [/ math].

Así que hemos creado una nueva base que contiene un único elemento de [matemáticas] B [/ matemáticas] y arroja un elemento de [matemáticas] A [/ matemáticas]. Vamos a iterar tomar [math] b_2 [/ math] y formar el conjunto

[matemáticas] {a_1, a_3, a_4, \ ldots, a_n, b_1, b_2} [/ matemáticas]

De nuevo, esto ahora depende. Descartamos otro elemento de [math] A [/ math] (cualquier elemento que sea parte de la expresión para [math] b_2 [/ math]), y por las mismas consideraciones podemos mostrar que esto crea una nueva base, ahora con dos elementos de [matemáticas] B [/ matemáticas] y [matemáticas] n-2 [/ matemáticas] de [matemáticas] A [/ matemáticas].

Haga esto una y otra vez para cada elemento de [matemáticas] B [/ matemáticas]. Es fácil ver que siempre funcionará. Cada elemento nuevo de [math] B [/ math] que agreguemos debe haberse hecho al menos parcialmente de algunos de los [math] a_i [/ ​​math] restantes, o de lo contrario no sería independiente del resto de [math ] B [/ matemáticas]. Cada vez que desechamos uno de esos [math] a_i [/ ​​math] que forman parte del elemento recién agregado de [math] B [/ math], el nuevo conjunto abarca el espacio y es independiente por las mismas razones que antes de.

Finalmente, obtenemos un conjunto con todos los [math] B [/ math] junto con los elementos [math] nm [/ math] de [math] A [/ math]. Este conjunto es una base para [math] V [/ math]. Por lo tanto, [math] B [/ math] no abarca [math] V [/ math] porque ninguno de los elementos [math] nm [/ math] restantes de [math] A [/ math] puede crearse a partir de [math ] B [/ matemáticas].

Asumiendo que [math] A [/ math] y [math] B [/ math] son ​​bases, la suposición original de que [math] n> m [/ math] debe ser incorrecta. Al cambiar las etiquetas, la suposición [matemática] m> n [/ matemática] también es incorrecta, entonces [matemática] n = m [/ matemática], y todas las bases tienen el mismo tamaño.

Referencias

Axler, Sheldon. Álgebra lineal Hecho a la derecha 2da ed
Teorema de dimensión para espacios vectoriales en Wikipedia

Es útil destilar la propiedad básica de “ser una base” que hace que esto sea cierto. La teoría que trata esta destilación se llama Teoría Matroide. Se basa en la observación de que hay varias áreas en matemáticas donde se define algo como “una base”, “un conjunto independiente” o “un conjunto de expansión”.

Por ejemplo, podemos definir de manera abstracta una noción de “conjunto independiente” en una configuración genérica.

– El conjunto vacío es un conjunto independiente

– Un subconjunto de un conjunto independiente es independiente

– Si [matemática] A [/ matemática] y [matemática] B [/ matemática] son ​​conjuntos independientes y [matemática] A [/ matemática] es mayor que [matemática] B [/ matemática], entonces puede encontrar un elemento de [math] A [/ math] de modo que al agregarlo a [math] B [/ math] aún se obtiene un conjunto independiente.

Esa última propiedad es algo más fácil de verificar para los espacios vectoriales que el proceso que usted describe (en la respuesta de Mark Eichenlaub a ¿Por qué la dimensión de un espacio vectorial está bien definida? ¿Cómo sé que todas esas bases deben tener el mismo número de elementos? ), y no es difícil demostrar que una vez que tiene esa propiedad, todas las bases (definidas como conjuntos independientes máximos) tienen el mismo tamaño.

El beneficio de hacerlo de esta manera es que una vez que te encuentras con situaciones similares, obtienes la propiedad de invariancia de tamaño gratis una vez que confirmas los axiomas anteriores. El lugar más común para que te topes con este próximo es la noción de grado de trascendencia de las extensiones de campo, pero hay muchas otras áreas donde se pueden encontrar matroides al acecho y es bueno estar familiarizado con su existencia.

El usuario de Quora ha dado una respuesta muy agradable. Solo pensé en escribir un poco sobre el “lema de intercambio” (en el texto que utilizo se llama “teorema de reemplazo”) porque, aunque me lo explicaron mal como estudiante y causó mucha confusión, realmente no tiene que ser tan malo Puede que valga la pena probarlo, ya que reduce la prueba de que todas las bases son del mismo tamaño a un corolario fácil y elegante.

Fuente de lo siguiente: Álgebra lineal , 4ª ed., Por Friedberg, Insel, & Spence. (Reescribiré y parafrasearé sustancialmente cómo ponen las cosas, por lo que no usaré el formato blockquote aquí).

Lema de intercambio, también conocido como Teorema de reemplazo:

La primera parte de este resultado dice si span (G) = V, donde | G | = n (es decir, V tiene un conjunto generador de n elementos), y L es un subconjunto linealmente independiente de V con | L | = m, entonces tenemos m

La segunda parte dice que si m

La prueba de estos hechos es sorprendentemente delicada (hecha por inducción en n en este libro). Pero los hechos en sí mismos son fáciles de creer.

Ahora para ver cómo conseguimos que todas las bases tengan el mismo tamaño : supongamos que B y B ‘son dos bases para V, con | B | = n. Queremos mostrar | B ‘| = n, entonces sin pérdida de generalidad, suponga que | B ‘| > n. Entonces podemos elegir n + 1 miembros de B ‘, y son linealmente independientes, ya que B’ es. Pero el teorema de reemplazo (primera parte) dice que el tamaño más grande para un conjunto lineal independiente es el tamaño de un conjunto generador, que es n ya que por suposición como span (B) = V. Contradicción obtenida. Si en cambio | B ‘|

Tenga en cuenta que no necesitamos la segunda parte del teorema de reemplazo para obtener que todas las bases tengan el mismo tamaño. Es necesario demostrar que cualquier conjunto linealmente independiente que sea tan grande como una base debe ser una base, y que cualquier conjunto linealmente independiente puede extenderse para convertirse en una base.

Alguien debería decir más sobre el caso de la dimensión infinita.

Si un espacio vectorial no tiene una base finita, se denomina espacio vectorial de dimensiones infinitas. Para un espacio vectorial dimensional infinito, definimos dos conceptos diferentes de “base”, dependiendo del contexto. Si el espacio vectorial tiene una topología, de modo que el concepto de una secuencia de vectores que convergen a otro vector está bien definido, entonces también podemos considerar series infinitas de vectores, y luego decir que un conjunto [matemático] \ {v_i \} _ {i \ in I} [/ math] de vectores abarca un espacio vectorial “topológicamente” si cada vector en el espacio es una suma sobre [math] i \ in I [/ math] de [math] c_i v_i [/ ​​math ] para algunos escalares [matemática] c_i [/ ​​matemática].

Pero estoy mencionando la extensión topológica solo para que sepas que existe tal cosa. El intervalo algebraico de un conjunto [matemático] S [/ matemático] de vectores es el conjunto de vectores que puede escribirse como una combinación lineal de un subconjunto finito de [matemático] S [/ matemático]. Si [matemática] S [/ matemática] abarca [matemática] V [/ matemática] y ningún subconjunto de [matemática] S [/ matemática] abarca [matemática] V [/ matemática], entonces [matemática] S [/ matemática] es denominada “base” de [matemáticas] V [/ matemáticas], y su cardinalidad (que podemos mostrar es única) es la dimensión de [matemáticas] V [/ matemáticas].

Podemos demostrar que cada espacio vectorial tiene una base, pero requiere el axioma de elección. La familia de subconjuntos linealmente independientes del espacio vectorial está garantizada por el lema de Zorn (lema de Zorn – Wikipedia) para tener un elemento máximo porque para cada cadena de subconjuntos linealmente independientes, su unión también es linealmente independiente. (Si existe una combinación lineal no trivial de elementos de la unión, todos ellos son miembros de algún elemento de la cadena, ya que la cadena está ordenada linealmente y solo hay finitamente muchos de ellos). Se garantiza el conjunto máximo linealmente independiente para ser una base, porque si su lapso omitiera algún elemento de [math] V [/ math] podríamos agregar ese elemento al conjunto y seguiría siendo linealmente independiente. Estoy dejando de lado una serie de detalles aquí, pero cada uno es el tipo de problema que sería razonable para un estudiante de álgebra lineal resolver.

Si hay dos bases de un espacio vectorial, [matemática] S [/ matemática] y [matemática] S ‘[/ matemática], entonces cada elemento de uno es una combinación lineal finita de elementos del otro. Usando el axioma de elección, entonces, podemos escribir cada uno como una unión de subconjuntos finitos indexados por el otro. Es otro corolario del axioma de elección que si un conjunto infinito [matemática] S ‘[/ matemática] es una unión de conjuntos finitos indexados por otro conjunto infinito [matemática] S [/ matemática], entonces la cardinalidad de [matemática] S ‘[/ math] no es mayor que el de [math] S [/ math]. Como esto va en ambas direcciones, tienen la misma cardinalidad.

Una forma de demostrar que la unión [matemática] S ‘[/ matemática] de una familia de conjuntos finitos indexados por [matemática] S [/ matemática] no tiene una cardinalidad mayor que [matemática] S [/ matemática] es mediante un buen orden [math] S [/ math] (por el axioma de elección) y usar esto para producir un ordenamiento correcto de [math] S ‘[/ math]. En una ordenación correcta de [math] S [/ math] podemos dividir [math] S [/ math] en subconjuntos contables (con el último posiblemente finito) al considerar dos elementos de [math] S [/ math] estar en el mismo subconjunto si solo hay finitamente muchos elementos entre ellos. En cualquier grupo [math] s_0, s_1, … [/ math] podemos tomar la unión de los subconjuntos finitos de [math] S ‘[/ math] asociados a ellos en orden, omitiendo los elementos que aparecieron anteriormente, y nosotros obtener (en el peor de los casos) un subconjunto infinitamente contable de [matemáticas] S ‘[/ matemáticas] para el grupo. Haga esto para todos los grupos y obtenemos [math] S ‘[/ math] de forma tal que los ponga en correspondencia con los elementos de [math] S [/ math], excepto posiblemente muchos al final. Esos pueden moverse al principio sin afectar la cardinalidad siempre que sea infinita.

Nunca he visto una prueba que no dividiera los casos de dimensión finita e infinita como esta. En cierto modo, el caso de dimensión finita funciona porque un espacio vectorial de dimensión finita está bien controlado, y el caso de dimensión infinita funciona porque uno puede ser descuidado y aún así tener la misma cardinalidad, porque la cardinalidad de un conjunto infinito es en sí misma Una especie de cosa suelta. No recuerdo haber visto la dimensión de un espacio vectorial de dimensiones infinitas aparecer muy a menudo, aunque una vez que un profesor lo usó para demostrar que un conjunto de representaciones grupales no estaba completo (una prueba que llamó “hilarante”).

Primero, observemos que ningún espacio puede ser tanto [matemático] 0 [/ matemático] -dimensional como [matemático] n [/ matemático] -dimensional para [matemático] n> 0 [/ matemático]. Para el primero significa que su único elemento es cero, mientras que el segundo requiere que tenga un elemento distinto de cero.

A continuación, tenga en cuenta que, para cualquier [matemática] k [/ matemática] finita, la potencia exterior [matemática] k [/ matemática] -th de un espacio vectorial con base ordenada [matemática] B [/ matemática] tiene una base dada por los productos exteriores de secuencias ordenadas de [math] k [/ math] muchos elementos de [math] B [/ math]. Por lo tanto, el poder exterior [matemático] k [/ matemático] de un espacio dimensional [matemático] n [/ matemático] es en sí mismo [matemático] \ binom {n} {k} [/ matemático] – dimensional.

En consecuencia, si un espacio tiene una dimensión finita [matemática] n [/ matemática], no puede tener también una dimensión [matemática] m> n [/ matemática]. Para su [math] (n + 1) [/ math] -th el poder exterior tendría que tener dimensión tanto [math] \ binom {n} {n + 1} = 0 [/ math] como [math] \ binom {m} {n + 1}> 0 [/ matemáticas].

Esto muestra que un espacio no puede tener dos dimensiones diferentes con al menos una de ellas finita. Mostrar que un espacio además no puede tener dos dimensiones infinitas diferentes es una cuestión más complicada. De hecho, para aquellos que se preocupan por tales cosas, esto no puede mostrarse sin alguna invocación del axioma de elección (específicamente, es equivalente al principio de elección débil dado por el lema del ultrafiltro). Sin embargo, supondré por ahora, como todos los demás, que solo te importan realmente las dimensiones finitas.

Para espacios vectoriales de dimensiones finitas, la buena definición de la dimensión es un corolario del Teorema 4 en Hoffman y Kunze: Linear Algebra, Prentice-Hall, 2nd Edition:

Sea [math] V [/ math] un espacio vectorial de dimensión finita que abarca una colección de vectores [math] m [/ math], [math] \ beta_1, \ ldots, \ beta_m [/ math]. Entonces, cualquier conjunto independiente de vectores en [math] V [/ math] es finito y no contiene más que [math] m [/ math] vectores.

La prueba de este teorema simplemente consiste en mostrar que cualquier conjunto de más de [math] m [/ math] vectores será linealmente dependiente. La prueba de esto es una generalización directa del argumento dado por Jack Huizenga en su respuesta.

En matemáticas, la dimensión de un espacio vectorial V es la cardinalidad (es decir, el número de vectores).
Para cada espacio vectorial existe una base (si se supone el axioma de elección), y todas las bases de un espacio vectorial tienen la misma cardinalidad; Como resultado, la dimensión de un espacio vectorial se define de forma única. Decimos que V es de dimensión finita si la dimensión de V es finita.