Supongamos que estoy interesado en las ecuaciones de diofantina. Específicamente, suponga que tengo una forma cuadrática como [matemática] 2X ^ 2 – XY + 3Y ^ 2 = 0 [/ matemática], y me gustaría saber si tiene alguna solución racional que no sea [matemática] (X, Y) = (0, 0) [/ matemáticas].
Lo primero que podríamos verificar es si esta ecuación tiene alguna solución real : si fuera algo como [matemática] X ^ 2 + Y ^ 2 [/ matemática], por ejemplo, entonces sabríamos de inmediato que no hay ninguna racional soluciones Desafortunadamente, eso no funciona aquí.
Para continuar, voy a observar que buscar soluciones racionales no triviales es equivalente a buscar soluciones enteras; de hecho, si encontramos una solución no trivial [matemáticas] (X, Y) [/ matemáticas], entonces [matemáticas ] (nX, nY) [/ math] también es una solución, por lo que siempre podemos multiplicar nuestra solución racional por un número entero lo suficientemente grande como para obtener una solución entera. Entonces, podemos restringirnos al caso en el que [matemáticas] X, Y [/ matemáticas] son enteros.
Si es así, entonces podemos hablar razonablemente sobre considerar el módulo de problema algún entero [math] n [/ math]. Vea, si [matemática] 2X ^ 2 – XY + 3Y ^ 2 = 0 [/ matemática] tiene una solución entera, entonces [matemática] 2X ^ 2 – XY + 3Y ^ 2 \ equiv 0 \ mod n [/ matemática] tiene una solución para cualquier [matemática] n [/ matemática]. Sin embargo, para cualquier [matemática] n [/ matemática] específica, solo hay muchas posibilidades para [matemática] X [/ matemática] e [matemática] Y [/ matemática], por lo que determinar si hay una solución en ese entorno es Un problema solucionable.
- ¿Cómo debo entender la definición de números de repunidad?
- Si tomo un número que no es divisible por 7, y sigo agregando 7 como un dígito al final, ¿terminaré necesariamente encontrando un primo?
- ¿Cuántas soluciones enteras no triviales existen para [matemáticas] x ^ 3 – y ^ 2 = z ^ 5 [/ matemáticas]?
- ¿Cuál es la posibilidad de que exactamente x de un total de n ciclistas terminen en la misma posición que su número inicial?
- ¿Cuál es el significado de la declaración: while (n! = 0)?
Por lo tanto, podríamos esperar poder demostrar que no hay soluciones al mostrar que no hay una solución para algunas [matemáticas] n [/ matemáticas]. Y, de hecho, una búsqueda directa muestra que [matemáticas] 2X ^ 2 – XY + 3Y ^ 2 \ equiv 0 \ mod 5 [/ matemáticas] no tiene solución.
Sin embargo, hay algunos problemas con esta metodología. Primero, en la actualidad, nunca nos permitirá probar que una ecuación de diofantina tiene una solución. Incluso si probamos que hay soluciones para cualquier número entero [math] n [/ math], no es obvio que esto muestre o no que haya soluciones enteras. En segundo lugar, ¿qué [matemáticas] n [/ matemáticas] deberíamos probar? Hay infinitos de ellos.
Para avanzar en este problema, voy a presentar los enteros p-adic. Primero haré esto algebraicamente, y luego interpretaré las p-adics desde un punto de vista analítico.
Una perspectiva algebraica
Motivaré la definición al considerar un problema algo más fácil: encontrar soluciones enteras no negativas para ecuaciones lineales para cada potencia principal [matemática] p ^ k [/ matemática].
Específicamente, suponga que tengo (por ahora) una lista finita de ecuaciones de congruencia como
[matemáticas] X = a_1 \ mod p [/ matemáticas]
[matemáticas] X = a_2 \ mod p ^ 2 [/ matemáticas]
[matemáticas] X = a_3 \ mod p ^ 3 [/ matemáticas]
[matemáticas] \ vdots [/ matemáticas]
[matemáticas] X = a_k \ mod p ^ k [/ matemáticas]
Debido a que [math] a_l [/ math] solo se definen hasta un múltiplo de [math] p ^ l [/ math], asumiremos sin pérdida de generalidad que [math] 0 \ leq a ^ l <p ^ l [/matemáticas].
¿Hay alguna solución? Sí, siempre y cuando estas ecuaciones sean consistentes, es decir, necesitamos tener [matemáticas] a_k \ equiv a_ {k – 1} \ mod p ^ {k – 1} [/ matemáticas], [matemáticas] a_ {k – 1} \ equiv a_ {k – 2} \ mod p ^ {k – 2} [/ math], y así sucesivamente. En ese caso, simplemente tomar [math] X = a_k [/ math] funcionará.
Escribamos [math] a_k [/ math] en base [math] p [/ math]. Se verá como [math] a_k = b_0 + b_1 p + \ ldots + b_ {k – 1} p ^ {k – 1} [/ math], donde [math] b_i [/ math] son enteros entre 0 y [matemáticas] p – 1 [/ matemáticas]. Entonces
[matemáticas] a_ {k – 1} \ equiv b_0 + b_1 p + \ ldots + b_ {k -3} p ^ {k – 3} + b_ {k – 2} p ^ {k -2} [/ matemáticas]
[matemáticas] a_ {k – 2} \ equiv b_0 + b_1 p + \ ldots + b_ {k – 3} p ^ {k – 3} [/ matemáticas]
[matemáticas] \ vdots [/ matemáticas]
[matemáticas] a_2 \ equiv b_0 + b_1 p [/ matemáticas]
[matemáticas] a_1 \ equiv b_0 [/ matemáticas].
Es decir, lo que está sucediendo es que cada ecuación sucesiva está determinando porciones cada vez más grandes de la expansión base [matemática] p [/ matemática] de [matemática] X [/ matemática].
Bien, hasta ahora todo bien. Ahora, ¿qué sucede si usamos una lista infinita de ecuaciones de congruencia? Es decir
[matemáticas] X = a_1 \ mod p [/ matemáticas]
[matemáticas] X = a_2 \ mod p ^ 2 [/ matemáticas]
[matemáticas] \ vdots [/ matemáticas]
con infinitas opciones de [math] a_l [/ math] tal que [math] a_l \ equiv a_ {l – 1} \ mod p ^ {l – 1} [/ math].
Bueno, si hay una solución entera no negativa, entonces podemos escribirla en la base [math] p [/ math] como [math] X = b_0 + b_1 p + b_2 p ^ 2 + \ ldots + b_l p ^ l [/matemáticas]. Si [math] k \ geq l [/ math], entonces debe ser [math] a_k = b_0 + b_1 p + b_2 p ^ 2 + \ ldots + b_l p ^ l [/ math]. Es decir, para que haya una solución entera, las ecuaciones eventualmente deben estabilizarse —para [matemática] k [/ matemática], [matemática] suficientemente grande a_k = a_ {k + 1} [/ matemática]. Por el contrario, si las ecuaciones se estabilizan, entonces hay una solución entera (¡única!).
Entonces, hemos construido una correspondencia entre ecuaciones estabilizadoras consistentes y enteros no negativos. Curiosamente, podemos extender esta correspondencia para incluir también enteros negativos, pero las secuencias no se estabilizarán de la misma manera. De hecho, si [matemáticas] X = -1 [/ matemáticas], entonces
[matemáticas] X \ equiv p – 1 \ mod p [/ matemáticas]
[matemática] X \ equiv p ^ 2 – 1 \ mod p ^ 2 [/ matemática]
[matemática] X \ equiv p ^ 3 – 1 \ mod p ^ 3 [/ matemática]
[matemáticas] \ vdots [/ matemáticas]
Como comentario aparte, podemos pensar en esta secuencia como “aproximada” -1 si pensamos en [matemática] p ^ k [/ matemática] como cercana a 0 a medida que [matemática] k [/ matemática] se hace muy grande (esto requiere un cambio en cómo pensamos en la convergencia). Más sobre esto más tarde.
De vuelta a la correspondencia que hemos encontrado. Tenemos todos estos diferentes conjuntos de ecuaciones, y solo unos pocos tienen soluciones. ¿Y si tuviéramos que cambiar eso? Específicamente, ¿qué pasa si introducimos un nuevo número, llamado entero p-adic , cuya característica definitoria es que resuelve un conjunto consistente de ecuaciones?
[matemáticas] X = a_1 \ mod p [/ matemáticas]
[matemáticas] X = a_2 \ mod p ^ 2 [/ matemáticas]
[matemáticas] \ vdots [/ matemáticas]
Resulta que esto es completamente kosher: es un procedimiento conocido como límite inverso. Explícitamente, podemos identificar los enteros p-adic (escritos como [math] \ mathbb {Z} _p [/ math]) con el conjunto de (por ahora) series formales
[matemáticas] b_0 + b_1 p + b_2 p ^ 2 + b_3 p ^ 3 + b_4 p ^ 4 + \ ldots [/ matemáticas]
donde [math] 0 \ leq b_i <p [/ math] es un número entero. Esta es una generalización directa de los enteros.
El límite inverso nos permite hacer muchas cosas divertidas. Podemos definir la suma de enteros p-adic, si
[matemáticas] X = a_1 \ mod p, \ Y = b_1 \ mod p [/ matemáticas]
[matemáticas] X = a_2 \ mod p ^ 2, \ Y = b_2 \ mod p ^ 2 [/ matemáticas]
[matemáticas] \ vdots [/ matemáticas]
entonces
[matemáticas] X + Y = a_1 + b_1 \ mod p [/ matemáticas]
[matemáticas] X + Y = a_2 + b_2 \ mod p ^ 2 [/ matemáticas]
[matemáticas] \ vdots [/ matemáticas].
Podemos definir de manera similar la multiplicación de enteros p-adic, y verificar que con esas definiciones, [math] \ mathbb {Z} _p [/ math] es un anillo. (Es decir, la suma y la multiplicación son asociativas y conmutativas, existen inversos aditivos, una identidad multiplicativa y la multiplicación se distribuye sobre la suma).
Aún mejor, porque [math] p [/ math] es primo, se deduce que [math] \ mathbb {Z} _p [/ math] es un dominio integral, es decir, si [math] x, y [/ math ] son enteros p-adic, entonces [matemática] xy = 0 [/ matemática] implica que [matemática] x = 0 [/ matemática] o [matemática] y = 0 [/ matemática]. (Como comentario aparte: esta es la primera vez que utilizamos el hecho de que p es primo, hasta este punto, todo lo que he dicho habría funcionado igual de bien si p fuera un número entero positivo).
Lo que esto significa es que, al igual que podemos construir los números racionales considerando cocientes de enteros, podemos considerar cocientes de enteros p-adic (esta construcción general funciona para cualquier dominio integral, y se llama el campo de fracciones). Este es el campo completo de p-adics. Lo que es cierto, pero no lo probaré, es que puedes escribir cualquier p-adic como una suma formal (por ahora)
[matemáticas] a _ {- l} p ^ {- l} + a _ {- l + 1} p ^ {- l + 1} + \ ldots + a_0 + a_1 p + a_2 p ^ 2 + \ ldots [/ math]
Y así, los enteros [math] \ mathbb {Z} [/ math] se sientan dentro de los enteros p-adic [math] \ mathbb {Z} _p [/ math], y los números racionales [math] \ mathbb {Q} [/ math] siéntate dentro del campo p-adic [math] \ mathbb {Q} _p [/ math].
También hay mapas de proyección natural [math] \ mathbb {Z} _p \ rightarrow \ mathbb {Z} / p ^ k \ mathbb {Z} [/ math] donde simplemente “nos olvidamos” de los términos de orden superior. Es decir
[matemáticas] a_0 + a_1 p + a_2 p ^ 2 + \ ldots \ mapsto a_0 + a_1 p + a_2 p ^ 2 + \ ldots + a_ {k – 1} p ^ {k -1} \ mod p ^ k [/ matemáticas].
Una interpretación analítica.
Aludí anteriormente que podemos pensar en [math] p ^ k \ rightarrow 0 [/ math] en las p-adics. Voy a hacer esta declaración precisa ahora.
Primero tendré que introducir la noción de un valor absoluto . Un valor absoluto es una función [matemáticas] | \ cdots | [/ math] de un dominio integral a números reales de modo que
- [matemáticas] | x | \ geq 0 [/ matemáticas]
- [matemáticas] | x | = 0 [/ matemáticas] si y solo si [matemáticas] x = 0 [/ matemáticas]
- [matemáticas] | xy | = | x | | y | [/matemáticas]
- [matemáticas] | x + y | \ leq | x | + | y | [/matemáticas].
Esta es una generalización de la noción más familiar del valor absoluto que la mayoría de la gente conoce (que, en este contexto, a veces se escribe como [math] | \ cdot | _ \ infty [/ math]). Sin embargo, hay otros valores absolutos en los números racionales. Por ejemplo, deje que [math] v_p (x) [/ math] sea el número entero más grande de modo que [math] x / p ^ {v_p (x)} [/ math] sea un número entero. Entonces
[matemáticas] | x | _p: = p ^ {- v_p (x)} [/ matemáticas]
Es un valor absoluto.
Otro lado: Resulta que, en cierto sentido, los valores absolutos [matemática] | \ cdot | _p [/ matemática] y [matemática] | \ cdot | _ \ infty [/ matemática] son los únicos (no triviales) valores absolutos: cualquier otro valor absoluto es solo una potencia de uno de estos valores absolutos. Para más información sobre esto, vea el teorema de Ostrowski.
Ahora, el beneficio de tener un valor absoluto es que podemos hablar sobre el “tamaño” de los elementos con respecto a esta norma. Es decir, podemos definir una nueva forma de convergencia donde [math] x \ rightarrow 0 [/ math] si y solo si [math] | x | \ rightarrow 0 [/ math].
Tomemos uno de estos valores absolutos [math] | \ cdot | _p [/ math] y veamos qué nos dice acerca de los números racionales. Bien
[matemáticas] \ left | p ^ k \ right | _p = p ^ {- k} \ rightarrow 0 [/ math]
por lo tanto
[matemáticas] p ^ k \ rightarrow 0 [/ matemáticas]
como fue prometido.
Dada esta noción de convergencia, podemos preguntar acerca de ‘agujeros’, es decir, secuencias de números racionales que “deberían” converger en algo, pero no convergen en algo en los racionales.
Primero, un ejemplo para el familiar valor absoluto [math] | \ cdot | _ \ infty [/ math]. La secuencia [matemática] 3, 3.1, 3.14, 3.141, 3.1415, 3.14159, \ ldots [/ matemática] es una secuencia de números racionales, y las diferencias entre términos sucesivos son cada vez más pequeñas (es decir, [matemática] | x_n – x_ {n + k} | _ \ infty \ rightarrow 0 [/ math], donde [math] x_n [/ math] es el enésimo término en esta secuencia). Sin embargo, como habrás adivinado, elijo esta secuencia de modo que converja a [math] \ pi [/ math], un número real pero irracional.
Así es como construimos los números reales, por cierto: comenzamos considerando los números racionales, y luego consideramos las secuencias en las que los términos se acercan cada vez más en relación con el valor absoluto [math] | \ cdot | _ \ infty [/ math ] y simplemente agregue nuevos elementos hasta que cada secuencia converja en algo . Para obtener más información sobre cómo se hace esto formalmente, sugiero leer sobre la finalización.
Ahora, podemos hacer lo mismo con respecto a otros valores absolutos; específicamente, podemos considerar la finalización de los números racionales con respecto a [math] | \ cdot | _p [/ math]. Los números racionales
[matemáticas] a _ {- l} p ^ {- l} + a _ {- l + 1} p ^ {- l + 1} + \ ldots + a_0 + a_1 p + \ ldots + a_k p ^ k [/ math]
todavía se sienta dentro de esta finalización, pero también contiene nuevos elementos. Específicamente, porque [math] p ^ k \ rightarrow 0 [/ math], podemos seguir agregando términos [math] a_k p ^ k [/ math] a la derecha indefinidamente, produciendo una suma como
[matemáticas] a _ {- l} p ^ {- l} + a _ {- l + 1} p ^ {- l + 1} + \ ldots + a_0 + a_1 p + \ ldots [/ math]
que reconocemos como nada más que un elemento del campo p-adic [math] \ mathbb {Q} _p [/ math].
Propiedades impares de los p-adics
Antes de continuar, quería dar un ejemplo de cómo uno podría trabajar con los p-adics, y algunos de los comportamientos contra-intuitivos que muestran.
Por ejemplo, en las 2-adics, es cierto que [math] 1 + 2 + 4 + 8 + \ ldots = -1 [/ math]. Aquí hay dos pruebas:
- Prueba algebraica : si [matemática] X [/ matemática] es el entero p-adic tal que [matemática] X + 1 = 0 [/ matemática], entonces [matemática] X \ equiv 1 \ mod 2 [/ matemática], [ matemáticas] X \ equiv 1 + 2 \ mod 4 [/ matemáticas], [matemáticas] X \ equiv 1 + 2 + 4 \ mod 8 [/ matemáticas], y así sucesivamente. Es evidente que la suma formal [matemática] 1 + 2 +4 + 8 + \ ldots [/ matemática] satisface esto y, por lo tanto, debe ser igual a -1.
- Prueba analítica : tenemos una secuencia [matemática] 1, 1 + 2, 1 + 2 + 4, \ ldots [/ math] que converge a [math] X = 1 + 2 + 4 + 8 + \ ldots [/ math] (con respecto a la norma 2-adic). Si agregamos 1 a cada término en esta secuencia, convergerá a [matemáticas] X + 1 [/ matemáticas]. Sin embargo, la secuencia es entonces [matemáticas] 1 + 1 = 2, 1 + 1 + 2 = 4, 1 + 1 + 2 + 4 = 8, \ ldots [/ matemáticas], que sabemos converge a 0. Por lo tanto, [ matemática] X + 1 = 0 [/ matemática], y así [matemática] X = -1 [/ matemática].
De manera más general, podemos demostrar que [math] 1 + p + p ^ 2 + \ ldots = \ frac {1} {1 – p} [/ math] en las p-adics. Una forma de hacerlo es notar que
[matemáticas] (1 – p) (1 + p + p ^ 2 + \ ldots) = 1 + p + p ^ 2 + \ ldots – (p + p ^ 2 + p ^ 3 + \ ldots) = 1 [/ matemáticas].
Aplicación de p-adics
Volvamos a nuestro problema original. Como recordatorio: estábamos considerando formas cuadráticas [matemáticas] aX ^ 2 + bXY + cY ^ 2 [/ matemáticas] (donde [matemáticas] a, b, c [/ matemáticas] son enteros), y preguntamos si tal ecuación tenía soluciones racionales no triviales. Hemos determinado que una forma de mostrar que no tienen soluciones es mostrar que no hay una solución real, o mostrar que no hay un módulo de solución algún número entero [math] n [/ math].
¿Cuál es el uso de los p-adics en todo esto? Bueno, en primer lugar, porque los enteros [math] \ mathbb {Z} [/ math] se sientan dentro de los enteros p-adic [math] \ mathbb {Z} _p [/ math], si hay una solución entera, entonces hay una solución p-adic. En segundo lugar, por la forma en que se construye [math] \ mathbb {Z} _p [/ math] (si lo desea, debido a los mapas de proyección de [math] \ mathbb {Z} _p [/ math] a [math] \ mathbb {Z} / p ^ k \ mathbb {Z} [/ math]), si hay una solución en los enteros p-adic, entonces hay una solución mod [math] p ^ k [/ math] para cualquier [ matemáticas] k [/ matemáticas]! Y, por el contrario, si hay una solución mod [math] p ^ k [/ math] para cualquier [math] k [/ math], entonces hay una solución p-adic.
Así, en sentido, los enteros p-adic simplemente codifican toda la información sobre el estudio del módulo del problema [matemática] p ^ k [/ matemática] para todas las [matemática] k [/ matemática] simultáneamente.
Esta es una noticia maravillosa, porque los p-adics se pueden estudiar desde un punto de vista analítico, y esto significa que podemos utilizar todo el poder del análisis de p-adic para estudiar problemas algebraicos como este.
Esto me lleva a un maravilloso teorema que es demasiado bueno para no mencionarlo. Es el teorema de Hasse-Minkowski, y afirma que una forma cuadrática [matemáticas] aX ^ 2 + bXY + cY ^ 2 [/ matemáticas] tiene una solución racional si y solo si tiene una solución real y una solución en cada p -adic field [math] \ mathbb {Q} _p [/ math]!
Esto se conoce como un principio local-global: usted estudia soluciones locales (por ejemplo, soluciones en los números reales y el campo p-adic [math] \ mathbb {Q} _p [/ math]) y muestra que existen soluciones globales (por ejemplo, soluciones racionales existe).
Desafortunadamente, el principio local-global no es generalmente cierto para todas las ecuaciones de Diophantine, es decir, hay ecuaciones de Diophantine más generales que tienen soluciones reales y soluciones en cada campo de p-adic, pero no tienen soluciones racionales. Descubrir un principio local-global es una noticia emocionante.
Aun así, los p-adics son una herramienta importante en el cinturón de cualquier teórico de números.