¿Cómo llegaron a la fórmula para las soluciones de ecuaciones polinómicas de orden dos?

¿Qué hace que una ecuación cuadrática [matemática] ax ^ 2 + bx + c = 0 [/ matemática] sea difícil de resolver? Es ese término molesto de grado 1 [matemáticas] bx [/ matemáticas]. Sin ella, podríamos resolver fácilmente
[matemática] ax ^ 2 + c = 0 \ iff x = \ pm \ sqrt {- \ tfrac ca} [/ math].
Pero, ¿cómo podemos deshacernos del término de grado 1? Podemos intentar una sustitución [math] x ‘= x – h [/ math]:
[matemáticas] ax ^ 2 + bx + c = 0 [/ matemáticas]
[matemáticas] \ iff a (x ‘+ h) ^ 2 + b (x’ + h) + c = 0 [/ matemáticas]
[matemáticas] \ iff ax ‘^ 2 + (2ah + b) x’ + (ah ^ 2 + bh + c) = 0 [/ matemáticas]
y ahora vemos que el término de grado 1 desaparecerá mientras
[matemáticas] 2ah + b = 0 \ iff h = – \ frac {b} {2a} [/ matemáticas].

La idea general de hacer una sustitución con un grado de libertad (aquí la constante desconocida [matemáticas] h [/ matemáticas]), y luego imponer una restricción arbitraria para simplificar la ecuación resultante, es muy poderosa, de hecho, lo suficientemente poderosa como para resuelva la ecuación cúbica [matemática] ax ^ 3 + bx ^ 2 + cx + d = 0 [/ matemática] también.

Primero usamos la misma sustitución [matemática] x ‘= x – h [/ matemática] para eliminar el término de grado 2. Mientras estamos en eso, dividiremos todo por [matemáticas] a [/ matemáticas] para que la ecuación sea monica. Ahora se ve como [math] x ‘^ 3 + px’ + q = 0 [/ math]. Probemos con otra sustitución [matemática] x ‘= u + v [/ matemática], que convierte nuestra ecuación en
[matemáticas] u ^ 3 + 3u ^ 2v + 3uv ^ 2 + v ^ 3 + pu + pv + q = 0 [/ matemáticas]
[matemáticas] \ iff u ^ 3 + v ^ 3 + (3uv + p) (u + v) + q = 0 [/ matemáticas].
Tenemos un grado de libertad en la forma en que elegimos [matemática] u [/ matemática] y [matemática] v [/ matemática], así que usémosla para cancelar el término medio imponiendo [matemática] 3uv + p = 0 [ /matemáticas].

Tenemos suficiente espacio para resolver [matemáticas] u [/ matemáticas] y [matemáticas] v [/ matemáticas] en términos de [matemáticas] p [/ matemáticas] y [matemáticas] q [/ matemáticas]:
[matemáticas] u ^ 3v ^ 3 = – \ frac {p ^ 3} {27} [/ matemáticas]
[matemáticas] u ^ 3 + v ^ 3 = -q [/ matemáticas]
entonces [matemáticas] z_1 = u ^ 3 [/ matemáticas] y [matemáticas] z_2 = v ^ 3 [/ matemáticas] son ​​las raíces de la ecuación cuadrática
[matemáticas] z ^ 2 + qz – \ frac {p ^ 3} {27} = 0 [/ matemáticas].
Podemos tomar las tres raíces cúbicas complejas de [math] z_1 [/ math] y [math] z_2 [/ math] para encontrar tres soluciones para [math] x ‘= u + v [/ math].

Una instancia aún más complicada de la misma idea se usa para reducir una ecuación cuártica a una cúbica.

Esto no pretende ser una descripción históricamente precisa de cómo se descubrió la fórmula por primera vez. Sin embargo, es una forma perfectamente plausible de hacerlo:

Considere este simple rompecabezas: suponga que conoce la suma [matemática] S [/ matemática] y el producto [matemática] P [/ matemática] de dos números. ¿Cómo recuperas los dos números?

Bueno, puede que no sea inmediatamente obvio cómo obtener los números reales, pero al menos una cosa está clara: el promedio de los dos números (es solo [matemática] S / 2 [/ matemática], por supuesto).

Así que reformulemos nuestro acertijo: supongamos que conoce el promedio [matemática] M [/ matemática] y el producto [matemática] P [/ matemática] de dos números. ¿Cómo recuperas los dos números?

Lo que queda es encontrar la desviación de cada número del promedio: los dos números serán [matemática] M \ pm d [/ matemática], para algún valor [matemática] d [/ matemática].

Pero, ¿cómo encontrar [matemáticas] d [/ matemáticas]? Bueno, usemos la única otra información que tenemos: el producto de los dos números es [math] P [/ math]. Es decir, [matemáticas] (M + d) (M – d) = P [/ matemáticas]. Pero el lado izquierdo se cancela muy bien cuando uno lo distribuye, llegando a ser igual a [matemáticas] M ^ 2 – d ^ 2 [/ matemáticas]. Entonces, tenemos que [matemáticas] M ^ 2 – d ^ 2 = P [/ matemáticas], es decir, [matemáticas] d = \ sqrt {M ^ 2 – P} [/ matemáticas].

Por lo tanto, tenemos esta fórmula simple: si dos números tienen un promedio [matemático] M [/ matemático] y un producto [matemático] P [/ matemático], entonces los dos números deben ser [matemático] M \ pm \ sqrt {M ^ 2 – P} [/ matemáticas]. En términos de nuestro rompecabezas original, si dos números tienen suma [matemática] S [/ matemática] y producto [matemática] P [/ matemática], entonces los dos números deben ser [matemática] S / 2 \ pm \ sqrt {(S / 2) ^ 2 – P} [/ matemáticas].

¿Qué tiene que ver esto con resolver ecuaciones polinómicas de orden dos? Bien, considere el problema de factorizar [matemáticas] x ^ 2 + bx + c [/ matemáticas] en [matemáticas] (x – r_1) (x – r_2) [/ matemáticas]. Distribuyendo este último, este es el problema de encontrar [matemática] r_1 [/ matemática] y [matemática] r_2 [/ matemática] tal que [matemática] x ^ 2 + bx + c = x ^ 2 – (r_1 + r_2) x + r_1 r_2 [/ matemáticas].

En otras palabras, este es precisamente el problema de encontrar dos números cuya suma es [matemática] -b [/ matemática] y el producto es [matemática] c [/ matemática]. Entonces, podemos aplicar nuestra fórmula desde arriba: las dos raíces son [math] -b / 2 \ pm \ sqrt {(- b / 2) ^ 2 – c} [/ math].

Por lo tanto, hemos llegado a la fórmula cuadrática (está redactada aquí de manera algo diferente del mantra arbitrariamente estandarizado que la mayoría ha perforado sin pensar en ellos, pero es igual de bueno, más transparente en mi opinión y, en cualquier caso, fácilmente visto como exactamente equivalente) .