TL; DR: Sí. Aunque esto es bastante raro. Vaya al final de mi explicación de lo que estos términos significan incluso para más detalles.
Dada una distribución [matemática] X [/ matemática] con [matemática] N [/ matemática] muestras totales, la media es el valor promedio (o [matemática] \ mu [/ matemática] o valor esperado [matemática] E [X] [/matemáticas]). Puede calcular esto sumando todas las muestras en [matemáticas] X [/ matemáticas] y dividiendo entre [matemáticas] N [/ matemáticas]. Esto se escribe en notación de suma como:
[matemáticas] E [X] = \ mu = \ frac {1} {N} \ sum_ {i = 0} ^ {N} X_i [/ matemáticas]
Eso es genial y todo, pero ¿qué pasa si quieres una medida de cuán espaciado está este conjunto de datos? Seleccionemos un solo punto de esta distribución, [matemática] X [/ matemática] [matemática] _i [/ matemática], y compárelo con la media, y sumemos estas diferencias en todo el conjunto de datos y dividamos por el número de muestras:
- ¿Cómo descubrieron (o dedujeron) los matemáticos la relación íntima entre funciones trigonométricas y exponenciales complejas?
- ¿Por qué pagamos matemáticos puros?
- En la ecuación polinómica de tercer grado, ¿son los puntos (x, y) de mínimo, inflexión y máximo en progresión aritmética, en este orden? Si no, ¿es verdad solo para x o y?
- 16 caballeros están sentados en una mesa circular, se requieren 7 caballeros para rescatar a una niña. Todos los caballeros consecutivos son hostiles entre sí. ¿Cuántas formas de seleccionar 7 caballeros de modo que no se puedan unir 2 hostiles?
- ¿Tener ADD reducirá significativamente mis posibilidades de convertirme en un buen matemático y / o físico?
[matemáticas] \ frac {1} {N} \ sum_ {i = 0} ^ {N} \ left (X_i – \ mu \ right) [/ math]
Ahora tenemos un problema. ¿Qué sucede si el punto que elegimos, [matemáticas] X_i [/ matemáticas], es menor que [matemáticas] \ mu [/ matemáticas]? Considere dos conjuntos de datos de tres elementos:
[matemáticas] D_1 = \ left \ {- 1.0, 0.0, 1.0 \ right \} [/ matemáticas]
[matemáticas] D_2 = \ left \ {- 2.0, 0.0, 2.0 \ right \} [/ matemáticas]
Observe que la media de [matemática] D_1 [/ matemática] y [matemática] D_2 [/ matemática] es la misma. Sin embargo, si calculamos la diferencia promedio como se muestra arriba, ¡observe que obtenemos la misma diferencia promedio – [matemáticas] 0 [/ matemáticas]! ¡Pero mirando los conjuntos de datos, [math] D_2 [/ math] parece más espaciado que [math] D_1 [/ math]!
Una solución es calcular la diferencia cuadrática promedio. Esto elimina nuestros signos negativos y es una buena manera de obtener lo que estamos buscando: una medida de escasez.
[matemáticas] \ sigma ^ 2 = \ frac {1} {N} \ sum_ {i = 0} ^ {N} \ left (X_i- \ mu \ right) ^ 2 [/ math]
Esto es varianza. Es una forma de medir cuán extendido es un conjunto de datos. En lugar de cuadrar las diferencias, podríamos tomar el valor absoluto y obtener otra medida de la dispersión con propiedades ligeramente diferentes. En su mayor parte, la varianza es lo que se usa para este propósito.
Ahora, volviendo a tu pregunta. ¿Cómo encaja la desviación estándar en todo esto? Representada por la letra griega sigma ([math] \ sigma [/ math]), la desviación estándar es la raíz cuadrada de la varianza.
[matemáticas] \ sigma = \ sqrt {\ frac {1} {N} \ sum_ {i = 0} ^ {N} \ left (X_i- \ mu \ right) ^ 2} [/ math]
[matemáticas] \ sigma = \ sqrt {E [(X- \ mu) ^ 2]} [/ matemáticas]
Ahora, si arreglamos [math] \ mu [/ math] y [math] \ sigma [/ math] para dos distribuciones diferentes, piense en lo que eso significa. El promedio es el mismo, y también lo “espaciado” de las distribuciones de cada uno. En general, tener múltiples conjuntos de datos con idénticos [math] \ sigma [/ math] y [math] \ mu [/ math] pero es posible diseñar diferentes rangos, pero si existen, son bastante raros. Consulte otras respuestas a esta pregunta para ver ejemplos de conjuntos de datos con [math] \ sigma [/ math] y [math] \ mu [/ math] muy similares .
Para ampliar su pregunta, hay ejemplos limitados de conjuntos de datos que logran una propiedad similar que puede estar buscando: estadísticas muy similares pero diferentes rangos de datos. Echa un vistazo al cuarteto de Anscombe. Existen algunos enfoques algorítmicos para generar dichos conjuntos de datos, pero no he encontrado enfoques analíticos. Para obtener una explicación de cómo se pueden generar estos conjuntos de datos, consulte el recocido simulado.
En pocas palabras, el recocido simulado ayuda en esta circunstancia al hacer una búsqueda aleatoria (pero limitada por un factor [matemático] T [/ matemático] llamado temperatura, por lo que es aleatorio pero con una correa cada vez más corta) de posibles valores de distribución que minimicen un costo función. En este caso, una función de costo viable podría minimizar las distancias entre los momentos estadísticos en comparación con una distribución objetivo.