Suponiendo que los datos realmente siguen un patrón sinusoidal, entonces sí, es posible interpolarlos.
Para hacer esto, debemos conocer las características de los gráficos sinusoidales. Analicemos esto:
if [math] T = a \ sin {(b (tc))} + d [/ math], entonces
a es la amplitud de la función.
- ¿Es cierto que Einstein no era demasiado bueno en matemáticas?
- ¿Necesito las matemáticas para ser un buen desarrollador?
- ¿Es fácil la matemática?
- Cómo interesarse realmente por las matemáticas
- ¿Cuáles son los libros de teoría de grupos más conceptuales y fáciles de entender?
La amplitud es el rango de valores que puede tener un gráfico sinusoidal. Un gráfico sinusoidal puede tener valores de + A a -A. Entonces, el rango de los datos es el doble de la Amplitud.
[matemáticas] A = \ frac {Rango} {2} [/ matemáticas]
La temperatura varía de 14 (el mínimo) a 27 (el máximo). El rango será 27-14 = 13.
Así:
[matemáticas] a = A = \ frac {Rango} {2} = \ frac {13} {2} = 6.5 [/ matemáticas]
d es el desplazamiento de temperatura
Podemos establecer d en un valor arbitrario para que coincida con los datos de temperaturas. Por ejemplo, sabemos que el valor mínimo es 14. Esto ocurre cuando el gráfico sinusoidal está en el mínimo, entonces el valor de la onda sinusoidal está en -A. Esto significa:
[matemáticas] T = a \ sin {(b (tc))} + d [/ matemáticas]
[matemáticas] 14 = -6.5 + d [/ matemáticas]
[matemáticas] d = 20.5 [/ matemáticas]
b es la frecuencia de fase de la función
Una onda sinusoidal tiene una frecuencia o período que describe cuándo se repite el valor.
Para ilustrar mejor esto, una onda sinusoidal regular se repite después de que el ángulo alcanza [matemática] 2 \ pi [/ matemática]. A esto lo llamamos 1 período. Una frecuencia de fase (o período) siempre tiene la forma de [matemática] 2 \ pi f [/ matemática] o [matemática] \ frac {2 \ pi} {P} [/ matemática] donde f es la frecuencia y P es el período. Podemos interesarnos en detalles matemáticos si está interesado, pero por ahora vamos a explicarlo brevemente.
Ahora es más fácil para nosotros encontrar el período de los datos (más intuitivo). Podemos decir que un período es un tiempo que la función tarda desde el valor máximo para alcanzar nuevamente un valor máximo. En los datos, solo vimos el valor máximo una vez. Entonces, tenemos que improvisar.
Si inspecciona el gráfico sinusoidal, la función tarda la mitad del período en pasar del valor mínimo al valor máximo. Tenemos el valor mínimo y máximo, así que empecemos por eso. Si tomamos Jan como t = 1 y Feb como t = 2, entonces el valor mínimo ocurre en t = 2 y el valor máximo ocurre en t = 7. La diferencia en t (o [math] \ delta t [/ math] es 5. Esta es la mitad del período, por lo que el período en sí es 10.
Así:
[matemáticas] b = \ frac {2 \ pi} {P} = \ frac {2 \ pi} {10} = \ frac {\ pi} {5} [/ matemáticas]
c es el desfase de la función
Similar a d, si d es el desplazamiento de la temperatura, entonces c es el desplazamiento de la fase. O en este caso, el desplazamiento de la hora. Elegimos c para que el gráfico seno se alinee bien con los datos por tiempo.
¿Recuerdas nuestro valor mínimo? El valor mínimo ocurre en el gráfico seno cuando la fase es [matemática] \ frac {3 \ pi} {2} [/ matemática]. Es equivalente al decir que ocurre cuando el tiempo está en [math] \ frac {3} {4} [/ math] de su período. Podemos elegir cualquier definición. Por ejemplo, si vamos usando el ángulo de fase:
[matemáticas] \ frac {3 \ pi} {2} = \ frac {\ pi} {5} (tc) [/ matemáticas]
[matemáticas] c = t-7.5 [/ matemáticas]
el valor mínimo ocurre en febrero, entonces t = 2. Sustituya esto, obtenemos:
[matemáticas] c = -5.5 [/ matemáticas]
Si vamos usando periodo:
[matemáticas] \ frac {3} {4} P = tc [/ matemáticas]
[matemáticas] c = t- \ frac {3} {4} P = 2- \ frac {3} {4} 10 [/ matemáticas]
[matemáticas] c = -5.5 [/ matemáticas]
Para más información, c está realmente en el módulo P. Por lo tanto, es perfectamente válido tener:
[matemáticas] c = 10-5.5 = 4.5 [/ matemáticas]
o incluso:
[matemáticas] c = 10 \ cdot10-5.5 = 94.5 [/ matemáticas]
Esto se debe a que produce el mismo ángulo de fase para esta onda sinusoidal particular.
usemos c = 4.5, porque esperamos que c sea un número positivo
Resumen
Su función está en la forma:
[matemáticas] T = 6.5 \ sin {(\ frac {\ pi} {5} (t-4.5))} + 20.5 [/ matemáticas]
Solo tenga en cuenta que, se ajustará muy bien para el valor mínimo y máximo con los datos, pero puede ser un poco diferente para otros valores, ya que es solo una interpolación. Sería interesante calcular la varianza, pero no es el propósito de las preguntas.
Espero eso ayude.
Nota [EDITAR]
Como puede ver en la respuesta del usuario de Quora a ¿Cómo puede encontrar la traducción horizontal de un gráfico senoidal, dada una tabla de datos? Se mencionó que el período es 12, por lo tanto, produce [matemáticas] b = \ frac {\ pi} {6} [/ matemáticas], que es diferente de la respuesta a la que llegué.
Para repetirme de nuevo, esta respuesta aquí se ajustará perfectamente para el valor mínimo y máximo con los datos, pero podría estar desactivada para otros valores, ya que es solo una interpolación. Por otro lado, estaba perfectamente bien asumir que el período es 12. Los períodos que elijas dependerán de los supuestos que hagas.
Llegué a P = 10 con la suposición de que se necesitaron 5 t para que la función pasara del mínimo al máximo más cercano. Voy con este enfoque, porque solo quiero encontrar la P solo a partir de los datos y sin otras suposiciones. Para ilustrar esto, imagine si los datos realmente tienen una frecuencia mucho más alta (período más corto) pero aún se repiten después de 12 meses. Por ejemplo, si P = 6, obtendremos 2 valores máximos máximos y / o 2 valores mínimos máximos. Si en este caso elige P = 12, producirá un mal modelo a partir de suposiciones razonables. Es cierto que la función se repetirá después de 12 t, pero en algunos lugares estará muy apagada.
Entonces, en mi opinión, no quiero cambiar mi P a 12. Los lectores pueden tener más información sobre por qué llegamos a resultados diferentes. Solo recuerde probar el modelo con el conjunto de datos dado: p. Para estas preguntas en particular, creo que también está bien comparar el modelo haciendo algunas pruebas de regresión, eso sería interesante. Debido a que el conjunto de datos no es muy grande, es bastante posible calcular la suma residual de cuadrados sin usar tecnología adicional