¿Cómo identificarías una ecuación compleja de un conjunto de datos dado?

Tendrás muchas respuestas que te explicarán que es imposible que un sistema de software (incluido el súper IA con aprendizaje profundo) conozca y pruebe todas las fórmulas posibles. Lo mejor que puede hacer es restringir a un determinado conjunto de modelos (polinomios, logística, Weilbull, …) y ajustar sus parámetros.

Ahora, un experimento simple le explicará dónde está la verdadera dificultad: tome dos columnas de números aleatorios y haga una regresión lineal más simple para explicar una por la otra. Probablemente se sorprenderá de los hechos de que el error no es tan grande como se esperaba, pero ese es un sesgo conocido. Haga esto varias veces y conserve el mejor resultado. Pare cuando tenga una predicción “buena” de sus datos aleatorios por algunos datos aleatorios.

Es posible que tenga que ser paciente, pero cada uno será un punto en el que su ajuste es bonito, bonito Dios, digamos menos del 1%. Pero, ¿aprendiste algo? ¿Estaría seguro de usar su fórmula en la vida real?

La precisión / exactitud / veracidad de una ecuación de ajuste es algo. El nivel de confianza en el modelo es algo totalmente diferente.

Para completar la pregunta:

La ecuación compleja es:

dónde

t: hoy

T: el día de vencimiento de los futuros

S (t) = precio spot actual del activo subyacente

S (t-1) = precio spot de ayer del activo subyacente

r (t) = tasa libre de riesgo de hoy (anualizada)

r (t-1) = tasa libre de riesgo de ayer (anualizada)

F (t-1) = precio real de futuros de ayer

F ‘(t) = S * [1+ (r (t) * ((Tt) / 360)] (Esta es la versión comúnmente utilizada del precio de futuros teórico que aparece en los libros. Suponemos que no hay dividendos en este caso, entonces el rendimiento del dividendo = 0)

r (M) = porcentaje de la tarifa de mantenimiento

HM (t-1) = el costo inicial de mantenimiento = F (t-1) * r (M) * r (t-1) * [T- (t-1) / 360]

Vi esta ecuación y la calculé con los datos del mercado, el resultado es bastante cercano al precio real de futuros (menos del 0.2% cuando faltan 52 días, en comparación con más del 1% usando F ‘(t) = S * [1 + (r (t) * ((Tt) / 360)], como en la imagen a continuación). Me pregunto cómo llegó el autor a esta ecuación. Curiosamente académicamente. No tiene ningún propósito comercial.

¿Alguien puede darme pistas sobre cómo explicar esta ecuación utilizando el conocimiento financiero? ¿O si esta ecuación es el resultado de la regresión (u otros métodos matemáticos), quiero saber el nombre del método / software que puede ayudar a identificar una fórmula tan complicada a partir de un conjunto de datos dado?

¡¡¡¡¡¡¡Gracias!!!!!!!