En términos que un no bioinformático entendería, ¿cómo se usa el álgebra lineal en bioinformática?

No es necesario aprender todo en álgebra lineal para la escuela de posgrado porque el programa probablemente se centrará más en aplicaciones prácticas que en la teoría.

No me malinterpretes, no puedes aplicar técnicas sin la teoría. Simplemente no quiero que pienses que necesitas una nueva teoría o no (¡cometí ese error!).

Las partes del álgebra lineal que necesita enfocar predominantemente son:

  1. Teoría de la matriz
  2. Transformación
  3. Espacios vectoriales y vectores propios

Aprender los conceptos básicos de álgebra lineal ayudará a aprender conceptos fundamentales en el aprendizaje automático, particularmente el aprendizaje estadístico. Esto le permitirá comprender y utilizar técnicas como la regresión multivariada, el análisis de componentes principales, el bosque aleatorio, etc. Las técnicas correctas, cuando se aplican a sus datos biológicos, proporcionarían una mejor comprensión de sus datos o ayudarían a hacer predicciones.

Recomendaría leer

“Elementos de aprendizaje estadístico” por Jerome H. Friedman, Robert Tibshirani y Trevor Hastie http://statweb.stanford.edu/~tib…

O vea cómo explican estos conceptos Introducción en profundidad al aprendizaje automático en 15 horas de videos expertos

O si sabe cómo codificar en R, eche un vistazo al libro Introducción al aprendizaje estadístico

Espero que esto ayude. Mantén la curiosidad y ve por la W!

He estado en biología computacional desde 1991. No he tenido ningún entrenamiento en matemáticas de nivel universitario más allá del cálculo elemental, y ciertamente nunca tuve álgebra lineal más allá de la escuela secundaria. Así que (vergonzosamente) tuve que investigar un poco para asegurarme de saber qué es el álgebra lineal.

Así que ahora descubrí que estoy usando muchas herramientas e ideas basadas en álgebra lineal, la mayoría de las cuales entiendo lo suficientemente bien como para usarlas, tal vez lo suficientemente bien como para explicarle a alguien más, pero ciertamente no lo suficientemente bien como para enseñar. Además de conceptos como ‘vector propio’ que siempre me ponen nervioso porque no los entiendo tan bien como creo que lo hago (en lo que tampoco confío). Por lo tanto, el álgebra lineal se une a otros campos de las matemáticas en los que confío profesionalmente (por ejemplo, optimización, teoría de gráficos, estadísticas bayesianas) pero que esencialmente no tienen capacitación formal, lo que resulta en un conocimiento altamente imperfecto (para ser caritativo).

Es genial repasar tus antecedentes, pero creo que mi experiencia ilustra que puedes confundirte a medida que te encuentras con nuevos temas. El mejor motivador para aprender un tema en profundidad es un requisito inminente para aprenderlo en profundidad.

En mi humilde opinión, debido a que la biología computacional es un campo de rápido movimiento, favorece a los zorros (“sabe muchas cosas”) no a los erizos (“una cosa importante”). Obtenga un conocimiento práctico de muchos espacios diferentes y acostúmbrese a aprender rápidamente un nuevo campo en profundidad.

No necesitaba mucho álgebra lineal en la escuela de posgrado, aunque acababa de aprenderlo, pero realmente depende de en qué campo se encuentre. La respuesta de Pawel dio excelentes ejemplos de campos de biología computacional donde el álgebra lineal es muy útil, pero no me preocuparía demasiado por tratar de volver a aprenderlo incluso antes de que comience la escuela de posgrado. Terminas aprendiendo o volviendo a aprender habilidades a medida que las necesitas en tu investigación.

Tal vez me concentraría en obtener la disposición de la tierra en el campo en el que se está metiendo al recoger parte de la biología y ver cómo las personas generalmente se acercan al campo. Lo mejor de la bioinformática es la forma en que las personas entran en ella desde diferentes orígenes, así que no seas tímido al abordar tu trabajo desde tu propia perspectiva basada en tus antecedentes en ciencia de datos. Probablemente ya se encuentre en una posición realmente buena como alguien con habilidades de ciencia de datos, pero debe comprender la biología lo suficiente como para ver qué problemas existen y que tiene un talento único para resolver con esas habilidades.

Tengo el presentimiento de que las habilidades oxidadas de álgebra lineal no serán un factor significativo para detenerlo.

¡Modelado molecular! Existen muchas aplicaciones en bioinformática estructural: modelado de homología, superposiciones estructurales, etc. Consulte este documento (pdf) para obtener una explicación detallada sobre cómo se utiliza exactamente el álgebra lineal en ese campo.
Una de las técnicas más utilizadas es la descomposición del valor singular: el algoritmo de Kabsch es una aplicación popular de SVD, ampliamente utilizada para superponer estructuras.