¿Dónde debo comenzar para hacer un proyecto en la herramienta de resumen de artículos (procesamiento del lenguaje natural) en no más de 40 días?

Hay dos tipos de resumen: extractivo y abstracto.

  • Los métodos de resumen extractivo simplifican el problema del resumen en el problema de seleccionar un subconjunto representativo de las oraciones en los documentos originales.
  • El resumen abstracto puede componer oraciones novedosas, que no se ven en las fuentes originales.

Se han utilizado varias técnicas de aprendizaje automático para esto. Inicialmente comenzó con un clasificador de baise ingenuo, más tarde basado en modelos markow, técnicas basadas en redes neuronales de forma incremental. Aquí puede encontrar la encuesta completa – Página en cmu.edu

Esta también es una técnica interesante sin supervisión para hacer lo mismo: Algoritmo evolutivo para el resumen de texto extractivo

No lo he implementado personalmente, solo leí artículos y trabajé un poco de manera similar. Supongo que está preguntando desde el punto de vista de la implementación.

Compruebe esta implementación de Java: sandeepsripada / resumen que se basa en la página en stanford.edu.

Obtendrá alguna idea leyendo y probando esto, más tarde puede trabajar sobre esto o implementar su propio enfoque.

Avíseme si tiene algún problema durante la implementación.

Puede tomar varias horas de intentos duros y le duelen los ojos o recientemente ha invertido horas en el artículo para resumir, identificarse con el mensaje y ahora, después de todo eso, necesita sacar un bosquejo. No necesita menos de una semana para resumir.

· Muestra cómo tomar una gran variedad de contenido y reducirlo a los enfoques principales para una comprensión más breve.

· Le permite concentrarse en frases y expresiones de un contenido distribuido que son significativas y llamativas.

· Hace descubrir cómo decidir pensamientos básicos y solidificar puntos vitales de interés que los ayudan.

Los procedimientos de sinopsis se pueden utilizar como parte de relativamente todas las zonas de sustancias. La instrucción de resumir mejora su memoria para lo que se lee detenidamente. El resumen muestra cómo percibir los pensamientos esenciales en un contenido, cómo ignorar los datos superfluos y cómo incorporar seriamente los pensamientos focales.

Me parece que el lugar lógico para comenzar sería Wikipedia:

  • Resumen automático

Luego, revisaría todas mis respuestas de Quora sobre el resumen :

  • quora.com/search?q=marcus-l-endicott+summarization

Después de eso, podría abrirse camino a través de las respuestas de Quora bajo el tema de resumen automático :

  • quora.com/Automatic-Summarization/answers