¿Puedo hacer un proyecto BTech en el campo de Big Data de manera asequible?

Sí, solo necesita tanta inversión para desarrollar proyectos de Bigdata

  • Pasión
  • Habilidades en programación
  • Computadora : )
  • Internet

Algunos proyectos en los que puede aplicar Bigdata, nlp, conceptos de aprendizaje automático

  1. Resumen del documento: teniendo en cuenta las características semánticas y una similitud semántica. Este es un buen documento para ello Página en stanford.edu
  2. Recomendación de título: para predecir el título de artículos, sitios web, etc. Necesita crear un sistema basado en el aprendizaje utilizando algoritmos de clasificación.
  3. Sistema de corrección semántica: poco complejo pero interesante. El texto generalmente reintentado se enfrenta a un error semántico, por lo tanto, conduce a un resultado incorrecto. Aplicar esto como preprocesamiento conduce a mejores resultados.
  4. Sistema de corrección sintáctica: muy necesario hoy en día. Los que no hablan inglés crean mucho error sintáctico. También se puede usar como trabajo de preprocesamiento en muchos proyectos.
  5. Motor de búsqueda de Wikipedia: datos de Wikipedia disponibles como archivo de volcado. Verifique dbpedia para referencia. Aplica técnicas de indexación y crea un pequeño SE para wikiP
  6. Clasificador de tweets de Twitter: bastante fácil e interesante también. Creación de un sistema de aprendizaje para varias categorías Deportes, entretenimiento, negocios, política, hollywood, etc. Capacite al clasificador (ingenuo bayes, SVM) y prediga la categoría para los tweets entrantes.
  7. Análisis de sentimientos para twitter, revisión, conversaciones: hay pocos paquetes disponibles en R que pueden ayudar a realizar este trabajo. Es necesario agregar algunas características adicionales además de eso para que sea más intuitivo. Nltk, Stanford, word2vect son algo buenas herramientas de código abierto para lo mismo.
  8. Detección de correo no deseado: nuevamente aprendizaje del sistema de clasificación basado. Capacite al clasificador utilizando el correo no deseado preseleccionado por los usuarios que podría clasificar los nuevos correos próximos. Si los usos marcan el correo nuevo como correo no deseado, vuelva a entrenar (puede ser otra opción mejor).
  9. Detección de sarcasmos

Estaría encantado de ayudar a cualquiera de los anteriores.
Escrito Vie •

No es tanto la necesidad de equipos caros como la necesidad de comprender el concepto lo que se requiere para hacer un proyecto en el dominio de Big Data.

Recuerdo a un amigo que instaló la pila Hadoop en su computadora portátil para simular cómo funcionaría en un entorno distribuido. Por supuesto, si fue muy lento y no fue útil en absoluto. Pero de eso se tratan los proyectos, de la demostración.