La minería de datos implica muchos desafíos lingüísticos. Hay muchas bibliotecas listas para usar que lo ayudan a superar estos problemas; sin embargo, en niveles más profundos, cuando necesite una solución personalizada, sentiría que le falta el conocimiento lingüístico (o simplemente necesita un buen lingüista para consultar).
Imagine este desafío de minería de datos: vaya al sitio web de craigslist y separe todos los anuncios donde una persona está buscando algo en lugar de vender. Ahora podría decir que es fácil, solo busque las ocurrencias de “Buscando” en el texto del anuncio y listo. Pero entonces, ¿qué pasa con esta oración?
Un cachorro doberman en busca de un nuevo hogar
El editor claramente está tratando de vender su cachorro doberman aquí.
- ¿Qué tan importante es hacer un curso de administración en una escuela de renombre?
- ¿Cómo es el curso de informática de B.Sc (Hons) de la universidad Shaheed Sukhdev? ¿Es el curso B.Sc (Hons) de sscbs mejor que B.Tech de cualquier universidad promedio?
- ¿Quién puede optar por el curso de computación en la nube?
- ¿El curso IPM-IIM tiene asignaturas de negocios en sus primeros 3 años?
- ¿Cuál es el mejor curso TEFL a tiempo parcial, en persona en Nueva York?
Su aplicación de minería de datos debería poder diferenciar esto de alguna manera.
El desarrollo de software web es más fácil pero no menos importante, por lo que es realmente difícil decir qué elegir, más bien pregúntese qué tema le interesa más, ya que al final del día pasará innumerables horas haciendo lo que eligió como profesión.