¿Hay alguna medida de la complejidad del lenguaje?

Javier Alcalde da una buena respuesta, las formas irregulares son una gran carga para la memoria y requieren mucho más tiempo para dominar el aprendizaje de nuevos idiomas.

Pero mi pensamiento es que realmente no podría haber tal medida en absoluto. El punto de partida de la lingüística moderna, como lo tomé, rechaza la noción de que un lenguaje humano tiene más complejidad que otro. La razón de esto es que no podemos encontrar ningún tipo de expresión lingüística significativa que un hablante de un idioma pueda producir, digamos uno muy “complejo”, que un hablante de otro idioma “más simple” no pueda reproducir.

Por supuesto, habrá variaciones en la forma, en la longitud, pero esencialmente la idea es que cada pensamiento humano puede ser expresado por cada lenguaje humano, sin importar cuán complejo o simple sea el pensamiento. Tenga en cuenta que el lenguaje es una forma de transmisión (codificación) de significado o pensamiento. Por lo tanto, en términos del nivel de complejidad que los lenguajes humanos pueden codificar, todos son iguales.

Entonces, para ponerlo en una metáfora, hay Lamborghinis y hay furgonetas VW viejas de los años 70. Ambos son autos y ambos conducen. ¿Es uno más elegante? Seguro. ¿Te hace sentir importante o exitoso? Seguro. ¿Puedes cargar doce personas en una de ellas? Seguro. Pero ambos operan con el mismo principio y ambos cumplen la misma función. Uno no es más un automóvil que el otro, no desde un punto de vista objetivo de todos modos.

En el lenguaje humano hay una gran cantidad de variación en la forma en que las personas codifican sus pensamientos. La variación que es relevante aquí se puede ver en la diferencia entre los idiomas que son morfológicamente ricos y pobres. En los idiomas morfológicamente ricos, las categorías léxicas pueden tomar muchas formas para codificar la información (el turco es un buen ejemplo), como género, número, caso, tiempo, etc. Los idiomas morfológicamente pobres (el mandarín es un buen ejemplo) tienen un cambio morfológico casi nulo. Los hablantes de mandarín no se pierden la información a la que los hablantes de turco tienen acceso. Este tipo de información generalmente se entiende contextualmente de todos modos.

En términos de aprendizaje de idiomas, la regla general es que si un idioma en particular tiene una gramática ligada a reglas muy “compleja”, como el árabe, una vez que domine una regla, puede comenzar a producir oraciones que no ha escuchado antes (excluyendo formas excepcionales de curso) aplicando la regla. Estos lenguajes generalmente se consideran más complejos o difíciles. Los lenguajes gramaticalmente ‘simples’ como el mandarín dependen mucho más de que los estudiantes aprendan de memoria un conjunto (masivo) de expresiones fijas y, en mi opinión, son mucho más difíciles de dominar. No puede producir oraciones o cadenas que no haya escuchado antes porque no hay una regla predecible que pueda usar para crearlas.

Buena pregunta. Creo que la respuesta simple es que no lo hacen, y la razón por la que no lo hacen es que no existe un método para medir objetivamente la complejidad de un lenguaje. Si hablamos de la dificultad para que los hablantes del idioma X aprendan el idioma Y, esto se puede hacer en términos de cuántas horas de estudio se requieren para alcanzar la fluidez / competencia, pero medir la complejidad abstracta es mucho más difícil.

Pero me niego a creer que no sea teóricamente posible. También me niego a creer que todos los idiomas son de igual complejidad. Quiero decir, ¡la gramática georgiana es claramente más compleja que la gramática española! Tuve una buena discusión con Audrey Ackerman sobre esto en su respuesta a ¿Hay una relación inversa entre la complejidad del sistema de escritura de un idioma y su gramática? en los comentarios Lo que sugerí es que la complejidad abstracta se puede medir teóricamente en términos del número de patrones únicos y el número de excepciones a esos patrones (irregularidades).

Lo cual es difícil, pero sigo creyendo que es teóricamente posible, utilizando principios de lógica y miles de millones de gigabytes de datos que probablemente no tenemos: analizar el patrón más simple y luego agrupar las progresiones y darles menos peso. Básicamente, cuente las cosas que necesita aprender desde cero que no puede deducir de las cosas que ya sabe.

Por ejemplo, los marcadores TAM en inglés tienden a ser agradables y lógicos: si sabes lo que construiré y lo que he construido significa que es fácil resolver lo que habría construido sería y si quieres cambiar el verbo principal a otro es fácil entender lo que me habrá encantado , no necesitas aprender la frase completa de nuevo. En georgiano si sé – shen – es construir y avasheneb es “Construiré” No tengo forma de deducir que si cambio eso – shen – por – q’var – (amor) entonces “amaré” de repente se convierte en meq’vareba solo porque está en otra clase de verbo. Definitivamente parece haber un caso para decir que muchos patrones en georgiano necesitan ser adquiridos activamente y no pueden deducirse del conocimiento previo.

Lo que creo que acordamos es que esto requeriría tantos datos, y un análisis tan profundo y en muchos casos subjetivo de estos datos, que no es nada plausible con la tecnología actual.

Por lo tanto, el único otro factor que puedo sugerir para medir la complejidad del lenguaje es cuánto tiempo y cuántas horas en las clases de gramática, se necesitan hablantes nativos para alcanzar un cierto nivel en él. Esto, sin embargo, tiene algunos defectos. Lo principal que se interpone en el camino es la percepción.

  • ¿Cómo mediríamos si alcanzan ese nivel?
  • Utiliza a los niños como muestra, y los niños a veces luchan por captar elementos del lenguaje por razones no relacionadas con la complejidad del lenguaje, especialmente con la fonología.
  • El concepto de alcanzar un cierto nivel requiere tener en cuenta las expectativas de la base de hablantes. En inglés, muchos de los usos no estándar utilizados casi exclusivamente por niños, también son utilizados por algunos hablantes nativos adultos.
  • Algunos idiomas son más indulgentes que otros sobre lo que es “correcto”.
  • Si un idioma es complejo y cierto grupo de hablantes encuentra una forma más simple de comunicarse, ¿no están hablando el idioma?

Realmente creo que tal método solo podría aplicarse al lenguaje escrito de idiomas con un instituto que los regule.

De lo contrario, la complejidad abstracta es algo que se puede sentir, pero no medir.

La complejidad del lenguaje natural es un tema de investigación en lingüística computacional. El libro La complejidad formal del lenguaje natural (editado por WJ Savitch) es una colección de capítulos sobre este problema.

Un primer intento de clasificación es decir que el lenguaje [matemáticas] L_2 [/ matemáticas] es al menos tan expresivo como el lenguaje [matemáticas] L_1 [/ matemáticas] si todo lo que se puede expresar en [matemáticas] L_1 [/ matemáticas] también puede se expresará en [matemáticas] L_2 [/ matemáticas]. Pero esta es una noción vaga (¿qué significa realmente la expresividad cuando hablamos de lenguas naturales?) Y otros han tratado de clasificar las lenguas según la jerarquía de Chomsky. Por lo tanto, uno buscaría, por ejemplo, un sublenguaje del francés que debe expresarse utilizando una gramática sensible al contexto. Si podemos encontrar un sublenguaje, entonces sabemos que el francés es al menos un idioma sensible al contexto.

Un artículo de Mohri y Sproat cuestiona este enfoque. También vea una presentación de Wiebke Peterson para una visión general del trabajo en el área.

Puede haber muchas medidas de este tipo, pero tal vez le interesarían los experimentos de Shannon para determinar la entropía del idioma inglés. Hizo que los participantes adivinaran la siguiente letra en un texto, y utilizó un análisis inteligente para calcular cuántos bits de información proporciona cada letra individual a un lector humano. Descubrió que la prosa en inglés contiene aproximadamente un bit de información por carta. Esto podría llamarse razonablemente la “complejidad del inglés”. Realizar el mismo experimento para otros idiomas arrojaría estimaciones de sus complejidades.

Sin embargo, esta es una noción muy sintáctica de complejidad; no dice mucho acerca de cuántas reglas necesita aprender para poder usar un idioma. Entonces, si ese es el tipo de complejidad que buscas, tendrías que definir una noción diferente de complejidad. Pero eso parece difícil de cuantificar: habría muchas preguntas como, ¿mides el tamaño de la gramática y / o el tamaño del vocabulario? ¿Qué hacemos con modismos y dialectos? Y así sucesivamente y así sucesivamente.

Una medida posible es la cantidad de irregularidades en la gramática, ortografía o vocabulario que tiene un idioma. Por ejemplo, se dice que el esperanto es más fácil que las llamadas lenguas étnicas, porque es más regular. De hecho, fue diseñado para ser más fácil precisamente por ser regular.