La forma en que hizo la pregunta no está clara. Otros han respondido basándose en la interpretación de la pregunta para aplicar a la arquitectura.
Por lo tanto, responderé interpretando que se relaciona con conjuntos de caracteres (tal vez la referencia a BCD implica eso.
Los conjuntos de caracteres se representaron principalmente hasta hace unos 15 años más o menos en códigos de caracteres de 7 u 8 bits. Los dos prevalentes fueron ASCII (7 bits) y EBCDIC (8 bits). Este último se usó principalmente en sistemas mainframe y amigos de IBM. Como ASCII no tenía suficientes puntos de código (otro nombre para representar un carácter) para representar todos los glifos (el carácter se llama así cuando se enfatiza su imagen visual), incluso en idiomas europeos se necesitaban soluciones. Como primer paso, ASCCII se extendió a 8 bits, con muchos de los 128 puntos de código adicionales utilizados para representar glifos en los idiomas de Europa occidental. Esto fue suficiente para poder usar, por ejemplo, á y Ö, etc., pero todavía se omitieron muchos idiomas. Por ejemplo, ő (utilizado en húngaro) y Ł (utilizado en polaco) no se incluyeron.
Lo siguiente fue un intento de mantener el código de 8 bits, pero usar múltiples codificaciones (también conocidas como páginas de códigos). El ASCII de 8 bits se convirtió en un estándar internacional como ISO 8859-1 y se introdujeron otras codificaciones como, por ejemplo, ISO 8859-2 (centroeuropeo; contiene los caracteres anteriores y otros, reemplazando y omitiendo algunos que están presentes en 8859-1) , ISO 8859-5 (cirílico), etc. Al menos dos problemas principales:
- ¿Cuál será la carga total que fluye de Y a X cuando S está cerrado?
- ¿Por qué la frecuencia de electrecity es de aproximadamente 50 HZ en algunos países?
- ¿Es posible cancelar una onda de radio enviando una onda con la misma amplitud y frecuencia que es antifásica?
- ¿Cómo amplifica una señal de entrada un amplificador (por ejemplo, una configuración de polarización básica de un transistor)?
- ¿Cuál es la diferencia entre ingeniería eléctrica y física aplicada? ¿Pueden los que se especializan en Física Aplicada hacer lo que hacen los ingenieros?
- Con un archivo escrito en una de estas codificaciones, es imposible saber cuál sin información adicional.
- Todavía no es compatible con chino, japonés, etc.
Aparte: Microsoft siempre queriendo establecer sus propios estándares, no cumplió del todo e introdujo los “Conjuntos de caracteres de Windows”. Estos difieren de los estándares ISO en algunos caracteres (que se suman al problema “no se puede decir la codificación”).
El siguiente paso fue Unicode. La versión original de Unicode usa 16 bits para representar [matemáticas] 2 ^ {16} \ aproximadamente 65,000 [/ matemáticas] glifos. Uno podría pensar que esto sería suficiente para representar todos los guiones humanos (y no humanos) desde japonés hasta inuktitut. Pero no, actualmente hay 120,000 caracteres en el estándar Unicode. El pequeño organismo de estándares tuvo la temeridad de rechazar la estandarización del klingon, pero estoy seguro de que no podrán mantener esa posición durante más de un par de siglos.
La mayoría de los sistemas operativos y la web han cambiado a operar con Unicode por ahora. Entonces se podría decir que todos usan un código de 16 bits.
Esto es tanto verdadero como falso. En realidad, hay múltiples codificaciones de Unicode. UTF-16 usa 16 bits para cada carácter, pero, por supuesto, no puede representar todos los caracteres Unicode en el estándar actual (que necesitaría al menos 17 bits).
La codificación más utilizada es UTF-8 (https://en.wikipedia.org/wiki/UTF-8).
- Se utilizan 8 bits para representar los primeros 128 caracteres Unicode, que por coincidencia son los mismos que los ASCII de 7 bits. El bit alto es 0.
- Cuando el bit alto no es cero, es una indicación de más de 8 bits, y los bits adicionales indican si es 16, 24 o 32 (ver el enlace para más detalles). En principio, incluso podría llegar a 40 y 48 bits, sin embargo, todavía estamos lejos de tener tantos glifos definidos que lo requieran.
- Se utilizan 16 bits para los siguientes 1.920 puntos de código, suficiente para la mayoría de los guiones no ideográficos (latín, griego, cirílico, árabe, hebreo, etc.).
- Se utilizan 24 bits para chino, japonés, coreano, etc.
- 32 se utilizan para lo que aún no ha sido cubierto.
- Hay algunas combinaciones de códigos que nunca pueden representar caracteres. Algunos de estos se pueden usar al principio del archivo para indicar qué versión de UTF-8 está en uso (incluso con UTF-8, los bytes se pueden ordenar de dos maneras, y esto se indica mediante algunos códigos al principio). Esto no es 100% infalible, sin embargo, los caracteres fueron elegidos para que sea muy improbable que un archivo codificado de 8 bits comience de esa manera.