¿Cómo son los transistores tan resistentes?

Estos transistores pueden fallar, al igual que cualquiera de las otras partes del chip (y los otros componentes utilizados en la computadora). Sin embargo, los fabricantes de chips hacen todo lo posible para garantizar que sus procesos de fabricación estén bien controlados y sean repetibles.

Se necesita mucho trabajo para diseñar estos circuitos, incluidos los detalles de la producción de obleas de silicio y el dopaje y otros procesos que crean transistores, resistencias, diodos, etc., capa por capa. Después de la fabricación, se realizan muchas pruebas para confirmar que estas capas (y los conductores / resistencias de interconexión) tienen las propiedades eléctricas correctas. Se realizan pruebas adicionales cortando chips seleccionados al azar para garantizar que la alineación de las diversas capas sea correcta y que las conexiones entre las capas se formen correctamente.

Entonces, la respuesta simple es que al controlar todos los aspectos de los diversos pasos, incluso un proceso complejo (y resultados finales complejos) puede hacerse confiable.

Bueno, primero déjenme mencionar eso en el caso de las CPU modernas. Gran parte de la circuitería tiene verificación de errores y redundancia incorporada, de modo que una sola falla no crítica no arruina todo el chip. Además, una falla en un solo transistor en un área no crítica o poco utilizada del chip podría no causar errores notables de manera regular. Dicho esto, la mayor parte de la verificación de errores y la redundancia solo son efectivos en el momento de la fabricación (las pruebas revelan un circuito defectuoso y el chip está configurado para no usarlo) y la mayoría de las CPU parecen pasar largos períodos de tiempo sin desarrollar un solo físico fracaso.

La razón de esto es que una vez que se fabrica y se prueba un chip, se sella herméticamente dentro de una caja. Una vez hecho esto, no hay nada que pueda venir y romperlo a menos que se abra la carcasa. Esencialmente, el único modo de falla es el sobrecalentamiento (OK, también algunas formas de radiación … pero eso es bastante raro). Mientras el chip se mantenga por debajo de su temperatura crítica, debería continuar funcionando durante mucho tiempo. El problema es que no se puede conocer la temperatura crítica de un chip determinado con certeza. Es posible que una parte del chip esté ligeramente deformada o contaminada, de modo que esa parte sea más sensible a las fluctuaciones de calor de lo que debería ser. La escala en la que está hecha la circuitería es sensible (en las partes más pequeñas) a solo unos pocos átomos del material equivocado en el lugar equivocado. Como ejemplo, si demasiados átomos que no son de cobre migran a una vía de cobre, el aumento de la resistencia puede generar demasiado calor y dañar los circuitos cercanos, o bien vaporizar la vía misma y arruinar la interconexión.

En comparación con los tubos de vacío (estado allí, hecho), son inmortales, pero aún así no son perfectos.

Vea ¿Cómo pueden ser estables las CPU cuando tienen tantos transistores?

También: (extracto):
En este artículo presentamos la tubería BulletProof, el primer mecanismo de costo ultra bajo para proteger una tubería de microprocesador y un sistema de memoria en chip de defectos de silicio. Para lograr este objetivo, combinamos técnicas de prueba en línea frugal de área y puntos de verificación a nivel de sistema para proporcionar las mismas garantías de confiabilidad que se encuentran en las soluciones tradicionales, pero a un costo mucho menor. Nuestro enfoque utiliza un mecanismo de puntería de verificación microarquitectura que crea épocas de ejecución de grano grueso, durante las cuales los mecanismos de autocomprobación incorporados en línea distribuidos (BIST) validan la integridad del hardware subyacente. En caso de que se detecte una falla, confiamos en la redundancia natural de los procesadores paralelos de nivel de instrucción para reparar el sistema de modo que aún pueda funcionar en un modo de rendimiento degradado .
http://www-personal.umich.edu/~k

No siempre Muchas personas han dedicado muchas horas de trabajo a hacer que todo el proceso sea lo más confiable posible. Aun así, a medida que las cosas se prueban durante el proceso, muchos chips se marcan como malos.

Incluso después de todas esas pruebas, las CPU se prueban nuevamente y algunas fallan.

Luego, ocasionalmente, algunos seguirán fallando en el uso. Lo hemos llegado al punto en que el MTBF (tiempo medio entre fallas) es del orden de 10s o 100s de miles de horas.

El calor es enemigo de la electrónica. Así que ponemos grandes disipadores de calor y ventiladores en las CPU y los ventiladores en los casos.

Esto no es tan sorprendente. Los transistores son pequeños y delicados, pero los diseñadores saben por las leyes de la física y las pruebas exhaustivas cuáles son los límites antes de que se causen daños y los transistores se operan en condiciones suficientemente conservadoras para evitar daños, incluso con el uso a largo plazo, siempre que nada salga mal durante la producción de los dispositivos como un defecto en los procesos de fabricación que convierten las materias primas en el IC final o en las materias primas mismas. Las exigencias de precisión para el trabajo son extremas, pero la maquinaria se ha desarrollado tan bien que puede ofrecer un índice de éxito aceptable. No sé la tasa actual de fallas, pero una vez leí que ha habido dispositivos con tasas de fallas considerables.

Evitar fallas incluye la elección adecuada de materiales que sean compatibles cuando trabajen juntos (nuevamente, hubo problemas en el pasado), mantenerse dentro de los límites de potencia y voltaje y obtener el calor producido en funcionamiento porque los transistores fallan rápidamente cuando están demasiado calientes. Esto está lejos de ser trivial y en casos especiales se emplearon medidas extremas, como la refrigeración líquida.

Finalmente, las partes se prueban cuidadosamente para eliminar las “débiles”. Cuando la confiabilidad debe ser muy alta (los cables militares, espaciales, médicos y submarinos son ejemplos), el componente terminado (no solo las partes de la computadora) puede dejarse operando bajo condiciones realistas o quizás estresadas durante un tiempo considerable para asegurarse de que no fallen temprana edad. Las muestras se pueden analizar en condiciones particularmente difíciles para verificar si hay debilidades intrínsecas.

depende del tipo de transistores y su temperatura de funcionamiento. Los transistores bjt comunes MOst están construidos sobre silicio y tienen una clasificación de 200C. Cuando se empuja a este límite de temperatura, el silicio se rompe. Entonces, si un diseño tiene una buena reducción, ya que no se lleva al límite, será muy confiable. Además, el ciclo térmico, es decir, calentamiento y enfriamiento, puede causar tensiones mecánicas que aumentan la tasa de falla. Entonces, en aplicaciones de alta rel, dejar el equipo encendido ayuda a la longevidad.

Otros tipos de transistores como MOS tienen compuertas insufladas que pueden descomponerse por estática y también por radiación y rayos cósmicos. Millones de rayos cósmicos pasan nos abruman cada minuto.

Los transistores son muy confiables, pero es el ambiente y los factores estresantes que lo afectan

Cero partes móviles, y la cantidad de corriente que fluye a través de estos transistores es MUY pequeña.

Además, los diseñadores se han vuelto bastante buenos al armar una placa base que no los freía con corrientes transitorias, sobrecalentamiento, etc.

El transistor utilizado en el microprocesador no es como el transistor onaryary. Se fabrican en un solo chip debido a muchas pérdidas y la cautividad e inductancias reducidas entre cada transistor. Por lo tanto, las lisas de circuito son mínimas, por eso el transistor (particularmente el que está presente en el microprocesador) tiene una larga vida …

Se graban esencialmente en un sustrato de silicio que luego se sella herméticamente, generalmente en plástico. El sustrato de silicio es delgado pero sólido.