Hay muchas razones en diferentes categorías y trataré de mencionarlas todas.
Poder :

Al diseñar la microarquitectura de una CPU, una de las decisiones clave de diseño es cómo lograr un mayor rendimiento. Durante los días del Pentium 4, Intel (compañía) eligió ir con velocidades de reloj muy altas con una tubería relativamente estrecha. Este enfoque tiene muchas ventajas: una es que es fácil acelerar el código de serie de un solo subproceso. No se necesitaba hacer mucho en el software para paralelizar las instrucciones y la mayoría del software vería beneficios de inmediato.
Sin embargo, este enfoque también tiene sus fallas: ignorando las fallas de implementación del Pentium 4, solo hablaremos de las fallas en el concepto mismo. Principalmente que las CPU estaban golpeando una pared de energía y que las microarquitecturas de alta frecuencia no son muy adecuadas para muchas de las técnicas de diseño de baja potencia que se habían inventado para tratar el problema de la energía. Me referiré a los dos principales enfoques de diseño de baja potencia aquí.
Uno es de reloj.
La activación de reloj inserta una activación de reloj antes de cada elemento de estado (registro, retención, etc.) de modo que el elemento no se sincronice si no se van a escribir nuevos datos. Esto ahorra una cantidad significativa de carga / descarga que se desperdiciaría escribiendo el mismo bit en la celda. Sin embargo, esto también inserta un retraso adicional (la función de activación) en la ruta del reloj. Los diseños de alta frecuencia generalmente se ejecutan en márgenes muy bajos y simplemente no son muy adecuados para insertar un retardo variable adicional en la señal más crítica (el reloj).
- Siento que muchas personas no optan por la ingeniería de energía eléctrica en los maestros. Muchos optan por la electrónica y la comunicación. ¿Cuál es su opinión al respecto?
- ¿Cuáles son los mejores proyectos de eee?
- ¿Cómo es tomar 6.01 (Introducción a la Ingeniería Eléctrica e Informática I) en el MIT?
- ¿Cuál es la física detrás del salto que inicia una batería agotada?
- ¿Cómo funciona una raqueta eléctrica para matar mosquitos? ¿Es suficiente una batería AA para matar un mosquito?
Otra técnica común es la activación de energía.
Esto implica colocar transistores grandes y gordos en la fuente de voltaje para varias secciones del chip, generalmente bloques funcionales diferentes, y apagar esas secciones cuando no se usan. Nuevamente, a los diseños de alta frecuencia no les gusta esto. Los transistores de activación de potencia no solo agregan una caída de voltaje adicional, disminuyendo así la velocidad de conmutación del transistor, sino que un procesador de tubería muy estrecho simplemente no tiene muchas secciones que se puedan apagar en un momento dado.
Por lo tanto, desde un punto de vista micro-arquitectónico, los diseños estrechos de alta frecuencia simplemente no son inteligentes en cuanto a potencia.
Transistor Scaling :
Otra razón importante por la que la frecuencia del procesador no ha aumentado es simplemente que los transistores en sí mismos no se han vuelto mucho más rápidos.
Los otros han mencionado el tamaño del ancho del transistor, pero eso ha estado disminuyendo constantemente y continúa haciéndolo. La Ley de Moore a este respecto todavía está en juego.
Intel está fabricando actualmente en HKMG de 32 nm, tras pasar de 45 nm. Dos años antes de eso, era de 65 nm y antes de eso de 90 nm. TSMC, IBM (compañía) y GlobalFoundries comenzarán a fabricar chips de 28 nm este año e Intel está programando el cambio a 22 nm pronto. (actualización: 14nm está fuera):
Sin embargo, el problema es que mientras los transistores se hacen más pequeños, no se vuelven más rápidos . Y para entender esto, es necesario un poco de antecedentes sobre los MOSFET:
http://en.wikipedia.org/wiki/Mosfet
Verá, la velocidad de conmutación de un transistor depende de muchos factores. Uno de los factores principales es la intensidad del campo eléctrico creado en la puerta (el control del interruptor). Esta intensidad del campo eléctrico depende tanto del área de la compuerta (que se hace más pequeña a medida que se encogen los transistores) como del grosor de esa compuerta.
A medida que los transistores se reducen, el área de la puerta disminuye. En el pasado, esta reducción en el área significaba que la puerta de un transistor también podía hacerse más delgada. Si conoce los conceptos básicos de cómo funciona un condensador, cuanto más delgada es la separación entre dos placas conductoras, más fuerte es el campo eléctrico entre ellas. Este es el mismo principio que funciona en un MOSFET. Un dieléctrico de puerta más delgado conduce a un campo eléctrico más fuerte a través del canal del transistor, lo que significa que el transistor cambiará más rápido. Una reducción en el área de la puerta del transistor significa que la puerta podría hacerse más delgada sin aumentar negativamente la capacidad de carga (cuánto se necesita para cargar el nodo de control para crear el campo eléctrico).
Sin embargo, a partir de 45 nm, el dieléctrico de la puerta tiene ahora un grosor aproximado de 0.9 nm, aproximadamente del tamaño de una molécula de dióxido de silicio. Es simplemente imposible hacer esto más delgado.
Con high-k, Intel cambió el material del que está hecho este dieléctrico de compuerta de dióxido de silicio a un material a base de hafnio (muchos sospechan silicato de hafnio). También cambiaron el material de conexión de la puerta de polisilicio a metal.
Esto ayudó en la velocidad del transistor, pero era costoso y en gran medida una solución de curita. El asunto simple es que la escala fácil que hemos tenido en el pasado donde cada reducción en el tamaño del transistor también conduciría a transistores más rápidos ha terminado.
Escalado de chips:
Otra razón importante para una ralentización de la rampa de frecuencia es que los transistores ya no son el único factor, y en algunos casos incluso el más importante, en la velocidad con la que un procesador puede funcionar más. Los cables que conectan estos transistores ahora se convierten en el factor de retraso dominante.
A medida que los transistores se hacen más pequeños, los cables que los conectan se vuelven más delgados. Los cables más delgados significan mayor resistencia y menor corriente. Combine eso con el hecho de que los transistores más pequeños pueden conducir menos corriente y es fácil ver que el retardo de la ruta del circuito estará determinado solo en parte por la velocidad del cambio de los transistores.
Por supuesto, hay muchos trucos que se pueden usar durante el diseño de chips para contrarrestar esto. Un buen ingeniero de ubicación y ruta intentará enrutar su reloj y su señal de datos en rutas similares, haciendo que las dos señales viajen juntas y lleguen a su destino al mismo tiempo. Para un diseño con muchos datos y control ligero, como un motor de códec de video de función fija o un procesador de red, esta puede ser una solución muy efectiva.
Sin embargo, un microprocesador es un diseño muy complejo con una red de interacción que no es muy regular, los datos viajan a múltiples ubicaciones que no siempre siguen el reloj. Hay caminos de retroalimentación y bucles. Existen recursos centralizados como el seguimiento de riesgos, la programación, la predicción de ramas, los archivos de registro, etc. Estos diseños pesados de control se copian fácilmente en más núcleos, pero se complican por los cables más delgados necesarios al aumentar las frecuencias del procesador a través del método estándar.