Pentium 4E, i primi passi della nuova generazione Intel

Annunciato senza clamore nella versione provvisoria a 478 pin, il Pentium 4 “Prescott” a 90 nm inizia la sua corsa verso i 4-5 GHz

aprile 2004 In febbraio Intel ha annunciato il primo modello di Pentium
4E “Prescott”
, inizio di una nuova generazione di CPU che
riceve il testimone dal Pentium 4C “Northwood” da
130 nm e prosegue nella corsa verso frequenze di clock sempre più alte,
portando anche le novità architetturali che il P4 Extreme Edition,
in quanto soluzione ponte, non poteva offrire.

Inizialmente il P4E è offerto a 2,8, 3, 3,2 e 3,4 GHz di clock nel package
FC-PGA2 a 478 piedini, compatibile con il P4C. Nel corso dell’anno
il P4E si trasferirà sul package LGA (Land Grid Array) a 775
pin
, necessario per il montaggio sulle nuove motherboard BTX
(Socket T)
e per salire in frequenza verso i 4 GHz a fine 2004 e oltre
nel 2005.

Come il primo Pentium 4 ebbe un avvio graduale e impiegò tempo per diventare
competitivo, anche il P4E nasce con la zavorra imposta dalla nuova architettura
e offrirà il meglio di sé a cavallo tra il 2004 e il 2005.

Numerose differenze
Rispetto al P4C Northwood, il P4E Prescott presenta numerose differenze. La
transizione al processo da 90 nm, che in passato avrebbe potuto
suggerire una riduzione di dimensioni e consumi e un immediato incremento di
clock, ha riservato delle sorprese (anche a Intel).

Il raddoppio delle cache L2 a 1 MB ha contribuito a innalzare
il numero di transistor dai 55 milioni del P4C a 125 milioni.
Anche se il die (la piastrina di silicio) si è ridotto
da 131 a 112 mmq e la tensione di alimentazione è scesa da 1,5-1,55 V
a 1,3-1,5 V, i consumi e le temperature di esercizio sono saliti
alle stelle, tanto da richiedere modifiche che hanno ritardato l’annuncio
del nuovo processore.

Una delle maggiori differenze di architettura del P4E è la nuova pipeline,
che si allunga ulteriormente passando da 20 a 31 stadi. Come
avvenne per il primo P4, la conseguenza è che si allungano ulteriormente
i tempi di latenza e i tempi persi nel ricostruire la pipeline
in caso di errata branch prediction (la previsione dell’indirizzo
di destinazione di un’istruzione di salto condizionato), ma in compenso
si mettono le basi per una notevole crescita delle frequenze di clock e delle
prestazioni.

I 125 milioni di transistor sono molti di più di quanti sarebbero previsti
prendendo il core del P4C e aggiungendo altri 512 KB di cache; con sei transistor
per cella di SRAM (la RAM statica della cache) si arriverebbe a 80 milioni di
transistor (55 del P4C più 25 per la cache). Anche aggiungendo le nuove
istruzioni SSE3, non si va lontano, quindi ci deve essere dell’altro.

Una delle risposte a questo interrogativo viene da Intel e consiste nella tecnologia
di debug del chip P4E, che permette di verificare il funzionamento del processore
per ogni singolo elemento funzionale.

Questo però non basta a giustificare 125 milioni di transistor ed è
diffusa l’opinione che nel P4E ci siano nuove aree funzionali
non ancora attivate
; lo stesso accadde ad esempio per l’HyperThreading,
“dormiente” nel P4 Willamette e attivato nel North-
wood. è anche stata ipotizzata la presenza di una seconda unità
di elaborazione, apparentemente avvalorata da quella che, nelle foto, sembra
essere una seconda cache L1.

Nell’evoluzione dal P4C al P4E è migliorata in modo apprezzabile
la branch prediction, sia quella statica (determinata dalla
struttura del programma) sia quella dinamica (che si basa sui
salti già eseguiti), con in più elementi tratti dall’esperienza
del Pentium M (la CPU dei portatili Centrino). In una serie di benchmark con
SpecCPU 2000, Intel ha rilevato un miglioramento nella percentuale di successi
della branch prediction da 99,141% a 99,246%.

Altre aree hanno subito miglioramenti, tra cui l’HyperThreading
(che si avvale di maggiori risorse hardware e di due nuove istruzioni) e una
serie di misure per incrementare il numero di istruzioni eseguite per ciclo
di clock. Dopo le SSE e le SSE2, il P4E introduce le SSE3,
una serie di 13 istruzioni SIMD (singola istruzione per dati
multipli); alcune colmano lacune delle SSE2, altre sono utili per applicazioni
audio e video (specialmente i codec) e per le applicazioni multithreaded.

Consumi
In teoria una motherboard con socket 478, chipset 865 o 875 e supporto per FSB
a 800 MHz può essere compatibile con il P4E, tuttavia quest’ultimo
dissipa oltre 20 watt in più e genera una ventina di gradi in
più di temperatura
(circa 65° anziché circa 46°
a parità di dissipatore).

Ne consegue che l’alimentazione sulla scheda madre deve essere in grado
di fornire 91 ampere di corrente ai P4E da 3,2-3,4 GHz e quindi deve conformarsi
alle specifiche FMB (Flexible Motherboard) 1.5 o 2.0
, mentre per un
P4C basta la FMB 1.0.

In pratica, per sapere se una motherboard è compatibile con un P4E di
una certa frequenza di clock, conviene consultare la documentazione del produttore
in cerca di una dichiarazione esplicita al riguardo.

In ogni caso il P4E, che inizialmente non ha prestazioni migliori rispetto
al P4C, non è destinato all’upgrade di motherboard esistenti, quindi
il problema della compatibilità riguarda principalmente chi assembla
i propri PC usando motherboard per P4C. Più avanti nel corso dell’anno
vedremo l’avvento delle motherboard con zoccolo LGA775 in combinazione
con il P4E da 3,6 GHz e oltre.

continua…

LASCIA UN COMMENTO

Inserisci il tuo commento
Inserisci il tuo nome