Architettura FERMI e GF116
Il chip grafico GF116 prodotto da Nvidia è dotato di 1 Graphics Processing Clusters (GPC), dove possiamo trovare 1 Raster Engine e 4 Stream Multiprocessors (SM). Ogni SM invece contiene 48 CUDA core, 16 unità Load/Store, 8 Special Function Units, 8 Texture Units, 4 Warp Schedulers.
L'unità Polymorph Engine presente sul chip si occupa di tutte le operazioni riguardanti la tecnologia Tessellation. A supporto del memory controller (3 x 64bit) abbiamo una cache L2. Il chip di memoria del GF116 si differenzia dal precedente GF106 in quanto il controller di memoria è stato portato a 192bit ed è in grado di gestire moduli a densità mista.
Questa caratteristica non era possibile nei vecchi controller infatti si era costretti, con un bus di memoria di tipo fisso, ad usare quantitativi di VRAM pari a 1538MB oppure 768MB con bus controller a 192-bit, e specie nel primo caso, caratterizzato da un quantitativo di memoria maggiore, si andava incontro ad un notevole aumento dei costi non pienamente giustificati per le schede video di fascia medio \ bassa.
Con l'utilizzo del nuovo controller in grado di gestire moduli a densità mista si possono contenere i costi per il quantitativo di memoria usata che ora può essere pari a 1024MB. Allo stesso tempo si può garantire una bandwidth derivata dal nuovo bus a 192bit anche su schede di fascia bassa che possono quindi esprimere tutta la loro capacità di calcolo senza andare a limitare la banda passante verso la memoria. Inoltre spesso il compromesso di usare un quantitativo pari a 768MB risultava penalizzante, a maggior ragione quando l'utente va ad usare risoluzioni più elevate rispetto a quelle standard oppure andava ad abilitare filtri di miglioramento delle immagini.
AMD come invece sappiamo usa controller di memoria di tipo a 64/128/256bit sulle varie fasce di schede, usando poi quantitativi di memoria abbinati alla tipologia di bus usato ed in base alle schede prodotte, i quantitativi sono generalmente fissi e sono pari a 512/1024/2048MB. Nvidia avendo maggior flessibilità grazie al nuovo controller può adesso scegliere di variare il quantitativo di memoria a seconda della necessità.
Ecco come si presenta il nuovo chip grafico prodotto da Nvidia:
Nella GeForce GTX 550 Ti troviamo quindi 192 unità CUDA core con frequenza di 1.800 MHz, 32 Texture Address / Filtering, 24 ROPs, controller di memoria a 192-bit e 1024 MB di memoria video del tipo GDDR5, con frequenza operativa di 4.104 MHz. Il core grafico, formato da 1.17M di transistor, che è lo stesso numero previsto in GF106, lavora sempre in rapporto 1:2 rispetto ai CUDA core ed ha una frequenza di 900 MHz nella versione reference di Nvidia. Possiamo osservare di seguito una tabella che mette in evidenza le caratteristiche architetturali del chip Nvidia GF116:
Il sample oggetto di questa recensione avrà frequenze superiori rispetto alla versione reference in quanto si tratta di una "overclock edition".