4. Le Penryn : une nouvelle architecture ?Jusque là, le Penryn pourrait donc être qualifié de simple die-shrink. Ce n’est toutefois pas le cas puisque 3 évolutions font leur apparition.
SSE amélioré
Un nouveau jeu de 47 instructions fait son apparition, le SSE4, renommé SSE4.1 afin d’éviter la confusion avec les prochains jeux d’instructions AMD. Contrairement à ce que certains ont crus, les 16 nouvelles instructions introduites par le Core 2 Duo ne constituaient en effet pas une partie du SSE4, mais le SSSE3 (Digital Media Boost). Comme toujours, ces instructions ne montreront leur efficacité que dans les mois qui suivent et dans les applications multimédia optimisées pour ce jeu d’instruction, dont la base installée restera faible pour un moment. DivX 6.6.1 et TMPGenc sont en train de le supporter, et Sony Vegas, Mainconcept H.264 Encoder et Pinnacle Studio Plus devraient être optimisés pour ce jeu dès début 2008.
Autre amélioration, les instructions combinant les données entre des registres (shuffle) sont accélérées. On parle du passage d’une temps d’exécution de 2 cycles (Contact alignement, qword shifts, unpack integer notamment) voir 3-4 cycles pour certaines (Shuffle byte, insert, pack) à 1 cycle, pour un doublement des performances en moyenne. Les applications tirant parti des SSE précédents devraient donc être un peu plus rapides à fréquence égale sur le Penryn que sur l’actuel Conroe (Core 2), mais nous n’avons pas réussit à isoler avec certitude ce gain du suivant.
Divisions et virtualisation
Face au retournement de situation dont va faire preuve AMD avec le K10 sur les divisions (la latence devient variable en fonction de la taille des opérandes), Intel a également fait évoluer ses unités de calcul dédiées à la division : on passe du Radix-2,4 au Radix-16, ce qui signifie un doublement du nombre de bits traités par cycle, soit un doublement des performances en division. Ne cherchez pas plus loin le gain que nous allons observer dans les jeux…
Vu les performances avancées par Intel, on constate cependant que le calcul de la racine carrée (square root) a également fait l’objet d’optimisations, inconnues mais visiblement efficaces puisque l’opération est 3 fois rapide à fréquence égale.
Par ailleurs des améliorations non précisées ont été apportées à la gestion matérielle de la virtualisation : la transition entre les différentes machines virtuelles est accélérée de 25 % à 75 % en moyenne (sans nécessiter de prise en charge logicielle spéciale).
Mise en veille et overclocking automatique
Les avancées dans la quête de la plus faible consommation au repos devrait constituer une force du choix d’Intel de décliner une même architecture commune pour les 3 marchés (serveur, PC, portables). Ce n’est malheureusement pas le cas : nous avons pu vérifier que les Penryn en version desktop ne supporteront aucune des 2 fonctionnalités suivantes, malgré le flou laissé par Intel. Dommage vu la pression de plus en plus forte sur la baisse de la consommation au repos des PC classiques.
5. Le QX9650 : très haut de gammeSingularité de ce lancement, le Penryn qui sera officiellement lancé le 12 novembre ne sera que la version Extreme Edition, qui comme son nom l’indique aura un prix traditionnellement indécent. Pour tout le reste de la gamme, soit le vrai lancement de cette architecture, il faudra attendre janvier 2008. Qu’à cela ne tienne le QX9650 que nous avons pu nous procurer reste intéressant à analyser, notamment afin de déterminer la compétitivité des prochains Phenom dès leur lancement, et accessoirement afin de mesurer le gain de performance par rapport aux précédents Core 2 Quad. Une analyse facilitée par le fait qu’Intel a fait preuve de la plus grande réserve côté fréquence : le QX9650 reprend celle des actuels QX6850 et E6850, soit 3 GHz. Rappelons qu’il y a 3 ans, nous testions le Pentium 570, cadencé à 3.8 GHz.
Evidemment, l’architecture, les performances et la consommation n’avaient pas grand-chose à voir. Mais il reste regrettable de voir à quel point la course au cores et au rapport performances/watts a provoqué un recul des fréquences, qui non seulement sont plus faibles qu’il y a 3 ans donc, mais en plus ne sont quasiment plus augmentées d’une architecture à l’autre. Mais nous sommes mauvaises langues : Intel a d’ores et déjà prévu un nouveau Penryn Extreme Edition pour le premier trimestre 2008, encore bien plus chère que l’actuel, mais doté d’une fréquence orgasmique de… 3.2 GHz !
6. Le testLe Penryn reste similaire aux Core 2 de l’extérieur Le Penryn vu par CPU-Z
Pour ce test, une légère distinction a du être effectuée. Toutes les performances du duel QX9650 VS QX6850 (page suivante) ont été obtenues sur la même plateforme, à savoir la carte mère Asus P5K3 Deluxe accompagnée de 2 barrettes de DDR3 cadencées à 800 MHz, avec des réglages identiques. En dépit de ce fait, les performances obtenues avec cette plateforme sont très légèrement inférieures (entre -1,5 % et +0,5 %) à celles obtenues précédemment avec le QX6850, qui avait été testé sur la Gigabyte GA-P35C-DS3R avec de la DDR2, du fait de latences plus élevées (cette carte mère n’étant malheureusement plus disponible pour ce test). Ne disposant plus de l’ensemble des processeurs testés dans les pages d’après par ailleurs, cela signifie donc que le QX9650 y sera très légèrement désavantagé comparé au QX6850.
Asus P5K3 Deluxe (Core 2 QX9650)
Gigabyte GA-P35C-DS3R (Core 2 FSB 1333)
Intel D975XBX (Core 2, Pentium)
MSI K9N SLI Platinum (Athlon 64 X2)
AOpen i975Xa-YDG (Merom)
Kingston 2 x 512 Mo configurés en DDR-3 800 6-6-6-15-21 (QX9650 uniquement)
Crucial 2 x 512 Mo configurés en DDR-2 800 4-4-4-12-20
GeForce 7800 GTX (ForceWare 84.43)
WD Raptor 74 Go
Tagan U15 Easycon 530 W
Windows XP Pro7. Penryn QX9650 VS Conroe QX6850Avant de situer ce nouveau processeur Extreme Edition parmi la plupart des processeurs actuellement ou précédemment disponibles, nous avons bien sûr voulu le confronter directement et de manière plus exhaustive à son concurrent direct, le Core 2 Extreme QX6850 (sur une plateforme et avec des réglages identiques). Plus que l’écart de performance entre l’ancien et le nouveau Extreme Edition, leur fréquence identique va en effet nous permettre de déterminer quels gains attendre du reste de la gamme Penryn qui sera lancé en janvier, par rapport aux Core 2 6x50 (FSB1333) actuels.
En pratique, le gain est donc variable. A notre surprise, DivX Encoder 6.7, pourtant sensé tirer partie du SSE4 et donc montrer un gros gain, a été à peine plus rapide pour comprimer notre vidéo avec le Penryn. Les plus gros gains sont pourtant à l’actif d’applications de compression multimédia, à ceci près que ni LA Win ni Mainconcept H.264 ne tirent actuellement profit du nouveau jeu d’instruction. Les divisions deux fois plus rapides et le SSE Shuffle expliquent donc à eux seuls ces gains significatifs. Déception en revanche sous Winrar qui ne montre pas de gain particulièrement significatif, malgré l’augmentation de 50 % du cache L2. Sous les jeux (testés avec les détails maximum), les résultats sont eux aussi très variables, avec un gain nul sur FEAR mais significatif avec Oblivion.
Au final, le gain moyen sur toutes ces applications atteint donc 4,4 %.
8. 3DSMaxVoyons maintenant les performances du QX9650 face au reste du monde.
9. WinrarLes 12 Mo de cache permettent au Penryn de franchir un nouveau palier sous Winrar, avec encore 5 % de temps de compression gagné. Et dire qu’Intel ne dispose pas encore de contrôleur mémoire intégré dans ses processeurs… jusqu’où ira le Nehalem sur ce graphe ?
10. ConclusionLégère amélioration des précédents Core 2 "Conroe", le Penryn permet avant tout à Intel d’introduire sa finesse de gravure de 45 nm, qui introduit des innovations majeures sur le transistor. A côté de cela, cette nouvelle architecture est caractérisée par le passage de 2 x 4 Mo à 2 x 6 Mo de cache L2, l’introduction des 47 instructions constituant le SSE4, l’amélioration du SSE Shuffle, le doublement des performances en division, l’amélioration des performances en virtualisation et enfin un accès un peu plus rapide à la RAM.
Au final, le gain moyen atteint 4,4 %, à fréquence égale. Ce qui reste une déception au vu du coût en transistors engendré par cette nouvelle architecture (+41 % pour rappel !). Le rendement performances/transistors est donc largement en baisse, du fait d’une augmentation significative d’un cache L2 déjà très important, et qui n’apporte pas grand-chose. Bien sûr, cela s’explique clairement par le fait qu’Intel n’ayant pas voulu modifier en profondeur son architecture d’une part, et son quota de transistors ayant beaucoup augmenté du fait du passage au 45 nm d’autre part, l’augmentation du cache restait le seul facteur sur lequel jouer. Un facteur intéressant d’un point de vue marketing, mais pas vraiment en pratique donc, et nous aurions en fait préféré qu’Intel se passe de cette augmentation mais en profite pour baisser significativement le coût de ses processeurs, du même ordre que la réduction du coût de fabrication qui en a découlé. Car au tarif habituel des Extreme Edition, le QX9650 n’est pas plus recommandable que ses prédécesseurs : autant économiser 50 % de la note en optant pour un système bi-processeur basé sur deux E6850, un processeur dual-core lui aussi cadencé à 3 GHz, mais vendu a un prix bien plus attractif de 245 €.
Autre soucis : la fréquence de ce processeur qui ne fait qu’égaler celle du précédent QX6850, alors que de toute évidence Intel disposait de la marge nécessaire pour lancer ce Penryn QX9650 à 3.33 GHz voir 3.66 GHz, y compris au niveau de la consommation avec son TDP surestimé. La baisse est en effet très intéressante avec 57 W gagnés sur la consommation totale de la configuration, et un nouveau palier franchi dans la quête des performances/watt.
Reste maintenant à attendre janvier pour le vrai lancement de la gamme Penryn, afin de voir si les modèles proposés disposeront d’un rapport performances/prix significativement plus intéressant que les modèles actuels (ce qui n’est pas le cas du QX9650), et que les Phenom. Tout ceci est bien sûr la faute à AMD qui est largement dépassé du côté des performances et de la course aux cores. Une situation qui pourrait maintenant très rapidement évoluer.
Intel Core 2 Extreme QX9650En lui-même, le QX9650 est finalement assez peu intéressant face au QX6850 : seule la baisse de consommation et l’augmentation de la marge d’overclocking sont significatifs. Les performances sont en effet à peine à la hausse, du fait d’une fréquence inchangée et de gains somme toute modérés. On attend mieux d’un Extreme Edition…
Les PLus:Processeur le plus performant actuellement
Consommation en large baisse
Marge d’overclocking
Compatibilité avec les chipsets actuels
Les Moins:Gain faible par rapport au QX6850
Tarif d’un Extreme Edition
Pourquoi ne pas supporter l’IDA et le Deep Power Down ?