Accueil Instrumentación DDR4 LRDIMM atteint une bande passante mémoire sans précédent grâce à...

DDR4 LRDIMM atteint une bande passante mémoire sans précédent grâce au tampon de données et de registre d'IDT

Introduction

Avec la croissance exponentielle des analyses commerciales Big Data, des données en temps réel pour les médias sociaux et des applications mobiles, le besoin d'une mémoire plus rapide et de plus de mémoire n'a jamais été aussi grand. Au cours des dernières années, les entreprises appartenant à l'écosystème de la mémoire ont travaillé en étroite collaboration pour faire avancer le développement des mémoires système pour les applications métier. Cet article a pour but de souligner les avancées que l'industrie a connues avec la dernière technologie de mémoire DDR4 et plus précisément avec la DDR4 LRDIMM.

La technologie DDR4 LRDIMM (module de mémoire à charge réduite) utilise une technique de mise en mémoire tampon des données distribuées pour atteindre l'efficacité de la bande passante mémoire nécessaire pour les niveaux plus élevés de capacité et de vitesse des futurs systèmes de serveurs d'entreprise basés sur DDR4. Cette technique diffère de la solution de données sans tampon utilisée avec les RDIMM DDR4 (modules de mémoire enregistrés). Les LRDIMM, en général, ont continué d'évoluer et d'augmenter leur valeur pour les utilisateurs du système. Dans la figure 1, les systèmes d'entreprise DDR3 Gen1 tels que le E5-2600 atteignent une vitesse LRDIMM sous-optimale pour toutes les capacités pour des raisons qui seront décrites dans cet article. E5-2600 v2 a fait une percée en améliorant la valeur des LRDIMM pour les utilisateurs finaux et en contournant le problème d'inversion de vitesse qui existait dans E5-2600. DDR4 LRDIMM devrait amener les performances du sous-système de mémoire dans un nouveau paradigme. DDR4 LRDIMM atteint non seulement les capacités les plus élevées, mais également une gamme beaucoup plus large d'applications qui nécessitent la bande passante la plus élevée et les capacités les plus élevées.

L'écosystème dans son ensemble a réussi à faire en sorte que l'augmentation de la vitesse LRDIMM se traduise par une amélioration correspondante de la bande passante mémoire LRDIMM en gigaoctets par seconde (Go/s). La vitesse est analogue à celle de l'étoile de piste qui peut sprinter le plus rapidement en de courtes périodes de temps; la bande passante mémoire est analogue à celui qui franchit la ligne d'arrivée en premier. Voici un résumé des avancées DDR4 réalisées par différents acteurs de l'écosystème afin d'améliorer la bande passante utilisable en Go/s :

• Architecture LRDIMM améliorée pour une meilleure intégrité du signal sur les signaux de données

• Latence des composants réduite grâce aux composants de tampon de données distribués

• Meilleure intelligence et contrôle post-tampon par le contrôleur de mémoire

Comment ça se fait?

Pour comprendre comment la DDR4 réalise cette énorme avancée de la technologie LRDIMM, vous pouvez voir à quel point elle diffère de la DDR3. Les LRDIMM avec DDR3 et DDR4 réduisent le nombre de charges de données pour améliorer l'intégrité du signal sur le bus de données du module de mémoire d'un maximum de 4 charges de données à 1 charge de données ; cependant, la DDR4 ajoute certaines fonctionnalités pour réduire la latence globale et améliorer l'intégrité du signal, atteignant ainsi des vitesses comparables aux RDIMM DDR4. Cela rend les LRDIMM DDR4 égales ou supérieures à la bande passante des RDIMM DDR4 pour toutes les vitesses et capacités de mémoire.

Conception LRDIMM : tampons centralisés ou distribués

Un LRDIMM DDR3 possède une mémoire tampon située au centre du module, comme illustré à la Figure 2. Semblable à une RDIMM, la mémoire tampon (MB3518) stocke et retransmet les instructions, l'adresse et les signaux d'horloge à la DRAM. De plus, le LRDIMM stocke également le bus de données DRAM I/O. En stockant les données d'E/S, jusqu'à quatre charges DRAM sur le bus arrière sont réduites à une charge sur le bus avant.

Moins de charges améliorent l'intégrité du signal vers le contrôleur de mémoire ; cependant, alors que les pistes de bus de données d'E/S DDR3 RDIMM vont directement du connecteur de bord aux charges d'E/S DRAM, les pistes DDR3 LRDIMM sont connectées au tampon de mémoire situé au centre de la DRAM, augmentant ainsi les longueurs de piste jusqu'à 70 mm dans les tampons de mémoire avant et arrière (Figure 3). Ces longueurs de piste accrues posent un problème supplémentaire pour l'intégrité et la latence du signal de chemin de données à grande vitesse DDR3 en introduisant des connexions plus longues sur le bus de canal de mémoire. Ce qui se traduit par des vitesses d'E/S maximales inférieures par rapport aux modules RDIMM DDR3.

Comme le montre la figure 4 ci-dessous, la technologie DDR4 LRDIMM se débarrasse des longueurs de piste accrues introduites par les tampons de mémoire DDR3 en divisant la fonction de tampon de données et en distribuant neuf périphériques de tampon de données entre le connecteur sur le bord et neuf colonnes de DRAM DDR4. Les pistes de 70 mm trouvées sur les LRDIMM DDR3 ont disparu, remplacées par des pistes de 8 mm sur les bus avant et arrière qui sont de longueur égale à un RDIMM DDR4. En plus des longueurs de piste comparables aux RDIMM DDR4, le délai de propagation à travers les tampons de données DDR4 est environ 33 % plus rapide que le tampon mémoire de la DDR3, ce qui réduit encore la latence. La longueur de piste plus courte de DDR4 LRDIMM et la technique de mise en mémoire tampon plus rapide rendent la latence totale et le temps de lecture/écriture comparables aux RDIMM DDR4. Comme le montre la figure 5, ces meilleures caractéristiques de ligne de transmission permettent d'atteindre des débits de données plus élevés avec la DDR4 qu'avec la DDR3 en obtenant une ouverture plus nette du signal de données.

Optimisation de la latence des composants

Le tampon de mémoire centralisé de DDR3 ajoute également 2,5 ns de retard à travers le tampon et a un chemin supplémentaire de 70 mm entre le bus arrière et le tampon de mémoire et les E/S DRAM, ce qui introduit encore plus de latence au LRDIMM DDR3 par rapport à la solution RDIMM. Une plus grande latence via la mémoire tampon centrale pour DDR3 entraîne une diminution de la bande passante effective (Figure 6).

Pilotes LRDIMM classés par rang

Depuis l'introduction des premiers LRDIMM DDR3, les contrôleurs de mémoire ont continué à ajouter de l'intelligence pour améliorer l'utilisation des capacités de mémoire plus profondes des LRDIMM. Plus récemment, les progrès d'une fonctionnalité appelée "multiplication de plage" ont permis de réduire la latence et d'améliorer la bande passante.

La multiplication est conçue pour éviter le problème d'avoir un nombre limité de deux bits de sélection par LRDIMM pour choisir entre 1 à 5 options ; les options 1 à 4 consistent à sélectionner 1 des 4 DRAM (dans une plage de quatre DIMM "4R") pour récupérer un groupe de données et l'option 5 à n'accéder à aucune des 4 DRAM. L'option 5 peut être utilisée, par exemple, si des données sont récupérées à partir du 2ème ou du 3ème LRDIMM sur le même canal mémoire.

Comme dans l'exemple illustré à la Figure 8 pour les plates-formes de serveur Gen1 DDR3, le contrôleur hôte n'a pratiquement pas effectué de "classement" lorsqu'il fonctionnait en mode de multiplication de rang. Cela obligeait l'hôte à toujours supposer qu'il basculait vers une DRAM différente pour la lecture suivante, et donc à prendre en compte le temps nécessaire pour désactiver une DRAM et activer l'autre DRAM sur le même bus de données.

En pratique, cela signifiait que ces pilotes n'étaient pas capables de fournir la réponse la plus rapide lors de l'exécution de transactions de lecture réciproque dans la même plage logique. Cela a entraîné une pénalité allant jusqu'à 25 % sur la bande passante des données pour les lectures. Par rapport à une solution RDIMM dans des systèmes très denses à 24 emplacements fonctionnant à la même vitesse, LRDIMM ne fournissait que 70 % de la bande passante mémoire. Sur les plates-formes de serveur Gen2 DDR3, les pilotes appliquent un tri par rang physique après le tampon de données. Ils sont capables d'extraire les données de la mémoire beaucoup plus efficacement car les lectures et écritures réciproques sur la même DRAM peuvent fonctionner à pleine vitesse. Ils surmontent également d'autres limitations pour améliorer la vitesse. Ainsi, les plates-formes de serveur Gen2 DDR3 ont réussi à augmenter la vitesse par rapport aux plates-formes de serveur Gen1 DDR3, mais surtout en comblant l'écart de bande passante avec une solution RDIMM correspondante.

La seule pénalité en suspens pour les plates-formes DDR3 était due aux latences des composants et à la longueur des pistes, comme indiqué ci-dessus. Dans DDR4, l'architecture de tampon distribué réduit la latence à travers chacun des tampons de données distribués beaucoup plus petits. Cela permet également au contrôleur de mémoire de pouvoir masquer la latence beaucoup plus faible de sa microarchitecture.

Résumé

Les progrès de l'écosystème DDR4 LRDIMM ont poursuivi la tendance à l'amélioration significative de la bande passante mémoire ainsi que de la vitesse du canal.

L'objectif est d'augmenter l'utilité des LRDIMM par rapport aux RDIMM dans une grande variété d'applications, qu'elles nécessitent une capacité élevée ou une bande passante élevée, ou les deux. La figure 8 ci-dessous résume les résultats de ces avancées dans les générations successives de plates-formes de serveurs d'entreprise, sur la base d'expériences réelles menées dans le laboratoire de validation d'IDT. 3DPC à 1866 peut être réalisé en utilisant des LRDIMM, mais seulement 3DPC à 1600 si des RDIMM sont utilisés. Forts de ces avancées, nous espérons que certains fabricants de serveurs qui ont toujours configuré leurs plates-formes de serveur pour la vitesse considéreront également les LRDIMM 16 Go comme une alternative moins coûteuse à l'option LRDIMM 32 Go de capacité supérieure. À la base, DDR4 LRDIMM n'est pas seulement une question de capacité, mais aussi de bande passante.



Mots clés
farnell composants sl; mémoire ddr4 ; mémoire tampon