CERN et Toshiba: un tandem qui progresse pour faire face au stockage et à la sécurité des données
Tres generaciones de discos duros de este fabricante han ayudado al laboratorio de física más grande del mundo a realizar un seguimiento de los cientos de terabytes de datos generados cada segundo en los experimentos del Gran Colisionador de Hadrones.
Ubicado en el laboratorio de física de partículas del CERN, el Gran Colisionador de Hadrones (LHC) está a la vanguardia de la investigación en física. Los datos resultantes de las fases Run 1 oui Run 2 ya se han utilizado para demostrar la existencia de una partícula subatómica no detectada previamente y han ampliado la comprensión del Universo y su formación.
La magnitud del CERN es asombrosa: desde el tamaño del gran colisionador de hadrones -un acelerador de partículas circular con un radio de 4,3 Km-, hasta la tasa de colisiones de partículas -más de 1.000 millones-, que pueden producirse cada segundo dentro de los detectores del experimento LHC.
Bien que, los volúmenes de datos se sitúan a la cabeza, ya que las colisiones generan 1 petabyte (PB) de datos por segundo. Incluso después de filtrar únicamente los eventos interesantes, la instalación requiere que se guarden cada mes aproximadamente 10 PB de datos nuevos para su análisis.
Estos datos se almacenan en el Centro de Datos del CERN y se comparten para su análisis con una red de 170 centros, gracias a la red mundial de computación LHC (WLCG). La configuración actual de almacenamiento del CERN se basa en memorias intermedias HDD, escroquer 3.200 JBOD (just a bunch of disk) que suman 100.000 unidades de discos duros (HDD) y que proporcionan un total de 350 PB.
El CERN utiliza unidades de discos duros de Toshiba Electronics Europe para gestionar grandes volúmenes de datos desde el año 2014; lo que supone tres generaciones de tecnología de discos duros de este fabricante que ha proporcionado los incrementos de capacidad requeridos.
La progresión continuará cuando “las actualizaciones planificadas del LHC requieran escalar los recursos de computación y almacenamiento más allá de lo que la tecnología actual puede ofrecer”, explica Eric Bonfillou, director de la sección de planificación y adquisición de instalaciones en el departamento de TI.
Cronograma en sistemas de almacenamiento
Depuis 2014, el CERN utiliza discos duros de servidor de Toshiba de alto rendimiento, fiabilidad y optimizados para las capacidades más altas. Previamente, en l'année 2013, el CERN realizó una fase programada de apagado para prepararse para el Run 2 para actualizar sus sistemas de almacenamiento, agregando arrays JBODs de 24 bahías con discos duros MG03SCA400 de este fabricante.
Con 4TB de capacidad por HDD, cada uno girando a 7.200 rpm y recibiendo datos a través de una interfaz de 6 GB/s, CERN ganó 96TB por cada unidad JBOD de expansión. El tiempo medio hasta el fallo (MTTF) de los HDD era 1,2 millions d'heures, lo que se traduce en un pronóstico de ratio de fallo anual (AFR) de 0,72%.
De 2015 un 2016, el CERN inició el Run 2, ya que las necesidades de almacenamiento de datos aumentaban enormemente, por lo que añade más capacidad utilizando el nuevo modelo STA de 6TB de Toshiba. En una instalación JBOD de carga frontal de 24 bahías 4U, la capacidad bruta total se incrementó hasta 144 TB par unité.
A partir de 2016, Toshiba a accéléré le développement et l'introduction de nouveaux modèles de disques durs d'entreprise à haute capacité afin de répondre aux besoins mondiaux de stockage de données dans le cloud avec les systèmes MG05 et MG06 (ce dernier a atteint des capacités allant jusqu'à 10 To par unité), a été capable d'augmenter le MTTF à 2, 5 millions d'heures, ce qui se traduit par un AFR de 0.35%, le plus bas du marché actuellement pour les disques durs remplis d'air.
Pour l'enregistrement magnétique conventionnel (CRM) dans un facteur de forme de 3,5’’, la technologie des disques durs remplis d'air atteignait une limite de 7 plateaux, escroquer 10 To inclus. Bien qu'il soit théoriquement possible d'augmenter cette capacité en utilisant des plateaux plus fins, l'air était un gaz trop lourd, ce qui provoque une ondulation sévère.
Comme alternative, la technologie d'Enregistrement Magnétique Coulissant peut être utilisée (SMR), mais elle nécessite un traitement spécial pour éviter des problèmes graves de performance et est limitée par le besoin de systèmes de fichiers spéciaux, adaptés aux complexités de cette technologie.
La mise à jour du stockage du CERN en 2018 a coïncidé avec le lancement de la gamme MG07 de Toshiba, le premier rempli d'hélium avec jusqu'à 14 To de capacité par HDD. Avec l'acquisition de la variante de 12 tuberculose, le CERN a doublé sa capacité par JBOD jusqu'à 288 tuberculose.
Le modèle MG07 augmente la capacité sans changer le facteur de forme en utilisant de l'hélium au lieu de l'air, ce qui permet d'utiliser des plateaux plus fins sans la ondulation associée, avec jusqu'à neuf plateaux par unité.
En utilisant la technologie CMR, le modèle MG07 convient à toute charge de travail sans entraîner la perte de performance associée à la technologie SMR. En plus, l'hélium crée moins de friction que l'air, réduisant considérablement l'énergie nécessaire pour faire tourner l'empilement de plateaux.
Avec une optimisation précise du moteur de l'axe, l'énergie nécessaire en fonctionnement a été réduite d'un tiers (de c.11W à moins de 7W) dans le modèle basé sur l'hélium de la série MG07.
Plus de demande de stockage de données
Dans 2019, le LHC a de nouveau été arrêté pour installer de nouvelles mises à jour avant son redémarrage pour l' Run 3 dans 2021, année au cours de laquelle une augmentation significative des besoins de stockage est prévue en raison de l'accélération des données générées.
Comme le souligne Eric Bonfillou, les produits et le support ont satisfait aux exigences strictes du CERN. Notre infrastructure informatique, en termes de puissance de calcul et de capacité de stockage, ont bien évolué avec l'augmentation des besoins informatiques scientifiques, tirant le meilleur parti des disques durs haute capacité et fiabilité de Toshiba.
Les lancements prévus par Toshiba d'unités basées sur la technologie CRM et SMR utilisant le même facteur de forme de 3,5” offrent au CERN l'accès à des unités de 16 et 18 To, ajoutant 432 To de nouvelle capacité par JBOD.
Larry Martinez-Palomo, directeur général de l'unité commerciale HDD chez Toshiba Electronics Europe, C'est ce qu'il souligne: nos produits Toshiba sont adaptés au stockage à grande échelle dans les centres de données et le déploiement et l'exploitation de trois générations de disques durs d'entreprise dans l'environnement informatique exigeant du CERN est une référence parfaite de succès.
En ce qui concerne l'activité de R&D à plus long terme, Toshiba développe une nouvelle génération de technologie d'enregistrement magnétique qui augmentera encore les capacités pour dépasser les 20 To par HDD, tout en maintenant le facteur de forme de 3,5 pouces.
Nous sommes convaincus que notre prochaine génération de technologies HDD contribuera à relever les défis futurs stimulants du CERN en matière de capacité de stockage, budget d'investissement, consumo de energía y fiabilidad”, apunta Martinez-Palomo.
Avez-vous aimé cet article?
Abonnez-vous à notre NEWSLETTER et tu ne manqueras de rien.