Tue. Aug 27th, 2024

El Instituto de Cosmología Computacional (ICC) de la Universidad de Durham se está actualizando a una arquitectura de red sin interruptores para su supercomputadora COSMA7 a fin de reducir el riesgo de que la congestión de la red reduzca el ritmo de su investigación sobre los orígenes del universo.

El ICC utiliza una serie de grandes supercomputadoras para impulsar su investigación relacionada con el espacio, lo que requiere que se lleven a cabo simulaciones complejas y sofisticadas para que su equipo de 50 investigadores pueda ampliar su conocimiento sobre cómo funciona el universo.

La supercomputadora COSMA7 cuenta con el respaldo de la red Distributed Research Using Advanced Computing (DiRAC), que proporciona recursos de TI y financiamiento para instalaciones de supercomputación en universidades de Cambridge, Durham, Leicester y Edimburgo.

La supercomputadora también recibe fondos de Exascale Computing Algorithms and Infrastructures Benefiting UK Research (ExCALIBUR), una iniciativa de 45,7 millones de libras esterlinas centrada en la entrega de software de simulación de próxima generación a campos de investigación de alta prioridad en el Reino Unido.

Durante una conferencia de prensa para discutir la actualización de la red COSMA7, Alastair Basden, gerente técnico del clúster de computación de alto rendimiento (HPC) de COSMA en la Universidad de Durham, dijo que la institución trabajó con equipos de investigación en todo el mundo.

“Es una institución muy internacional y colabora con universidades de todo el mundo, y lo que hacemos principalmente es realizar enormes simulaciones del universo, comenzando con el Big Bang, antes de propagarlas en el tiempo hasta el día de hoy, permitiéndonos observar la evolución del universo durante este tiempo”, dijo Basden.

“Podemos poner física diferente en las simulaciones y podemos ver cosas que no entendemos. Cosas como materia oscura, energía oscura y ese tipo de cosas.

“Hay diferentes parámetros para esos y los ponemos en la simulación de inicio, propagamos la simulación y luego comparamos lo que obtenemos en la simulación con lo que observamos usando telescopios gigantes”.

Para garantizar que la supercomputadora pueda continuar realizando su trabajo de manera eficiente y productiva, y luego de una prueba de concepto exitosa, la universidad optó por renovar y actualizar la arquitectura de red de COSMA7 a un diseño sin interruptor utilizando la tecnología de Rockport Networks.

La implementación está siendo financiada por los programas DiRAC y ExCAlBUR, con la tecnología de Rockport que permite a la universidad distribuir la función de conmutación de red a los nodos finales de COSMA7, lo que efectivamente los convierte en la red.

Esto, a su vez, permite que se eliminen capas de conmutadores de la infraestructura de la supercomputadora y significa que se reduce el riesgo de congestión y cuellos de botella en la red, lo que permite a los investigadores de la universidad ejecutar sus simulaciones de manera más eficiente y obtener los datos que producen más rápidamente. .

Matthew Williams, CTO de Rockport Networks, dijo que el proyecto es indicativo de cómo están cambiando las actitudes y las ideas sobre cómo abordar los problemas de congestión de la red.

“Abordar la congestión ha ido más allá de aprovisionar más conmutadores para lanzar ancho de banda al problema”, dijo. “El control y la arquitectura sofisticados significan que el cliente ya no está a merced de los cuellos de botella que crea su infraestructura de red”.

El ICC se introdujo en Rockport Networks cuando la empresa todavía estaba en modo oculto por contactos mutuos en el gigante de hardware Dell, dijo Basden.

“Somos un centro de excelencia de Dell aquí en Durham, y Dell pensó que podríamos estar interesados ​​en la tecnología de Rockport”, agregó. “Entonces nos pusieron en contacto con ellos hace poco más de un año y medio, y resultó que teníamos este grupo aquí en el que podíamos probarlo y lo tomamos desde allí”.

La implementación final se llevará a cabo esta semana, pero Basden le dijo a Computer Weekly que los comentarios de los usuarios durante la fase de prueba fueron totalmente positivos, ya que sus equipos de investigación pudieron realizar su trabajo sin interrupciones.

“Mucha gente no se ha dado cuenta [the difference], lo cual es algo muy positivo”, dijo. “Para ellos, es solo una red y la han usado y no han tenido que ajustar su código, pero las personas que conocen el trabajo que se realiza detrás de escena están impresionadas”.

Como ejemplo de lo bien que ha ido la prueba, Basden señala las mejoras en el rendimiento que los investigadores que trabajan en un código de hidrodinámica de partículas suavizadas grande y complejo observaron durante la fase de prueba.

Ese código en particular usa “paralelismo basado en tareas”, por lo que la forma en que funciona no debería verse afectada por problemas de congestión de la red, pero su rendimiento también mejoró una vez que se agregó la tecnología de Rockport a la pila.

“Siempre estamos a la caza de tecnologías avanzadas con el potencial de mejorar el rendimiento y la confiabilidad de las cargas de trabajo informáticas avanzadas que ejecutamos”, dijo Basden.

“Según los resultados y nuestra primera experiencia con la arquitectura sin interruptor de Rockport, confiamos en nuestra elección para mejorar nuestro rendimiento de modelado a exaescala, todo respaldado por la economía adecuada”.

Related Post

Leave a Reply

Your email address will not be published. Required fields are marked *