María José Martín Santamaría (Departamento de Ingeniería de Computadores de la Universidade da Coruña)

Título: Nuevas tendencias en tolerancia a fallos para aplicaciones paralelas

Descripción:

Estudios recientes demuestran que, a medida que los sistemas paralelos evolucionan, el tiempo medio hasta fallo del sistema también se reduce. Por tanto, las aplicaciones largas necesitarán incorporar algún mecanismo de tolerancia a fallos, no solamente para garantizar la finalización de sus ejecuciones, sino también para ahorrar energía. En esta conferencia discutiremos diferentes soluciones para dotar de tolerancia a fallos a las aplicaciones paralelas. Empezaremos viendo las soluciones tradicionales basadas en parada y reinicio utilizando ficheros de checkpointing, para pasar a continuación a revisar la alternativa en la que se están focalizando los esfuerzos de investigación en la actualidad, la construcción de aplicaciones resilientes.

Biografía:

María J. Martín es Profesora Titular de Universidad y Directora del Departamento de Ingeniería de Computadores de la Universidade da Coruña. Tiene reconocidos 3 sexenios de investigación y está acreditada como Catedrática de Universidad desde 2015. Su principal área de investigación es la computación de altas prestaciones y, más específicamente, la computación paralela y distribuida y la tolerancia a fallos. En esta última línea ha dirigido recientemente 3 tesis doctorales centradas en la tolerancia a fallos de aplicaciones MPI, con especial énfasis en la escalabilidad. Ha sido co-autora de más de 100 artículos internacionales en el campo de la computación de altas prestaciones y ha participado de forma activa en más de 20 proyectos nacionales y regionales, siendo Investigadora Principal de uno de ellos centrado en tolerancia a fallos para aplicaciones MPI. Los resultados de su investigación han dado lugar a 4 registros software, 4 contratos con el CESGA (Centro de Supercomputación de Galicia) y 3 contratos con Hewlett-Packard para transferencia de tecnología. Ha participado en el Comité de Programa de varias conferencias internacionales como Europar y CCGRID, entre otras. También ha formado parte de la Comisión Evaluadora de Proyectos del Plan Nacional de I+D (área TIN) y del Comité Técnico de Evaluación de los contratos postdoctorales Juan de la Cierva.

Mikel Luján (School of Computer Science at the University of Manchester)

Título: From PAMELA to EuroEXA and RAIN in Manchester

Descripción:

The research areas covered by the Jornadas SARTECO, namely computer architecture and systems, parallelism and reconfigurable computing, are becoming increasingly intertwined and reap from crossfertalisation. In the PAMELA project, we started considering 3D scene understanding (also referred to as AR, VR, XR) as an important applicatition domain that could drive heterogenous computer systems. PAMELA has generated important insights for how to simulate and design hardware accelerators, as well as benchmarking frameworks such as SLAMBench (https://github.com/pamela-project/slambench2). The H2020 EuroEXA project is a co-design research program for HPC applications and architectures. We are investigating how reconfigurable technologies can be embraced for acceleration of computation, networking and storage operations. In the RAIN Hub, we are extending 3D scene understanding to include dynamic objects as well as considering extreme environments. This talk will cover mainly the PAMELA project, and ongoing research for the EuroEXA and the RAIN hub projects. The common thread will be the lessons that we are learning on programming and designing future heterogenous computer architectures.

Biografía:

Prof. Mikel Luján is the ARM/Royal Academy of Engineering Research Chair in Computer Systems at the University of Manchester since 2019. He is also the director of the ARM Centre of Excellence at the University of Manchester and helds a Royal Society Research Fellowship since 2008 until 2017. In an industrial setting, he is the Chief Scientific Advisor of the spin off company (Amanieu Systems) which is commercialising research on Dynamic Binary Translation for modern ARM processors. Since his first paper in OOPSLA 2000, Mikel has authored more than 130 refereed papers and has amassed a rich research experience extending to a range of topics from parallel programing to many-core architectures, passing by machine learning and FPGAs. For example, in the last two years he has published papers in ACM TOPLAS, IEEE TOC, ICRA, HPCA, PLDI (distinguished paper award), FCCM, VEE, and ISPASS (best paper award). In other words, he is investigating low power many-core systems considering the full stack. Mikel is well known for his contributions in speculative parallelisation, transactional memory and dynamic binary modification and translation for ARM.

Los comentarios están cerrados.