Noticias

O ecossistema de supercomputação latino-americana para a ciência

By 26 de outubro de 2020 No Comments

Iniciativas de pesquisa grandes, caras e com uso intensivo de computação têm historicamente promovido a computação de alto desempenho (HPC) nos países mais ricos, principalmente nos EUA, Europa, Japão e China. O impacto exponencial da Internet e da inteligência artificial (IA) elevou a HPC a um novo patamar, afetando economias e sociedades em todo o mundo. Na América Latina não foi diferente. No entanto, o uso do HPC na ciência afetou os países da região de forma heterogênea. Desde a primeira edição em 1993 da lista TOP500 dos sistemas de supercomputação mais poderosos do mundo, apenas o México e o Brasil (com 18 participações cada) entraram na lista com supercomputadores voltados para a pesquisa. Em junho de 2020, o Brasil era o único representante da América Latina na lista.

HPC representa um recurso estratégico para os pesquisadores latino-americanos responderem aos desafios econômicos e sociais da região e se fertilizar com pesquisadores do resto do mundo. No entanto, os países latino-americanos ainda estão atrás de outros países em termos de tamanho e regularidade dos investimentos em HPC. A tabela aqui compara a capacidade de HPC dos países do BRICS, que juntos representam quase metade da população mundial. Como referência, em 2018, o PIB da África do Sul era 29,1% inferior ao da Argentina e apenas 11,2% superior ao da Colômbia, os dois países da América Latina com maiores PIBs depois do Brasil e do México. Apesar do quadro geral descrito aqui, o panorama do ecossistema de HPC da América Latina para a ciência é promissor, com muitas iniciativas e resultados concretos notáveis.

HPC na América Latina: os casos do Brasil, México e Uruguai

Comparar a situação do HPC em três diferentes países da América Latina ajuda a entender as distinções da região, não só em termos de capacidade geral, mas também em termos de políticas adotadas para a criação e operação deste tipo de sistemas de instrumentação científica. Os exemplos apresentados são representativos de outras iniciativas importantes na região, por exemplo, NLHPC no Chile, Tupac na Argentina, SC3UIS na Colômbia e CeNAT na Costa Rica.

No Brasil, o Laboratório Nacional de Computação Científica (LNCC) é o grande protagonista dos serviços de HPC à comunidade científica. O LNCC é um centro público de pesquisa interdisciplinar com uma abordagem orientada para a missão de modelagem computacional e matemática e simulação de problemas complexos. O LNCC coordena uma rede de 10 centros de HPC (SINAPAD) financiados pelo Ministério da Ciência, Tecnologia e Inovação (MCTI) do Brasil (ver Figura 1 ). Os centros do SINAPAD oferecem recursos,

treinamentos e portais científicos 9 , 11 para a comunidade brasileira.

Figura 1. Principais centros do SINAPAD, Brasil.

Figura. Supercomputador Santos Dumont no LNCC, Brasil.

Figura. Laboratório ABACUS em CINVESTAV, México.

Figura. Cluster-UY no datacenter Massera, Uruguai.

O LNCC recebe o Santos Dumont, que até junho de 2020 era o maior supercomputador dedicado à pesquisa da América Latina. Com desempenho de 4,2 petaflops e capacidade de armazenamento de 2,3 petabytes, Santos Dumont desempenha um papel central na promoção de iniciativas de pesquisa de alta qualidade no Brasil.

Comparar a situação do HPC em três diferentes países da América Latina ajuda a entender as distinções da região, não só em termos de capacidade geral, mas também em termos de políticas adotadas para a criação e operação deste tipo de sistemas de instrumentação científica.

O supercomputador Santos Dumont já abrigou mais de 160 projetos revisados ​​por pares de instituições espalhadas por todo o Brasil, que juntas consumiram mais de 500 milhões de horas de CPU, produziram mais de 300 artigos científicos em artigos acadêmicos em periódicos e apoiaram mais de 60 doutorados. . graduações desde sua inauguração, em agosto de 2016. Um exemplo de projeto estratégico no Santos Dumont é a modelagem computacional de aspectos-chave da operação do Sirius, a nova fonte de luz síncrotron brasileira de quarta geração (ver https: //www.lnls.cnpem. br / sirius-en / ). Além disso, Santos Dumont tem fomentado importantes colaborações internacionais, como no desenho racional de vacinas candidatas ao zika. A equipe de pesquisa do LNCC também usa a capacidade de Santos Dumont para desenvolver projetos de alto impacto, incluindo o desenvolvimento de modelos computacionais eficientes que quantificam a gravidade funcional da estenose da artéria coronária, 3 e o sequenciamento do genoma, no início da pandemia COVID-19, de 19 vírus de diferentes regiões do Brasil, demonstrando o estado da transmissão comunitária.

No México, o ABACUS, Laboratório de Matemática Aplicada e HPC do Centro de Pesquisa e Estudos Avançados (CINVESTAV) exemplifica as diversas iniciativas de HPC agrupadas na Rede Mexicana em HPC (REDMEXSU), cujos principais membros são mostrados na Figura 2 .

Figura 2. Principais membros da Rede Mexicana de HPC – REDMEXSU.

O CINVESTAV é uma instituição pública classificada dentro dos principais Centros Nacionais de Pesquisa e Instituições de Educação de Pós-Graduação mexicanos e, por meio da ABACUS e do LANCAD, um provedor principal de recursos de HPC para as comunidades científicas e tecnológicas do México. O CINVESTAV possui um histórico de destaque em iniciativas para fomentar a interação entre academia, governo, indústria e sociedade, em conjunto, com uma trajetória de muito sucesso de colaboração mundial. ABACUS abriga um dos principais supercomputadores de pesquisa da América Latina, colocado em 255º na lista TOP500 de julho de 2015, com desempenho total atualizado de ~ 0,5 petaflops e capacidade de armazenamento de 1 petabyte.

Figura. PIB e investimento em supercomputação nos países do BRICS (fontes: Banco Mundial, lista TOP500).

Desde 2016, a ABACUS tem apoiado esforços científicos para resolver problemas complexos por meio do trabalho colaborativo entre diferentes comunidades de pesquisa espalhadas por todo o México. A ABACUS já assessorou mais de 140 projetos de pesquisa e mais de 250 artigos acadêmicos. Exemplos de projetos são: simulação numérica de malformações vasculares no cérebro; estudos de racemização de hélices moleculares; simulação numérica de riscos ambientais; 6 simulações e aplicações de pilha de areia; 5 cobrindo matrizes e teste de software; algoritmos criptográficos; simulação de processos subatômicos; simulação de fenômenos astrofísicos; 4 e o Projeto ENERXICO: Supercomputação e Energia para o México (ver https://enerxico-project.eu) Alguns projetos têm impacto direto no cotidiano e na indústria, como por exemplo, a simulação numérica da dispersão de cinzas vulcânicas próximas a importantes aeroportos do país e sistemas de alerta antecipado de enchentes costeiras.

No Uruguai, o Centro Nacional de Supercomputação (Cluster-UY) é uma iniciativa para operar uma infraestrutura de HPC científica colaborativa para fomentar projetos de pesquisa e inovação com alta demanda computacional. A plataforma e os serviços fornecidos pelo Cluster-UY estão disponíveis para todos os esforços de pesquisa e desenvolvimento de instituições científicas, academia e empresas públicas / privadas. Instituições importantes apóiam a iniciativa, conforme descrito na Figura 3 .

Figura 3. Instituições que apóiam o Cluster-UY, Uruguai.

O Cluster-UY aplica um modelo colaborativo autogestionário e autofinanciado baseado em convênios de trabalho e suporte, firmados com instituições, organizações e empresas, para garantir a sustentabilidade. As parcerias permitem consolidar o modelo colaborativo e são muito valiosas para abrir o Centro a uma ampla variedade de usuários, com ênfase especial na promoção do desenvolvimento inclusivo em áreas de impacto social (saúde, educação, pesquisa para o desenvolvimento, etc.), no âmbito do “ Modelo de Universidade de Desenvolvimento “. A abordagem incentiva e consolida um modelo de dados aberto, intimamente ligado ao ideal de sistemas colaborativos. Além disso, um modelo igualitário é aplicado para o acesso aos serviços prestados. Os mesmos benefícios são oferecidos a todos os usuários. Por sua vez, todos os usuários têm as mesmas responsabilidades quanto à correta utilização, manutenção e atualização da plataforma e dos serviços.

O Cluster-UY apoiou mais de 50 projetos de pesquisa que usaram mais de 11 milhões de horas, produziram mais de 250 artigos e apoiou 100 teses de pós-graduação desde 2018. Projetos relevantes foram desenvolvidos usando os recursos de computação do Cluster-UY, incluindo: o desenvolvimento de ferramentas de previsão para gestão de energias renováveis ​​no Uruguai (Energia); 10 análise socioeconômica dos preços de curto e longo prazo e do impacto no bem-estar dos cidadãos de baixa renda (Economia / Ciências Sociais); banco de dados gratuito e disponível ao público de simulações biomoleculares de proteínas SARS-CoV2 (Bioinformática, Institut Pasteur Montevideo & Cluster-UY); 8e análise do despejo da refinaria de petróleo La Teja na Baía de Montevidéu (Meio Ambiente / Hidráulica do Mar / Qualidade da Água), entre outros. Esses projetos têm representado contribuições significativas para as linhas de pesquisa mencionadas no Uruguai.

As descrições acima mencionadas demonstram que diferentes abordagens foram aplicadas para desenvolver e operar instalações de HPC no Brasil, México e Uruguai.

No Brasil, a extensão territorial e o modelo político federativo geraram diversas iniciativas de fomento à HPC no país. Dentre eles, o mais destacado foi o SINAPAD. Concebido inicialmente como uma rede de centros de HPC com capacidade semelhante, o SINAPAD gradualmente mudou para um modelo em camadas, sendo o supercomputador Santos Dumont seu Tier-0.

O México promoveu diferentes infraestruturas públicas de HPC de acordo com pesquisas regionais específicas e necessidades tecnológicas. Como consequência, pelo menos 10 centros de HPC estão alojados em universidades estaduais, centros de pesquisa federais e centros do Conselho Nacional de Ciência e Tecnologia (CONACYT), entre eles quatro com capacidade computacional semelhante à do ABACUS. Todos esses centros são membros da Rede Mexicana em HPC, que oferece recursos coordenados de HPC e treinamento para diversas comunidades do país.

Finalmente, no Uruguai, um modelo colaborativo foi aplicado. Os benefícios deste modelo são duplos: por um lado, permite implementar um modelo igualitário de acesso aos serviços prestados e incorporar os utilizadores (cientistas, parceiros, empresas) como verdadeiros proprietários do Centro; por outro lado, fornece uma maneira de obter os fundos tão necessários para operação, manutenção e crescimento em países pequenos, onde os fundos para pesquisa são escassos. Este modelo pode ser replicado em outros pequenos países da América Latina.

Rede de Apoio às Atividades de Supercomputação

O networking também é um componente crucial dos esforços colaborativos para construir um ecossistema para a ciência na América Latina, em particular para compartilhar infraestruturas de HPC entre seus países. RedCLARA é uma organização latino-americana criada e liderada por Redes Nacionais de Pesquisa e Educação (NRENs), com o objetivo principal de fortalecer o desenvolvimento da ciência, educação, cultura e inovação na região por meio do uso inovador de redes avançadas (ver Figura 4) Criada em 2003, RedCLARA liderou, operou, manteve e desenvolveu diversos projetos de infraestrutura de apoio à pesquisa e educação (ALICE, ALICE 2, Programa Bella), o que permitiu a criação de uma rede avançada de banda larga, interconectando RNIEs latino-americanas e com RNIEs no mundo todo. A RedCLARA também apoiou outros projetos (ComGridLatAm, RISC, RICAP) para a criação de um ecossistema continental de acordo com o Sistema Informático Avançado para a América Latina e Caribe (SCALAC), uma associação civil sem fins lucrativos que, desde junho de 2020, reúne nove países da região.

Figura 4. Conexões da RedCLARA.

Com relação à conectividade, a situação atual da América Latina é que o anel principal da rede RedCLARA (em laranja na Figura 4 ), conectando Brasil, Chile e Panamá com os Estados Unidos, tem largura de banda de 100 Gbps e links de 500 Mbps a 20 Gbps se conectam os outros países latino-americanos com o anel principal. Por sua vez, a conexão com a Europa (via França e Reino Unido) é superior a 10 Gbps, semelhante à conexão com os EUA do México.

Colaborações de pesquisa internacionais

A América Latina tem uma longa tradição de colaborações internacionais em áreas relacionadas a e-Infraestruturas para a ciência, incluindo computação em grade, computação em nuvem e HPC. Devido aos laços culturais entre a América Latina e a Europa, grande parte dessas colaborações envolveu países dessas duas regiões. Destaca-se a seqüência de projetos EELA, EELA-2 e GISELA, parcialmente financiados pela Comissão Europeia (CE), cujos objetivos eram implantar e consolidar infraestruturas de grid computing presentes em quase todos os países latino-americanos, e conectá-las a iniciativas europeias semelhantes . Recentemente, uma iniciativa diferente do projeto RICAP teve como objetivo integrar e-Infraestruturas latino-americanas (HPC e nuvens federadas) em uma rede sustentável. O projeto RICAP coordena suas atividades com SCALAC, concordar em implantar chamadas de HPC para acessar recursos de computação via RedCLARA como um de seus serviços temáticos. Tal iniciativa foi exercida durante a pandemia COVID-19, quando o SINAPAD e o SCALAC juntos disponibilizaram aos pesquisadores o acesso priorizado aos recursos de HPC e IA para projetos relacionados à pandemia.

Em nível nacional, o Brasil tem participado de colaborações internacionais em e-Infraestrutura com os países do BRICS, Estados Unidos e Europa. Com este último, em particular, o Brasil co-financiou projetos de e-Infraestrutura realizados por grandes consórcios envolvendo centros de pesquisa e empresas privadas, com o MCTI financiando os parceiros brasileiros, enquanto a CE financiou os europeus. Na área de computação em nuvem para a ciência, o projeto EUBrazil Cloud Connect envolveu 12 parceiros para produzir tecnologia para federação de infraestruturas em nuvem heterogêneas no Brasil e na Europa, seguidos de outros nesta área (EUBra-BIGSEA, SecureCloud e ATMOSPHERE). Na área de HPC para a ciência, o projeto HPC4e reuniu 13 parceiros no Brasil e na Europa,

O México tem se envolvido com colaborações internacionais de computação avançada por meio de vários projetos, por exemplo, no Large Hadron Collider (CERN), no HAWC Gamma Ray Observatory (México) e no Observatório Pierre Auger (Argentina). Recentemente, o projeto ENERXICO se baseia na experiência de um consórcio de 15 instituições distribuídas entre o México e a Europa para fornecer novas soluções de energia inovadoras, desde simulações de turbinas eólicas para melhorar a eficiência de parques eólicos e tornar a energia eólica mais competitiva, até exploração geofísica e petróleo modelagem de reservatórios, para processos termodinâmicos e fluidodinâmicos de combustão de biocombustíveis para transporte. Parceiros mexicanos estão desenvolvendo códigos de aplicação prontos para exascale, entre eles, o primeiro código baseado em hidrodinâmica de partículas suavizadas que já foi elaborado para a simulação numérica de reservatórios de petróleo. Além disso, para reduzir as incertezas,

Várias colaborações internacionais, incluindo parceiros uruguaios, foram desenvolvidas no Centro Nacional de Supercomputação. Alguns projetos recentes relevantes são: “Geofísica e detecção de raios cósmicos usando Telescópio Espacial Hubble (HST)” (Telescópio Espacial Nacional, EUA), para explorar imagens escuras do HST para detector de raios cósmicos para analisar o campo magnético externo da Terra, aplicando HPC e computação em nuvem , para complementar as medições de 93 observatórios geofísicos; Projetos de eficiência energética com parceiros da AL / UE, variando de aprendizado de máquina para análise de dados ao projeto de novas tecnologias para fontes de energia renováveis; “Planejamento de transporte urbano em cidades inteligentes” (AL / UE, México / Cuba / Espanha / França), estudo e implementação de metodologias de planejamento de mobilidade em cidades modernas, aplicação de inteligência computacional e processamento confiável / seguro de grandes volumes de dados, para auxiliar usuários e autoridades na tomada de decisões de mobilidade (coleta de dados, identificação de padrões de mobilidade, planejamento de rotas / frequências, mobilidade sustentável, sincronização de semáforos); e a já comentada iniciativa SYRAH-COVID para a construção de um banco de dados gratuito de simulações biomoleculares de proteínas SARS-CoV2.

O caminho a seguir

A situação atual do HPC na América Latina é muito promissora para o desenvolvimento de novas iniciativas e o fortalecimento das já existentes para um maior crescimento da ciência e da educação.

Em termos de infraestrutura, a região conta com diversas plataformas e centros que não só fornecem capacidade computacional, mas também serviços de nova geração para o desenvolvimento de complexos projetos de pesquisa. Muitas das plataformas existentes suportam algum grau de interconexão com outras semelhantes no continente, ou mesmo com plataformas maiores na Europa e nos Estados Unidos. Esses sistemas são focados em esforços de pesquisa de alto impacto, especialmente aqueles relacionados com a atual situação social e econômica do países desta região. Também se espera que até o final do ano de 2021, a conectividade será significativamente melhorada com a instalação de um novo cabo submarino conectando a Europa diretamente à América Latina a 2Tb / s. Isso promoverá a colaboração e permitirá o desenvolvimento de novos recursos e o acesso de NRENs a recursos HPC adicionais,

Estes são tempos empolgantes para o desenvolvimento de HPC, com recursos computacionais exascale na virada da esquina. Há uma convergência em andamento; reunindo HPC e AI, juntamente com a análise de dados (DA), no que pode se tornar o perfil de um único sistema integrado. O que está manifesto nos últimos anos é que está se tornando difícil alcançar objetivos específicos de pesquisa e tecnologia sem a interação entre essas três tecnologias. Alinhado a essa tendência, o LNCC e os membros da Rede Mexicana de HPC, incluindo o CINVESTAV, expandiram recentemente suas infraestruturas para fornecer melhor suporte para pesquisas orientadas para IA.

Todo o avanço nesses novos sistemas integrados chegará à sociedade por meio de sistemas menores que incorporarão inovações de referência desenvolvidas no caminho para a era exascale e permitirão que os pesquisadores se beneficiem coletivamente dessas novas tecnologias. Os centros públicos e privados latino-americanos de pesquisa e tecnologia certamente usarão esses novos sistemas para resolver simulações numéricas de HPC altamente exigentes de problemas complexos, executando aplicações inovadoras de IA e enfrentando desafios intrincados de DA. Os exemplos incluem aqueles que envolvem imagens médicas, análise genômica, astrofísica, modelos climáticos, cidades inteligentes e agricultura digital, para mencionar alguns. Além disso,

Este trabalho não seria possível sem a ajuda de Artur Ziviani, Augusto Gadelha, Francisco Brasileiro, Pablo Blanco, José Maria Cela, Jaime Klapp, Leonardo Sigalotti, Salma Jalife, Rafael Mayo e das diretorias da RedCLARA e do SCALAC. Mapa da Figura 1 adaptado do trabalho original de Felipe Menegaz sob a licença I CC-BY-SA-3.0.

Agradecimentos

Leave a Reply