BioCloud 2 (CNPq/AWS)

BioCloud 2: Explorando o DNA da Nuvem AWS na Execução Otimizada de Aplicações de Biotecnologia

Coordenadora: Maria Cristina Silva Boeres

É inegável a importância da bioinformática no mundo atual, como por exemplo, o conhecimento mundial necessário para combater a pandemia causada pelo vírus SARS-CoV-2. Para essa e outras doenças, os cientistas da área avançam suas pesquisas e descobertas utilizando algoritmos sofisticados de genômica comparativa, que exigem alto poder computacional e manipulam um volume imenso de dados. Vale ressaltar que nas três últimas décadas, houve uma grande evolução na tecnologia de sequenciamento de genomas, que permitiu a determinação de um número sem precedentes de sequências de DNA, RNA e proteínas. A grande maioria dessas sequências biológicas encontra-se em bases de dados públicas com a disponibilidade de mais do que 240 milhões de sequências. Ainda, na procura por compatibilidade de doadores de órgãos, a análise de registros de doadores de órgãos do Brasil é crucial devido à incompletude de grande parte dos registros armazenados em um banco público com mais de 5 milhões de registros.

Em face da dificuldade de manutenção de laboratórios com a infraestrutura de ponta para executar tais aplicações, o uso de nuvens computacionais vem de encontro com os requisitos de processamento e armazenamento da vasta quantidade de dados a um custo atrativo. Todavia, para utilizar o ambiente de nuvem tal que as aplicações sejam executadas em tempo hábil, de acordo com um certo custo, é imperativo saber selecionar recursos da nuvem, configurá-los, monitorá-los e oferecer formas de análise dos resultados das aplicações de bioinformática para auxiliar o próprio cientista.

Com o intuito de explorar as relações de custo e desempenho de aplicações de bioinformática na nuvem AWS este projeto vai concentrar esforços na especificação de metodologias de execução eficiente de aplicações, através de análise de desempenho, mecanismos de escalonamento, elasticidade de recursos e tolerância a falhas, visando uma melhor eficiência, robustez e minimização de custos monetários para os usuários. Do lado do cientista, usuário das aplicações, o objetivo é de facilitar o uso eficiente da nuvem para solucionar seus problemas, e do lado do provedor, o projeto vem a oferecer benefícios em termos de redução de custos e consumo de energia na utilização de sua infraestrutura computacional e seus serviços.


Equipe
Universidade Federal Fluminense (UFF)
Maria Cristina Silva Boeres    
Daniel Cardoso Moraes de Oliveira    
Eugene Francis Vinod Rebello    
Lúcia Maria de Assumpção Drummond    
Alan Lira Nunes    
Universidade de Brasília (UnB)
Alba Cristina Magalhães Alves de Melo    
Aletéia Patrícia Favacho de Araújo von Paumgartten    
Universidade do Estado do Rio de Janeiro (UERJ)
Fundação Oswaldo Cruz (Fiocruz)

Publicações