Desenvolvimento e manutenção de um Núcleo de Referência em Bioinformática para dar suporte e treinamento a projetos, em especial na área de vacinas, desenvolvidos pelo PN-DST/AIDS – Fase I e II.

Edital/Chamamento: 
Estratégico
Número do Projeto: 
306/2004

Pesquisador(es)

Pesquisador(es) Responsável(eis): 
Luiz Carlos Junior Alcântara

Instituição

Instituição: 
Fundação Oswaldo Cruz; Centro de Pesquisas Gonçalo Moniz; Laboratório Avançado de Saúde Pública (Fiocruz/CPQGM/Lasp).
Parcerias institucionais: 
Fundação de Amparo à Pesquisa do Estado da Bahia (Fapesb); Centro de Pesquisas Gonçalo Moniz (CPqGM); Fundação Bahiana para o Desenvolvimento das Ciências (FBDC)/Escola Bahiana de Medicina e Saúde Pública (EBMSP).
Período de Vigência: 
2005-2006
Situação: 
Concluída

Introdução e Justificativa

A unidade de bioinformática do Lasp/CPqGM/Fiocruz foi instalada em 2004, contendo um servidor e 16 estações de trabalho com todos os programas necessários para a realização de pesquisa genética em HIV-1 e HTLV. Possui também um website contendo um banco de dados (separado por regiões gênicas) de todas as seqüências brasileiras do HIV-1 e do HTLV 1. Um banco de dados completo de seqüências de HIV-1 e HTLV está sendo desenvolvido utilizando a database HIVBaseTM. Todas as seqüências (novas e já publicadas no GenBank) estão sendo importadas, organizadas e analisadas, e novas informações (clínicas e epidemiológicas dos pacientes) estão sendo adicionadas. Estes resultados serão de grande utilidade para o desenvolvimento de vacinas/terapia do PN-DST/AIDS.

Objetivos

Capacitação da unidade de Bioinformática do Lasp/CPqGM/Fiocruz em um Núcleo de Referência em Bioinformática para dar suporte ao PN-DST/AIDS do Ministério da Saúde na criação de um repositório de seqüências genéticas do HIV-1, ministrar treinamento específico em bioinformática a outros pesquisadores da rede e transferir esta tecnologia para outros núcleos emergentes de bioinformática no Brasil; Reforçar a unidade de bioinformática do Lasp/CPQGM/Fiocruz, com a criação de um núcleo de referência em bioinformática para análise de organismos emergentes (HIV-1 e HTLV-1) no Brasil, em especial o HIV-1; Criar um repositório de seqüências genéticas do HIV-1 e do HTLV-1, coordenando e dando suporte aos estudos de monitoramento destas infecções, polimorfismo viral, infecção recente, resistência aos anti-retrovirais e transmissão materno fetal; Desenvolver treinamento específico em bioinformática, treinando pesquisadores brasileiros em análise genética e evolutiva de patógenos humanos, com ênfase no HIV-1 e HTLV-1; Transferir tecnologia para outros núcleos emergentes de bioinformática no Brasil, ampliando a vigilância do polimorfismo genotípico do HIV-1 no âmbito do PN-DST/AIDS, principalmente em relação ao desenvolvimento de vacinas e resistência anti-retroviral; Selecionar seqüências nucleotídicas do genoma do HIV-1 de interesse estratégico para o desenvolvimento de vacinas, investigar o polimorfismo genético do HIV-1, relacionando este com o fenótipo dos isolados e o perfil epidemiológico desses variantes na população; Elaborar um algoritmo de resgate terapêutico subsidiando a terapia anti-retroviral a ser estabelecida nos serviços clínicos associados.

Materiais e Método

O laboratório de bioinformática do Lasp/CPqGM/Fiocruz foi instalado entre o final de 2003 e início de 2004, contendo servidores e estações de trabalho com todos os programas necessários para a realização de pesquisa genética em HIV-1 e HTLV-I. A interface integrada para análise de seqüências do HIV-1 baseada no “GDE” foi instalada no servidor Linux, sendo acessada remotamente (via “network”) pelas estações de trabalho. A interface GDE contém programas de bioinformática necessários para edição, alinhamento e análises filogenéticas de seqüências retrovirais (de Oliveira et al., 2003). No website do laboratório há um banco de dados (separado por regiões gênicas) de seqüências brasileiras do HIV-1 e de seqüências do HTLV-1 provenientes de todo o mundo. Estes bancos de dados estão separados por nome do vírus, números de acessos, procedências, subtipos, referências bibliográficas, além dos respectivos alinhamentos e análises filogenéticas geradas no laboratório do LASP. Todas essas informações encontram-se disponíveis para download. O banco de dados completo de seqüências de HIV e HTLV será desenvolvido usando o programa HIVBase. Este programa permite ao usuário além de adicionar as seqüências ao banco de dados, complementar com informações epidemiológicas e clínicas dos pacientes. Como exemplo das informações que serão depositadas no banco de dados temos: informações sobre o paciente (idade, sexo, descendência), exames clínicos (carga viral e/ou pró­viral, contagem de CD4, doenças oportunistas, genotipagem), tratamento (droga utilizada, nível de resistência) e seqüências (região genética, subtipo, etc.). O banco de dados será desenvolvido junto ao PN-DST/AIDS e será adaptado para conter informações necessárias para o estudo de resistência e desenvolvimento de vacinas no nível nacional.

Resultados - Parciais ou Finais

Implantação do website do laboratório de bioinformática hospedando informações sobre treinamentos, aplicações dos programas e métodos de análises de seqüências do HIV-1 e HTLV-1, distribuídas nos bancos de dados de seqüências e ferramentas da bioinformática para análise filogenética viral. Para construir um local de capacitação de bioinformática foram realizados cinco workshops no início do ano de 2004. Foram analisados isolados de HTLV 1 brasileiros, previamente publicados no GenBank, sendo possível estimar a prevalência de subgrupos do Brasil. Para investigar a caracterização molecular do HTLV 1 no Brasil, também analisamos os sítios potenciais do gene env. A análise dos sítios de Nglycolisação demonstrou que em 100% das seqüências estão compreendidos entre os aa 404-407, quando estudamos a gp46, e em 63,6% das seqüências entre os aa 140-143, 222-225, 244-247 e 272-275, quando estudamos a gp21. Na análise dos sítios de Nmiristilação, encontramos dois domínios localizados entre os aa 327-338 e 391-396 em 100% das seqüências correspondentes a gp46, e outro domínio entre os aa 97-102 em 63% das seqüências correpondentes à gp21. Após análises dos sítios de fosforilação de CK2, encontramos somente dois sítios, em 63% das seqüências, entre os aa 103-106 e 194-197, ambos pertencentes à gp21. As análises dos sítios de fosforilação de PKC mostraram dois domínios entre os resíduos 310-312 e 342-344, em 100% das seqüências, pertencentes ao gp46, enquanto que outro foi identificado entre os aa 109-111, em 63% das seqüências, correspondentes à gp21. Sobre as análises de regiões ENV e GAG do HIV-1, também fizemos a análise filogenética das 216 seqüências do gene gag do HIV-1 (p17 e p24) selecionados do GenBank usando métodos e 187 seqüências do gene env (gp120 e gp41) também obtidos do GenBank, e subtipados em estudos anteriores. A prevalência do subtipo B foi de 83%, enquanto os subtipos F e C foram de 11% e 4%, respectivamente. Os subtipos A e D e recombinantes B/F apresentaram escores mínimos de 1% (A e D) e 0,98% (B/F). A análise de sítio potencial de todos os peptídeos p17 brasileiros, oriundos do GenBank, foi executada e encontramos o sítio de fosforilação da proteína kinase C entre os aa 111-113 em 72%, sítio de amidação entre os aa 24-27 em 30%, sítio de Nglicolisação entre os aa 109-110 em 88%, sítio de fosforilação da caseína kinase 2 entre os aa 70-73 em 89% e sítio de Nmiristilação entre aa 49-54 em 88% das seqüências. As análises do peptídeo p24 demonstraram as seguintes freqüências dos sítios potenciais: sítio de fosforilação da caseína kinase 2 em 98% entre aa 48-51, 95% entre aa 72-75, 66% entre aa 112-113 e 78% entre aa 149-152; o sítio de Nmiristilação entre aa 60-6599% e aa 101-111 em 78%; e o sítio da proteína kinase C entre aa 2-7 em 100% das seqüências. As análises dos sítios potenciais de peptídeos gp41 foram realizadas e mostraram 100% de sítio de Nmiristilaçãoe entre aa 1.095-1.100, 7,84% entre aa 1.058-1.059 e entre aa 1.061-1.064, 100% de sítios de Nglicolisação entre aa 112-1.115, 98% entre aa 1128-1129 e aa 1140-1142, e 5.88% entre aa 1163-1166. O sítio de fosforilação da proteína kinase C foi encontrado em 100% entre aa 1.101-1.102, e 0,98% entre aa 843-845, aa 986-988, aa 1.051-1.053 e aa 1.064-1.066. Finalmente, analisamos a freqüência dos sítios potenciais do peptídeo gp120: 77,10%, sítio de fosforilação da caseína kinase 2 entre aa 682-685, 14,45% entre aa 735-738, 21,68% entre aa 751-754 e 25,30% entre aa 757-760, 16,87% do sítio de Nmiristilação entre aa 653-658, 8,40% entre aa 724-729, 16,87% entre aa 737-742 e 10,84% entre aa 752-760. As freqüências dos sítios de Nglicolisação foram 71,10% entre aa 880-881, 91,56% entre aa 894-897, 68,67% entre aa 707-710, 85,54% entre aa 713-716, 93,97% entre aa 718-719, 97,60% entre aa 749-752 e 45,80% entre aa 758-757. A freqüência de sítio de fosforilação da proteína kinase C foi 93,97% entre aa 721-723, 13,25% entre aa 724-726 e 40,96% entre aa 758-760.
Palavras-Chave: 
HIV-1. Bioinformática. HTLV. Vacina.

Divulgação e/ou Publicações

ALCÂNTARA, L.C.Jr. et al. Mapping the genetic characteristics of the HIV-1 and HTLV-1 strains in Brazil with the development of the viral bioinformatics laboratory at Salvador, Bahia, Brazil. Health Informatics Journal. Submited.

__. Mapping the genetic characteristics of the HIV-1 strains in Brazil with the development of the viral bioinformatics laboratory at Salvador, Bahia, Brazil (oral presentation). In: OFICINA EM HIV/AIDS EM VACINAS E MICROBICIDAS DO PN-DST/AIDS PARA O “FLANDERS BI¬LATERAL COOPERATION”, 1., 2004, São Paulo.

__. The Brazilian Aids program data management and sequence analysis (oral presentation). In: HIV DATA MANAGEMENT AND DATA MINING FOR ANTI-RETROVIRAL DRUG RESISTENCE WORKSHOP, 2004, South African. Medical Research Concil (MRC), Durban.

MIRANDA, A.C.A.M.; ALCÂNTARA, L.C.J; GALVÃO-CASTRO, B. The Genetic Characteristics Study of the Brazilian HTLV 1 Isolates Suggests the pre and Post-Colombian Origin of the Virus in this Country. In: SIMPÓSIO INTERNACIONAL SOBRE HTLV NO BRASIL, 8., 2005, São Paulo. Trabalho Premiado como melhor trabalho em Epidemiologia e Saúde Coletiva.