Projeto 1000 Genomas Vegetais



Todo o conhecimento que os humanos acumularam ao longo dos séculos sobre Projeto 1000 Genomas Vegetais está agora disponível na Internet, e compilámo-lo e organizámo-lo para si da forma mais acessível possível. Queremos que possa aceder a tudo sobre Projeto 1000 Genomas Vegetais que queira saber de forma rápida e eficiente; que a sua experiência seja agradável e que sinta que encontrou realmente a informação sobre Projeto 1000 Genomas Vegetais que procurava.

Para atingir os nossos objectivos, fizemos um esforço não só para obter a informação mais actualizada, compreensível e verdadeira sobre Projeto 1000 Genomas Vegetais, mas também nos certificámos de que o design, a legibilidade, a velocidade de carregamento e a usabilidade da página são tão agradáveis quanto possível, para que possa concentrar-se no essencial, conhecendo todos os dados e informações disponíveis sobre Projeto 1000 Genomas Vegetais, sem ter de se preocupar com mais nada, já tratámos disso para si. Esperamos ter alcançado o nosso objectivo e que tenha encontrado a informação que pretendia sobre Projeto 1000 Genomas Vegetais. Assim, damos-lhe as boas-vindas e encorajamo-lo a continuar a desfrutar da experiência de utilização de scientiapt.com .

Projeto 1000 Plant Genomes
Agência financiadora
Duração 2008 - 2019
Local na rede Internet www .onekp .com

A 1000 Plant Transcriptomes Initiative (1KP) foi um esforço de pesquisa internacional para estabelecer o catálogo mais detalhado de variação genética em plantas. Foi anunciado em 2008 e dirigido pelo Dr. Gane Ka-Shu Wong e pelo Dr. Michael Deyholos da Universidade de Alberta . O projeto sequenciou com sucesso os transcriptomas (genes expressos) de 1000 espécies de plantas diferentes até 2014; seus produtos finais foram publicados em 2019.

1KP foi um dos projetos de sequenciamento de grande escala (envolvendo muitos organismos) projetados para tirar vantagem da maior disponibilidade de tecnologias de sequenciamento de DNA de alto rendimento ("próxima geração") . O semelhante Projeto 1000 Genomes , por exemplo, obteve sequências de genoma de alta cobertura de 1000 pessoas entre 2008 e 2015, para entender melhor a variação genética humana . Este projeto fornece um modelo para outros projetos de genoma em escala planetária, incluindo o Projeto 10KP de sequenciamento de todos os genomas de 10.000 plantas e o Projeto BioGenome da Terra , com o objetivo de sequenciar, catalogar e caracterizar os genomas de toda a biodiversidade eucariótica da Terra .

Metas

Em 2002, o número de espécies de plantas verdes classificadas foi estimado em cerca de 370.000, no entanto, provavelmente existem muitos milhares mais ainda não classificadas. Apesar desse número, muito poucas dessas espécies têm informações detalhadas sobre a sequência de DNA até o momento; 125.426 espécies no GenBank , em 11 de abril de 2012, mas a maioria (> 95%) com sequência de DNA para apenas um ou dois genes. "... quase nenhuma das cerca de meio milhão de espécies de plantas conhecidas pela humanidade foi afetada pela genômica em qualquer nível". O projeto 1000 Plant Genomes teve como objetivo produzir um aumento de cerca de 100x no número de espécies de plantas com ampla sequência genômica disponível.

Relacionamentos evolutivos

Tem havido esforços para determinar as relações evolutivas entre as espécies de plantas conhecidas, mas filogenias (ou árvores filogenéticas) criadas apenas usando dados morfológicos, estruturas celulares, enzimas individuais ou apenas algumas sequências (como rRNA ) podem estar sujeitas a erros; características morfológicas são especialmente vulneráveis quando duas espécies parecem fisicamente semelhantes, embora não sejam intimamente relacionadas (como resultado da evolução convergente, por exemplo) ou homologia , ou quando duas espécies intimamente relacionadas parecem muito diferentes porque, por exemplo, são capazes de mudar em resposta ao seu ambiente muito bem. Essas situações são muito comuns no reino vegetal. Um método alternativo para construir relações evolutivas é por meio de mudanças na sequência de DNA de muitos genes entre as diferentes espécies, que muitas vezes é mais robusto para problemas de espécies de aparência semelhante. Com a quantidade de sequência genômica produzida por este projeto, muitos relacionamentos evolutivos previstos poderiam ser melhor testados pelo alinhamento de sequência para melhorar sua certeza. Com 383.679 filogenias de família de genes nucleares e 2.306 distribuições de idade de genes com gráficos Ks usados na análise final e compartilhados no GigaDB juntamente com o papel do capstone.

Aplicações de biotecnologia

A lista de genomas de plantas sequenciados no projeto não era aleatória; em vez disso, as plantas que produzem substâncias químicas valiosas ou outros produtos ( metabólitos secundários em muitos casos) foram focadas na esperança de que a caracterização dos genes envolvidos permitirá que os processos biossintéticos subjacentes sejam usados ou modificados. Por exemplo, há muitas plantas que produzem óleos (como azeitonas) e alguns dos óleos de certas plantas têm uma forte semelhança química com produtos de petróleo, como o dendê e espécies produtoras de hidrocarbonetos . Se esses mecanismos de planta pudessem ser usados para produzir grandes quantidades de óleo industrialmente útil, ou modificados de forma que o façam, eles seriam de grande valor. Aqui, conhecer a sequência de genes da planta envolvida na via metabólica de produção do óleo é um grande primeiro passo para permitir tal utilização. Um exemplo recente de como funciona a engenharia de vias bioquímicas naturais é o arroz dourado, que envolveu a modificação genética de sua via, de modo que um precursor da vitamina A é produzido em grandes quantidades, tornando o arroz de cor marrom uma solução potencial para a deficiência de vitamina A. Este é o conceito de plantas de engenharia para fazer "trabalho" é popular e seu potencial aumentaria dramaticamente como resultado da informação do gene sobre essas 1000 espécies de plantas. As vias biossintéticas também podem ser usadas para a produção em massa de compostos medicinais usando plantas em vez de reações químicas orgânicas manuais, já que a maioria é criada atualmente.

Um dos resultados mais inesperados do projeto foi a descoberta de múltiplos novos canais iônicos sensíveis à luz usados extensivamente para controle optogenético de neurônios descobertos por meio de sequenciamento e caracterização fisiológica de opsinas de mais de 100 espécies de espécies de algas pelo projeto. A caracterização dessas novas sequências de canalrodopsina fornecendo recursos para engenheiros de proteínas que normalmente não teriam interesse ou capacidade de gerar dados de sequência dessas muitas espécies de plantas. Várias empresas de biotecnologia estão desenvolvendo essas proteínas canal-rodopsina para fins médicos, com muitos desses candidatos à terapia optogenética em testes clínicos para restaurar a visão para cegueira retinal . Os primeiros resultados publicados deste tratamento de retinite pigmentosa saindo em julho de 2021.

Abordagem do projeto

O sequenciamento foi feito inicialmente na plataforma de sequenciamento de DNA de próxima geração Illumina Genome Analyzer GAII no Instituto de Genômica de Pequim (BGI Shenzhen, China), mas as amostras posteriores foram executadas na plataforma mais rápida Illumina HiSeq 2000 . Começando com as 28 máquinas de sequenciamento de DNA da próxima geração do Illumina Genome Analyzer , elas foram eventualmente atualizadas para 100 sequenciadores HiSeq 2000 no Instituto de Genômica de Pequim . A capacidade inicial de 3Gb / corrida (3 bilhões de pares de base por experimento) de cada uma dessas máquinas permitiu o sequenciamento rápido e preciso das amostras da planta.

Seleção de espécies

A seleção das espécies de plantas a serem sequenciadas foi compilada por meio de uma colaboração internacional de várias agências de financiamento e grupos de pesquisadores que expressaram seu interesse em certas plantas. Houve um foco nas espécies de plantas que são conhecidas por terem capacidade biossintética útil para facilitar os objetivos de biotecnologia do projeto, e seleção de outras espécies para preencher as lacunas e explicar algumas relações evolutivas desconhecidas da filogenia vegetal atual. Além da capacidade biossintética do composto industrial, espécies de plantas conhecidas ou suspeitas de produzirem produtos químicos medicamente ativos (como papoulas produtoras de opiáceos ) receberam alta prioridade para entender melhor o processo de síntese, explorar o potencial de produção comercial e descobrir novas opções farmacêuticas. Um grande número de espécies de plantas com propriedades medicinais foram selecionadas da medicina tradicional chinesa (TCM). A lista completa de espécies selecionadas pode ser visualizada publicamente no site, e detalhes metodológicos e detalhes de acesso aos dados foram publicados detalhadamente.

Transcriptoma vs. sequenciamento do genoma

Em vez de sequenciar todo o genoma (todas as sequências de DNA) das várias espécies de plantas, o projeto sequenciou apenas as regiões do genoma que produzem um produto proteico ( genes codificadores ); o transcriptoma . Esta abordagem é justificada pelo foco nas vias bioquímicas onde apenas os genes que produzem as proteínas envolvidas são necessários para entender o mecanismo sintético, e porque esses milhares de sequências representariam detalhes de sequência adequados para construir relações evolutivas muito robustas por meio da comparação de sequências. O número de genes codificadores em espécies de plantas pode variar consideravelmente, mas todos têm dezenas de milhares ou mais, tornando o transcriptoma uma grande coleção de informações. No entanto, a sequência não codificante constitui a maioria (> 90%) do conteúdo do genoma. Embora essa abordagem seja conceitualmente semelhante a marcadores de sequência expressa (ESTs), é fundamentalmente diferente, pois a sequência inteira de cada gene será adquirida com alta cobertura, em vez de apenas uma pequena porção da sequência do gene com um EST. Para distinguir os dois, o método não-EST é conhecido como sequenciamento do transcriptoma shotgun.

Sequenciamento de espingarda transcriptoma

O mRNA ( RNA mensageiro ) é coletado de uma amostra, convertido em cDNA por uma enzima transcriptase reversa e, em seguida, fragmentado para que possa ser sequenciado. Além do sequenciamento shotgun do transcriptoma , essa técnica foi chamada de sequenciamento shotgun de RNA-seq e transcriptoma completo (WTSS). Uma vez que os fragmentos de cDNA são sequenciados, eles serão montados de novo (sem se alinhar a uma sequência de genoma de referência ) de volta na sequência completa do gene, combinando todos os fragmentos desse gene durante a fase de análise de dados. Um novo assembler de transcriptoma de novo projetado especificamente para RNA-Seq foi produzido para este projeto, SOAPdenovo-Trans sendo parte do conjunto SOAP de ferramentas de montagem de genoma do BGI .

Amostragem de tecido vegetal

As amostras vieram de todo o mundo, com uma série de espécies particularmente raras sendo fornecidas por jardins botânicos, como o Jardim Botânico de Fairy Lake (Shenzhen, China). O tipo de tecido coletado foi determinado pela localização esperada da atividade biossintética; por exemplo, se se sabe que um processo ou produto químico interessante existe principalmente nas folhas, foi usada uma amostra de folha. Vários protocolos de sequenciamento de RNA foram adaptados e testados para diferentes tipos de tecido e foram compartilhados abertamente por meio da plataforma protocol.io.

Limitações potenciais

Como apenas o transcriptoma foi sequenciado, o projeto não revelou informações sobre a sequência regulatória do gene , RNAs não codificantes , elementos repetitivos do DNA ou outras características genômicas que não fazem parte da sequência codificadora. Com base nos poucos genomas de plantas inteiros coletados até agora, essas regiões não codificantes irão de fato constituir a maior parte do genoma, e o DNA não codificante pode realmente ser o principal condutor das diferenças de características vistas entre as espécies.

Uma vez que o mRNA foi o material de partida, a quantidade de representação de sequência para um determinado gene é baseada no nível de expressão (quantas moléculas de mRNA ele produz). Isso significa que genes altamente expressos obtêm melhor cobertura porque há mais sequência a partir da qual trabalhar. O resultado, então, é que alguns genes importantes podem não ter sido detectados de forma confiável pelo projeto se forem expressos em um nível baixo, mas ainda assim apresentarem funções bioquímicas importantes.

Muitas espécies de plantas (especialmente aquelas manipuladas para fins agrícolas) são conhecidas por terem sofrido grandes mudanças em todo o genoma por meio da duplicação de todo o genoma. Os genomas do arroz e do trigo, por exemplo, podem ter 4-6 cópias de genomas inteiros ( trigo ), enquanto os animais normalmente têm apenas 2 ( diploidia ). Esses genes duplicados podem representar um problema para a montagem de novo de fragmentos de sequência, porque sequências repetidas confundem os programas de computador ao tentar colocar os fragmentos juntos, e pode ser difícil rastreá-los ao longo da evolução.

Comparação com o Projeto 1000 Genomes

Semelhanças

Assim como o Instituto de Genômica de Pequim em Shenzhen, China, é um dos principais centros genômicos envolvidos no Projeto 1000 Genomes , o instituto é o local de sequenciamento do Projeto 1000 Genomas Vegetais. Ambos os projetos são esforços em grande escala para obter informações detalhadas da sequência de DNA para melhorar nossa compreensão dos organismos, e ambos os projetos utilizarão o sequenciamento de última geração para facilitar a conclusão em tempo hábil.

Diferenças

Os objetivos dos dois projetos são significativamente diferentes. Enquanto o Projeto 1000 Genomes se concentra na variação genética em uma única espécie, o Projeto 1000 Plant Genomes analisa as relações evolutivas e os genes de 1000 espécies de plantas diferentes.

Enquanto o Projeto 1000 Genomes foi estimado em até $ 50 milhões de dólares, o Projeto 1000 Plant Genomes não foi tão caro; a diferença de custo proveniente da sequência alvo nos genomas. Uma vez que o Projeto 1000 Genomas Vegetais sequenciou apenas o transcriptoma, enquanto o projeto humano sequenciou o máximo possível do genoma, há uma quantidade muito menor de esforço de sequenciamento necessário nesta abordagem mais específica. Embora isso signifique que houve menos produção geral de sequência em relação ao Projeto 1000 Genomes , as porções não codificantes dos genomas excluídas no Projeto 1000 Plant Genomes não eram tão importantes para seus objetivos como são para o projeto humano. Portanto, a abordagem mais focada do Projeto 1000 Plant Genomes minimizou os custos e, ao mesmo tempo, atingiu seus objetivos.

Financiamento

O projeto foi financiado pela Alberta Innovates - Technology Futures (fusão do iCORE [1] ), Genome Alberta , a Universidade de Alberta , o Beijing Genomics Institute (BGI) e a Musea Ventures (uma empresa de investimentos privada com sede nos EUA). Até o momento, o projeto recebeu CAD $ 1,5 milhão do governo de Alberta e outros $ 0,5 milhão da Musea Ventures. Em janeiro de 2010, o BGI anunciou que estaria contribuindo com US $ 100 milhões para projetos de sequenciamento em grande escala de plantas e animais (incluindo o Projeto 1000 Genomas de Plantas e, em seguida, o Projeto de Genoma de Plantas de 10.000).

Projetos relacionados

  • The 1000 Genomes Project - Um Catálogo Detalhado de Variação Genética Humana
  • The 1001 Genomes Project - Sequenciando todo o genoma de 1.001 cepas de Arabidopsis
  • Genoma 10K - Sequência completa do genoma de 10.000 espécies de vertebrados

Veja também

Referências

links externos

Opiniones de nuestros usuarios

Marta Pedroso

Gostei da página, e o artigo sobre Projeto 1000 Genomas Vegetais é o que eu estava procurando.

Eliana Cruz

Obrigado. O artigo sobre Projeto 1000 Genomas Vegetais me ajudou.

Marcelo Coutinho

Muito interessante este post sobre Projeto 1000 Genomas Vegetais.