Datasets para o relatório
Com base no sorteio realizado, baixe o dataset abaixo que você ficou responsável:
COI de guano
Dataset1
Dataset2
Dataset3
Dataset4
(Metadados)
ITS de solo
Dataset1
Dataset2
Dataset3
(Metadados)
Questões para o relatório:
Rode o pimba_prepare, coloque o comando usado e responda as perguntas abaixo com relação ao tratamento de dados dos dados:
1) Escolha duas amostras do seu dataset e responda:
a) Rode o FastQC e compare o gráfico de qualidade das reads antes do tratamento de dados e depois. Quais as principais diferenças? Qual valor PHRED foi escolhido para rodar o pimba_prepare? (3pts)
b) Quantas reads (sequências) existiam nas amostras antes e depois do tratamento de qualidades? (3pts)
c) rode o pimba_prepare novamente escolhendo um valor mais alto ou mais baixo de qualidade PHRED. Quais diferenças você percebe com o antes e depois, e com relação ao valor anterior PHRED? (3pts)
d) Quantas sequências ficaram no resultado final (AllSamples.fasta) do pimba_prepare? (1pt)
Rode o pimba_run, coloque o comando usado e responda as perguntas abaixo com relação à clusterização e obtenção das OTUS:
1) Quantas OTUS foram obtidas? (2pts)
2) Dessas OTUS, quantas tiveram alguma classificação taxonômica com base no banco de dados que você utilizou? (2pts)
3) Altere o parâmetro -l length pra um valor diferente e responda as questões 1 e 2 considerando esses novos resultados. (3pts)
4) Altere o parâmetro de similaridade -s e responda as questões 1 e 2 considerando esses novos resultados. (3pts)
Rode o pimba_plot, coloque o comando usado e responda as perguntas abaixo com relação à obtenção dos índices de diversidade:
1) Analisando a curva de rarefação obtida pra sua análise, você diria que quais amostras estão sendo bem representadas e quais amostras merecem ser mais sequenciadas.(3pts)
2) Analise o gráfico de PCoA que foi gerado. Informe quais amostras estão bem agrupadas e quais não parecem estar tão bem agrupadas. Qual explicação você daria pra tal comportamento? (3pts)
3) Analise a tabela de freqência de otus (otu_table.txt) gerada pra sua análise. Verifique se existe alguma OTU que aparece apenas uma vez em alguma amostra. Considerando essa amostra, calcule então sua estimativa de good considerando apenas o total de OTUs, e não o total de reads da amostra. Quanto maior o valor da estimativa, mais bem representada a amostra está. O que você diria sobre a amostra escolhida? (4pts)