Datasets para o relatório

Com base no sorteio realizado, baixe o dataset abaixo que você ficou responsável:

COI de guano

Dataset1
Dataset2
Dataset3
Dataset4
(Metadados)

ITS de solo

Questões para o relatório:

Rode o pimba_prepare, coloque o comando usado e responda as perguntas abaixo com relação ao tratamento de dados dos dados:

1) Escolha duas amostras do seu dataset e responda:

a) Rode o FastQC e compare o gráfico de qualidade das reads antes do tratamento de dados e depois. Quais as principais diferenças? Qual valor PHRED foi escolhido para rodar o pimba_prepare? (3pts)

b) Quantas reads (sequências) existiam nas amostras antes e depois do tratamento de qualidades? (3pts)

c) rode o pimba_prepare novamente escolhendo um valor mais alto ou mais baixo de qualidade PHRED. Quais diferenças você percebe com o antes e depois, e com relação ao valor anterior PHRED? (3pts)

d) Quantas sequências ficaram no resultado final (AllSamples.fasta) do pimba_prepare? (1pt)

Rode o pimba_run, coloque o comando usado e responda as perguntas abaixo com relação à clusterização e obtenção das OTUS:

1) Quantas OTUS foram obtidas? (2pts)

2) Dessas OTUS, quantas tiveram alguma classificação taxonômica com base no banco de dados que você utilizou? (2pts)

3) Altere o parâmetro -l length pra um valor diferente e responda as questões 1 e 2 considerando esses novos resultados. (3pts)

4) Altere o parâmetro de similaridade -s e responda as questões 1 e 2 considerando esses novos resultados. (3pts)

Rode o pimba_plot, coloque o comando usado e responda as perguntas abaixo com relação à obtenção dos índices de diversidade:

1) Analisando a curva de rarefação obtida pra sua análise, você diria que quais amostras estão sendo bem representadas e quais amostras merecem ser mais sequenciadas.(3pts)

2) Analise o gráfico de PCoA que foi gerado. Informe quais amostras estão bem agrupadas e quais não parecem estar tão bem agrupadas. Qual explicação você daria pra tal comportamento? (3pts)

3) Analise a tabela de freqência de otus (otu_table.txt) gerada pra sua análise. Verifique se existe alguma OTU que aparece apenas uma vez em alguma amostra. Considerando essa amostra, calcule então sua estimativa de good considerando apenas o total de OTUs, e não o total de reads da amostra. Quanto maior o valor da estimativa, mais bem representada a amostra está. O que você diria sobre a amostra escolhida? (4pts)