... | ... | @@ -104,9 +104,24 @@ qsub -q smpq -l mem=24G,h_vmem=512G megahit.sh |
|
|
```
|
|
|
## 3/ Annotation prokka
|
|
|
|
|
|
** Annotation*
|
|
|
|
|
|
**Exemple pour un lot**
|
|
|
```
|
|
|
PATH/prokka --outdir PROKKA_Sammple --prefix Sample Sample_metaspades_scaffolds.fasta
|
|
|
PATH/prokka --outdir PROKKA_Sample --prefix Sample Sample_metaspades_scaffolds.fasta
|
|
|
```
|
|
|
**Renommage gènes et contigs**
|
|
|
|
|
|
Nous utilisons le script home-made suivant pour renommer les gènes et les contigs dans les fichiers .gff, .fna, .ffn et .faa en sortie de prokka :
|
|
|
|
|
|
[Script_renameVcn.py](docs/Script_renameVcn.py)
|
|
|
|
|
|
Pour le lancer et renommer le fichier .faa :
|
|
|
|
|
|
```
|
|
|
sed -e 's/>.*_/>Sample/' PROKKA_Sample/Sample.fna > Sample_renamed.fna
|
|
|
grep "^gnl" PROKKA_Sample/Sample.gff > Sample_only_gnl.gff
|
|
|
Script_renameVcn.py -f Sample_only_gnl.gff -faa PROKKA_Sample/Sample.faa -ffn PROKKA_Sample/Sample.ffn -p Sample -oGFF Sample_renamed.gff -oFAA Sample_renamed.faa -oFFN Sample_renamed.ffn
|
|
|
```
|
|
|
|
|
|
## 4/ CD-HIT individuels
|
... | ... | @@ -115,7 +130,7 @@ PATH/prokka --outdir PROKKA_Sammple --prefix Sample Sample_metaspades_scaffolds. |
|
|
|
|
|
Le clustering est fait sur les CDS en sortie de prokka pour éliminer les CDS redondantes (à 5% = même espèce)
|
|
|
```
|
|
|
cd-hit-est -c 0.95 -d 0 -i Sample.ffn -o Sample.faa.cd-hit-est.095
|
|
|
cd-hit-est -c 0.95 -d 0 -i Sample_renamed.ffn -o Sample.faa.cd-hit-est.095
|
|
|
```
|
|
|
|
|
|
**NB.** Clustering choisi à 95% sur les CDS en nucléotides.
|
... | ... | @@ -199,7 +214,10 @@ make release |
|
|
|
|
|
**Exemple pour featureCounts :**
|
|
|
```
|
|
|
featureCounts -s 1 -O -p -t exon -g gene_id -a sample1.gtf -o sample1.featureCount.count sample1.sort.bam
|
|
|
bwa index Sample_renamed.fna -p Sample_renamed.fna
|
|
|
bwa mem Sample_renamed.fna SampleWithoutHumanR1.fastq.gz SampleWithoutHumanR2.fastq.gz | samtools view -bS - | samtools sort - Sample.sort
|
|
|
samtools index Sample.sort.bam
|
|
|
featureCounts -s 1 -O -p -t gene -g ID -a Sample_renamed.gff -o Sample.featureCounts.count Sample.sort.bam &> Sample.featureCounts.output
|
|
|
```
|
|
|
## 8/ Synthèse des quantifications
|
|
|
|
... | ... | |