... | @@ -610,4 +610,55 @@ module load bioinfo/KronaTools-2.7 |
... | @@ -610,4 +610,55 @@ module load bioinfo/KronaTools-2.7 |
|
ktImportText -o SampleWithoutHuman_kaiju_greedy_e5_without_unassigned.out.krona.html SampleWithoutHuman_kaiju_greedy_e5_without_unassigned.out.krona
|
|
ktImportText -o SampleWithoutHuman_kaiju_greedy_e5_without_unassigned.out.krona.html SampleWithoutHuman_kaiju_greedy_e5_without_unassigned.out.krona
|
|
```
|
|
```
|
|
Lancement sur slurm :
|
|
Lancement sur slurm :
|
|
`sbatch script_krona_greedy_e5_without_unassigned.sh` |
|
`sbatch script_krona_greedy_e5_without_unassigned.sh`
|
|
\ No newline at end of file |
|
|
|
|
|
# Annotation du mobilome
|
|
|
|
|
|
|
|
## Annotation des gènes de phages
|
|
|
|
|
|
|
|
### Procédure de recherche des protéines virales
|
|
|
|
|
|
|
|
- Fichier de référence de 25,581 protéines virales de référence (25.281 models HMM) de Earth Virome database :
|
|
|
|
(obtenus ici : http://portal.nersc.gov/dna/microbial/prokpubs/EarthVirome_DP/)
|
|
|
|
Pas de mise à jour depuis l’année dernière.
|
|
|
|
|
|
|
|
#### Exemple de procédure de traitement de l’échantillon "PROKKA_Sample"
|
|
|
|
|
|
|
|
**1. Split du fichier des protéines annotées par Prokka**
|
|
|
|
|
|
|
|
```
|
|
|
|
mkdir seq-split-PROKKA_Sample
|
|
|
|
fastasplit --fasta PROKKA_Sample/Sample.faa --output ./seq-split-PROKKA_Sample --chunk 100
|
|
|
|
```
|
|
|
|
|
|
|
|
**2. Création et lancement du script array_hmmsearch.sh**
|
|
|
|
|
|
|
|
```
|
|
|
|
cat array_hmmsearch.sh
|
|
|
|
for f in `ls seq-split-PROKKA_Sample/*`
|
|
|
|
do
|
|
|
|
echo hmmsearch -E 1.0e-05 --tblout $f.out VIR_HMM/final_list.hmms.txt $f >> script_hmmsearch_Sample.sh
|
|
|
|
done
|
|
|
|
|
|
|
|
./array_hmmsearch.sh
|
|
|
|
```
|
|
|
|
|
|
|
|
**3. Lancement en parallèle de la recherche de prot virales**
|
|
|
|
|
|
|
|
`qarray -l h_vmem=40G -l mem=32G script_hmmsearch_Sample.sh`
|
|
|
|
|
|
|
|
**4. Stats sur les résultats**
|
|
|
|
|
|
|
|
`cat seq-split-PROKKA_Sample/*.out >> PROKKA_Sample_viral.out`
|
|
|
|
|
|
|
|
Nbre de domaines viraux trouvés
|
|
|
|
|
|
|
|
`cut -d "-" -f 1 PROKKA_Sample_viral.out| grep PGALNPFJ | wc -l`
|
|
|
|
|
|
|
|
25.007
|
|
|
|
|
|
|
|
Nombre de protéines non redondantes avec des domaines viraux
|
|
|
|
|
|
|
|
`cut -d "-" -f 1 PROKKA_Sample_viral.out| grep PGALNPFJ | sort | uniq | wc -l`
|
|
|
|
|
|
|
|
15.190 |
|
|
|
\ No newline at end of file |