suggestion pour améliorer le temps de calcul de eggnog
J'ai réutilisé l'env singularity, la commande et la database eggnog que lors d'une analyse faite avec le pipeline metagWGS mais sur un fichier de 13,5M de gènes divisé en 14 paquets (donc presque 1M par paquet) .
Il s'avère que tous mes jobs plantaient car ils accédaient tous à la même base de données en même temps.
J'ai donc ajouter l'option --dbmem pour que la base soit chargée en mémoire.
Non seulement mes jobs sont passés mais en plus ils se sont terminés en 45 min (41G de RAM) au lieu de >2h (? 2 jobs ne sont toujours pas terminés après 3h30) (12G de RAM) sur 40 CPU.
Il me semble que la conso mémoire est raisonnable compte tenu du gain de temps de calcul. Une idée à peut être mettre en place dans metagWGS. (attention l'option a changé dans les futures versions de eggnog en --servermode et --usemem, à valider)