suspected bug with cd_hit_produce_table_clstr.py : listing des séquences et non de la composition

Retour d'expérience projet de thèse Maria (lancement par Vincent début février).

dossier résultat : /work/project/plateforme/metaG/results/chick_individual_february/

les fichiers table_cluster_contigs.txt et table_clstr.txt (06_func_annot/06_1_clustering/) contiennent autant de lignes que de séquences en input de cd-hit (04_structural_annot/*/*.ffn) , comme si la clusterisation des gènes n'avait eu aucun effet, or le nombre de séquences dans les fichiers output fasta (06_func_annot/06_1_clustering/) est inférieur au nombre de séquences intput.

Je n'ai pas accès aux fichier .fasta.clstr qui servent d'input au script cd_hit_produce_table_clstr.py, je ne peux donc fouiller plus.

Admin message

suspected bug with cd_hit_produce_table_clstr.py : listing des séquences et non de la composition