suspected bug with cd_hit_produce_table_clstr.py : listing des séquences et non de la composition
Retour d'expérience projet de thèse Maria (lancement par Vincent début février).
dossier résultat : /work/project/plateforme/metaG/results/chick_individual_february/
les fichiers table_cluster_contigs.txt et table_clstr.txt (06_func_annot/06_1_clustering/
) contiennent autant de lignes que de séquences en input de cd-hit (04_structural_annot/*/*.ffn
) , comme si la clusterisation des gènes n'avait eu aucun effet, or le nombre de séquences dans les fichiers output fasta (06_func_annot/06_1_clustering/
) est inférieur au nombre de séquences intput.
Je n'ai pas accès aux fichier .fasta.clstr
qui servent d'input au script cd_hit_produce_table_clstr.py
, je ne peux donc fouiller plus.
a+