pb dans la sortie peptides de MassChroQ (liée avec les point mutation?)
Salut Olivier, j'ai regardé les résultats de masschroq obtenus à partir des xml de 2016. Avec les 1015 msrun, j'obtiens grosso modo la même chose qu'avec les xml de 2020 => j'en déduis que Xtandem et XtandemPipeline ne sont pas en cause (le nb de peptides, protéines groupés sont les mêmes entre les 2 versions 2016 et 2020 des xml)
Avec les 1103 msrun, la sortie de masschroq est toute buggée: MCQR n'arrive pas à charger le résultat de masschroq car le nb de colonnes n'est pas le même à toutes les lignes. J'ai eu le message d'erreur suivant avec MCQR: Warning message:
In fread(pepFile, header = TRUE, sep = "\t", dec = ".", quote = "", :
Stopped early on line 8492674. Expected 18 fields but found 11. Consider fill=TRUE and comment.char=. First discarded non-empty line: <<q1 All msrunc641 20130607_ GDIPTYVVGVNADQYNPDEPIISNASCTTNCLAPFVK 3 [C 173 H 268 O 60 N 45 S 2] 27C:57.02 31C:57.02 34P:pmP=>G|[C 173 H 268 O 60 N 45 S 2] 20P:pmP=>G 27C:57.02 31C:57.02 2 1 0.239637807531>>
Effectivement, la ligne 8492674 est pourrie à cause de l'affichage des modifs. J'ai supprimé cette ligne du fichier peptide avec une commande sed en bash et jai rechargé dans mcqr. Encore un message d'erreur:
In fread(pepFile, header = TRUE, sep = "\t", dec = ".", quote = "", :
Stopped early on line 8492680. Expected 18 fields but found 21. Consider fill=TRUE and comment.char=. First discarded non-empty line: <<q1 All msrunc641 20130607_blein_amaizing_1_C08_836 1348.94993123 2730.83805765 25669042 484006218.689 2708.86845417 2770.92555155 pepa9c477 YLGPFSEQTPSYLTGEFPGDYGWDTAGLSADPETFAR 3 [C 185 H 257 O 61 N 42 S 0] 2 1 0.24399 11 0.286594135744>>In fread(pepFile, header = TRUE, sep = "\t", dec = ".", quote = "", :
là encore, la ligne 8492680 est pourrie: il y a trop de colonnes après la colonnes mods.
si tu veux aller voir les fichiers, c'est dans
/gorgone/pappso/moulon/users/Melisande/Amaizing/reinterro_v4_061120/avec_v2_ancienne_interro/masschroq/result_xtp2016_1103.d
J'ai renommé la sortie initiale de masschroq peptides_q1_All_original.tsv. Le fichier peptides_q1_All_original.tsv est celui que j'ai modifié avec sed. Il ne contient pas la ligne 8492674. Le fichier peptides_q1_All.tsvori est le backup de la fonction sed. 3:25 PM
D'après Thierry, ce n'est pas un problème lié à la fonction fread dans R.