Commit 94d8e153 authored by Claire Kuchly's avatar Claire Kuchly
Browse files

reunion

parent fd98be50
Note:
# identifiant de base / projet
Dans chaque commande stacks on peut spŽcifier un identifiant de base de donnŽe: option -b prŽsente dans cstacks sstacks populations et genotypes mais pas dans ustacks
A priori au moment de charger les donnŽes dans la base avec load_radtags.pl on lui spŽcifie un identifiant de base et il va modifier tous les fichiers pour qu'ils correspondent ˆ cette identifiant.
A vŽrifier donc si cela est utile de mettre -b ˆ l'ID du projet ou non.
Dans chaque commande stacks on peut specifier un identifiant de base de donnee: option -b prŽsente dans cstacks sstacks populations et genotypes mais pas dans ustacks
A priori au moment de charger les donnŽes dans la base avec load_radtags.pl on lui specifie un identifiant de base et il va modifier tous les fichiers pour qu'ils correspondent ˆ cette identifiant.
A verifier donc si cela est utile de mettre -b ˆ l'ID du projet ou non.
# fichier de sŽquences sorties de sŽquenceurs.
Claire nous a indiquŽ que les fichiers brut sont splitŽs en plusieurs morceaux pour pouvoir parallliser ....
ajouter option "split" dans le composent splitbc.py qui va donc devoir se lancer autant de fois que de coupure avec le mme fichier de barcode,
puis faire un merge des fichiers correspondant au mmes individus. Attention ˆ la gestion des duplicats! Normalement aucun probleme si
# fichier de sequences sorties de sequenceurs.
Claire nous a indique que les fichiers brut sont splites en plusieurs morceaux pour pouvoir paralleliser ....
ajouter option "split" dans le composent splitbc.py qui va donc devoir se lancer autant de fois que de coupure avec le meme fichier de barcode,
puis faire un merge des fichiers correspondant au memes individus. Attention ˆ la gestion des duplicats! Normalement aucun probleme si
tous les individus ont des noms diffŽrents.
# controle de la validifitŽ du fichier de config
- vŽrif que tous les names des individus sont diffŽrents.
# controle de la validifite du fichier de config
- verif que tous les names des individus sont differents.
\ No newline at end of file
10/06/2014
Ibou : completer le fichier splitbc.py fichier de tests dans data
fichier init du workflow
on peut tester sur ubuntu avec le fichier de conf dans data.(données de test)
python2.7 bin/ng6_cli.py radseq @workflows/radseq/data/radseq.cfg --admin-login toto_le_malefique
rmq : uniformiser dans workflow.properties les noms des parametres par rapport à touts les autres workflows => ibou voit avec jerome.
claire : process_radtags
maria : ustacks
ibou : cstacks ajouter un argument individu
donner un certain nombre d'indiv pour faire un catalogue de stacks : séparer l'analyse des familles ( individu des parents ex ) / analyse de population
ajouter un argument pour les individus soit le type de population (sous-ensemble) soit pop1 soit F1! Il faut que ce soit un chiffre!!!!
du coup ce soit une liste d'identifiant d'individu à faire manuellement ou alors all ou identifiant de sous ensemble
commande : nb de mismatch entre les stacks des individu (par défaut 1)
individu = nom d'individu + nom de flowcell
Option importante -b 1 => batch_1 pour pouvoir mettre dans une base de données.
-b project_id (cstacks - stacks - derniere étape)
\ No newline at end of file
Supports Markdown
0% or .
You are about to add 0 people to the discussion. Proceed with caution.
Finish editing this message first!
Please register or to comment