Dans chaque commande stacks on peut specifier un identifiant de base de donnee: option -b prŽsente dans cstacks sstacks populations et genotypes mais pas dans ustacks
A priori au moment de charger les donnŽes dans la base avec load_radtags.pl on lui specifie un identifiant de base et il va modifier tous les fichiers pour qu'ils correspondent ˆ cette identifiant.
A verifier donc si cela est utile de mettre -b ˆ l'ID du projet ou non.
Dans chaque commande stacks on peut specifier un identifiant de base de donnee: option -b pr�sente dans cstacks sstacks populations et genotypes mais pas dans ustacks
A priori au moment de charger les donn�es dans la base avec load_radtags.pl on lui specifie un identifiant de base et il va modifier tous les fichiers pour qu'ils correspondent � cette identifiant.
A verifier donc si cela est utile de mettre -b � l'ID du projet ou non.
# fichier de sequences sorties de sequenceurs.
Claire nous a indique que les fichiers brut sont splites en plusieurs morceaux pour pouvoir paralleliser ....
ajouter option "split" dans le composent splitbc.py qui va donc devoir se lancer autant de fois que de coupure avec le meme fichier de barcode,
puis faire un merge des fichiers correspondant au memes individus. Attention ˆ la gestion des duplicats! Normalement aucun probleme si
tous les individus ont des noms diffŽrents.
puis faire un merge des fichiers correspondant au memes individus. Attention � la gestion des duplicats! Normalement aucun probleme si
tous les individus ont des noms diff�rents.
# controle de la validifite du fichier de config
- verif que tous les names des individus sont differents.
...
...
@@ -20,23 +20,24 @@ ajouter option "split" dans le composent splitbc.py qui va donc devoir se lancer
Ibou : completer le fichier splitbc.py fichier de tests dans data
fichier init du workflow
on peut tester sur ubuntu avec le fichier de conf dans data.(données de test)
on peut tester sur ubuntu avec le fichier de conf dans data.(donn�es de test)
rmq : uniformiser dans workflow.properties les noms des parametres par rapport à touts les autres workflows => ibou voit avec jerome.
rmq : uniformiser dans workflow.properties les noms des parametres par rapport � touts les autres workflows => ibou voit avec jerome.
claire : process_radtags
maria : ustacks
ibou : cstacks ajouter un argument individu
donner un certain nombre d'indiv pour faire un catalogue de stacks : séparer l'analyse des familles ( individu des parents ex ) / analyse de population
donner un certain nombre d'indiv pour faire un catalogue de stacks : s�parer l'analyse des familles ( individu des parents ex ) / analyse de population
ajouter un argument pour les individus soit le type de population (sous-ensemble) soit pop1 soit F1! Il faut que ce soit un chiffre!!!!
du coup ce soit une liste d'identifiant d'individu à faire manuellement ou alors all ou identifiant de sous ensemble
commande : nb de mismatch entre les stacks des individu (par défaut 1)
du coup ce soit une liste d'identifiant d'individu � faire manuellement ou alors all ou identifiant de sous ensemble
commande : nb de mismatch entre les stacks des individu (par d�faut 1)
individu = nom d'individu + nom de flowcell
Option importante -b 1 => batch_1 pour pouvoir mettre dans une base de données.
-b project_id (cstacks - stacks - derniere étape)
\ No newline at end of file
Option importante -b 1 => batch_1 pour pouvoir mettre dans une base de donn�es.