V1.2 - Phase 2 (Conception de l'interface et définition des workflows)
Milestone ID: 341
Statut du projet : Actif
1. Contexte scientifique
Le projet ASTERICS (A Tool for the ExploRation and Integration of omiCS data) financé par la Région Occitanie, fédère les plateformes bioinformatique http://bioinfo.genotoul.fr/ et biostatistique https://perso.math.univ-toulouse.fr/biostat/ de Genotoul et a pour objectif de développer une solution logicielle d’analyse statistique et d’intégration interactive des données « omiques » permettant aux biologistes d’explorer et de combiner les données de leurs projets de manière intuitive et guidée.
2. Description de la demande
Le développement de l’outil est basé sur le déploiement d’une interface web qui interagira avec des scripts R (développés par les ingénieur⋅e⋅s en statistique impliqué⋅e⋅s dans le projet) via Python (server Flask). R est utilisé pour mettre en œuvre les analyses, avec Rserve. L'interface est développée par les ingénieur⋅e⋅s en bioinformatique impliqué.e.s dans le dossier. En outre, une graphiste web pilote l'amélioration de l'ergonomie de l'outil et est en charge de la mise en place d'images pour l'aide à la navigation et à l'interprétation (documentation).
3. Organisation
3.1 Planning
Phase 1a : 15/09/20-14/01/21 : Mise en place de l'architecture technique, et faire la preuve de concept avec les technologies choisie. Définition fine du cahier des charges. [Phase 1a - terminée]
Phase 1b : 15/09/20-14/01/21 : Préparation des données test. [Phase 1b - terminée]
Phase 2a : 14/12/20-15/01/22 : Conception de l'interface (ergonomie et navigation). [bien avancée (voir détails dans la section 6)]
Phase 2b : 14/12/20-15/01/22 : Définition des workflows. [finalisée (voir détails dans la section 6)]
Phase 3 : 14/03/21-14/05/22 : Implémentation. [bien avancée (voir détails dans la section 6)] (avance sur le planning)
Phase 4 : 14/01/22-14/09/22 : Tests complets. [débutés (voir détails dans la section 6)]
Phase 5 : 14/07/22-14/09/22 : Mise en production. [version de pré-production déployée (voir détails dans la section 6)] (avance sur le planning)
3.2 Personnes
Responsable scientifique : Nathalie Vialaneix
Implémentation :
- Informatique / web : Jérôme Mariette, Céline Noirot, Nathan Goron (CDD 01/01/21-31/12/21) (soutien d'Hyphen Stat)
- Statistique : Yaa Adu Kesawah (CDD 01/01/21-30/12/21), Nathalie Vialaneix, Élise Maigné, Fanny Mathevet (CDD 10/09/21-31/12/21), Julien Henry (CDD 01/11/21-31/09/22)
Ergonomie / aide utilisateur
- Statistique (cas d'études) : Sébastien Déjean, Valentine Rossi
- Statistique (aide utilisateur) : Sébastien Déjean
- Graphisme : Arielle Krebs
Intervenant/Testeur : Hyphen Stat, Christine Gaspin, Laurence Liaubet
Tests de l'interface, des fonctionnalités et revue de code : Tous
Revue de code et beta tests en cours et fin de projet : Nathalie Vialaneix, Christine Gaspin, Laurence Liaubet
3.3 Ressources matérielles
Deux machines virtuelles (dev et prod) sont nécessaires et seront fournies par la plateforme Bioinfo (les deux en fonctions au moment de cette revue de projet).
3.4 Ressources financières
Projet ASTERICS financé par la Région Occitanie.
4. Critères de validation
Validation :
- du code R par mise en place de tests unitaires systématiques, validés au moment de la fusion dans
dev
(réalisés sur les données "TCGA") - par des tests utilisateurs, hors développeurs, de l'interface (Laurence Liaubet, Christine Gaspin, ...)
- par le suivi des bugs et améliorations au travers d'issues validées et liées (si pertinent) aux commits de résolution
5. Suivi du projet
Les CR des réunions du projets sont disponible là : https://stratus.irstea.fr/lib/6c3d6d57-c485-4ffc-869f-56c7fa053f80/file/CR
6. Revue du 28 janvier 2022
Phase 2 bouclée (retard : 13 jours, négligeable). La période du 16 janvier 2021 au 28 janvier 2022 a été consacrée à :
-
Préparation des données test (rattrapage du retard sur la phase 1b) : terminée.
-
Phase 2a (prévue du 14/12/20-15/01/22) : conception de l'interface (ergonomie et navigation).
- l'organisation globale de l'application est finalisée
- les grands principes de la navigation sont validés
- les premiers travaux sur l'ergonomie sont en place
- le principe général du backend est validé
Les ressources humaines en développement backend se sont avérées difficiles à trouver (recrutement impossible d'un développeur web). Les développements sur cette partie-ci ne sont donc pas complètement terminés mais :
- nous avons embauché au 01/12/2021 une graphiste web (6 mois) qui vient soutenir les développeurs web sur les aspects graphismes et navigation : son travail est déjà partiellement implémenté dans l'interface
- en attendant la finalisation du travail de la graphiste web, nous avons déployé les compétences en informatique sur d'autres aspects qui devaient être abordés plus tard dans le projet (Phase 3, Phase 4, Phase 5)
En conclusion, l'avancement global de la Phase 2a est globalement satisfaisante au vu de l'avance prise dans les autres phases. Nous pensons que le retard pris est sans impact global sur le projet grâce à la redistribution des objectifs.
-
Phase 2b (prévue 14/12/20-15/01/22) : La définition des workflows statistiques est finalisée et ceux-ci sont majoritairement même déjà implémentés (en avance sur la Phase 3). Les workflows non encore implémentés ont également été priorisés pour les prochains mois.
-
Phase 3 (prévue 14/03/21-14/05/22) : Implémentation. Le principe général du backend est implémenté, ainsi que la plupart des workflows statistiques (implémentés côté R et intégrés côté logiciel). Les implémentations prioritaires à venir sont :
- édition des données (implémentée côté R, à intégrer côté interface)
- normalisation des données (en cours d'implémentation côté R)
- analyses différentielles en batch (en cours d'implémentation côté R)
- intégration des éléments de navigation et de documentation
L'avancement de la Phase 3 est tout à fait en ligne avec les objectifs initiaux.
-
Phase 4 (prévue 14/01/22-14/09/22) : Tests complets. Les tests complets ont été commencés dès l'été 2021 (très en avance sur le planning) et ont permis de consolider l'utilisation de l'interface. La Phase 4 est donc en avance sur le planning.
-
Phase 5 (prévue 14/07/22-14/09/22) : Mise en production. Une première image docker a été réalisée et déployée sur le serveur de production. Ce pré-déploiement devrait permettre de réaliser des tests à plus grande échelle.