V1.1 - Phase 1 (Preuve de concept de l'interface, mise en place des premiers écrans d'importation et d'analyse)
Milestone ID: 322
Status du projet : Actif
1. Contexte scientifique
Le projet ASTERICS (A Tool for the ExploRation and Integration of omiCS data) financé par la Région Occitanie, fédère les plateformes bioinformatique http://bioinfo.genotoul.fr/ et biostatistique https://perso.math.univ-toulouse.fr/biostat/ de Genotoul et a pour objectif de développer une solution logicielle d’analyse statistique et d’intégration interactive des données « omiques » permettant aux biologistes d’explorer et de combiner les données de leurs projets de manière intuitive et guidée.
2. Description de la demande
Le développement de l’outil sera basé sur le déploiement d’une interface web qui interagira avec des scripts R (développés par les ingénieur⋅e⋅s en statistique impliqué⋅e⋅s dans le projet) via Python (server Flask). R sera utilisé pour mettre en œuvre les analyses, avec Rserve. La mission de l’ingénieur d’études recruté en informatique (Nathan) consistera à développer l’interface web, sous la supervision des ingénieurs de la plateforme bioinformatique impliqués dans le projet.
3. Organisation
3.1 Planning
Phase 1a : 15/09/20-14/01/21 : Mise en place de l'architecture technique, et faire la preuve de concept avec les technologies choisie. Définition fine du cahier des charges. [terminée]
Phase 1b : 15/09/20-14/01/21 : Préparation des données test. [encore en cours] (retard mineur)
Phase 2a : 14/12/20-15/01/22 : Conception de l'interface (ergonomie et navigation). [en cours]
Phase 2b : 14/12/20-15/01/22 : Définition des workflows. [en cours]
Phase 3 : 14/03/21-14/05/22 : Implémentation. [en cours] (avance sur le planning)
Phase 4 : 14/01/22-14/09/22 : Tests complets.
Phase 5 : 14/07/22-14/09/22 : Mise en production.
3.2 Personnes
Responsable scientifique : Nathalie Vialaniex
Implémentation :
- Info web : Philippe Bardou, Jérôme Mariette, Céline Noirot, Nathan Goron (CDD 01/01/21-31/12/21),
- Stat: Yaa Adu Kesawah (CDD 01/01/21-30/06/21), Sébastien Déjean, Nathalie Vialaneix, Elise Maigné
Intervenant/Testeur : Hyphen stat, Christine Gaspin, Laurence Liaubet
Tests de l'interface, des fonctionnalités et revue de code : Tous
Revue de code et beta tests en fin de projet : Nathalie Vialaneix, Christine Gaspin, Laurence Liaubet
3.3 Ressources matériels
Deux machines virtuelles (dev et prod) sont nécessaires et seront fournis par la plateforme Bioinfo.
3.4 Ressources financières
Projet ASTERICS financé par la Région Occitanie.
4. Échéancier
-
14/01/21 : Déploiement de l'architecture de base et mise en place des principales règles de programmation [terminé]
-
14/01/21 : Préparation des deux jeux de données test. [terminé pour le premier (PORCINET), repoussé au 30/06/21 pour le second pour lequel une version simplifiée a été extraite]
-
15/01/22 : Conception de l'interface et définition complète des workflows. (Phase 2)
-
14/05/22 : Première version complète de l'interface. (Phase 2)
-
14/09/22 : Version finale de l'interface, testée et mise en production. (Phase 3)
5. Critères de validation
Validation par :
- tests individuels des fonctions R d'analyse (exemples fournis dans la documentation des fonctions) => Ces tests sont principalement réalisés sur les données
TCGA-toy
(version simplifiée du premier cas test et disponibles sur Genologin) [Tests de phase 1 OK] - tests globaux au travers des cas tests : production de la documentation d'un ou de deux cas tests pour l'utilisateur
6. Revue de projet et modifications du planning et des ressources
Veuillez compléter lors des points d'étapes important (au moins un point à mi-projet et un point en fin de projet).
6.1 Revue du 28 janvier 2021 (Fin de la phase 1)
Réalisations validées :
- mise en place de l'architecture de base de l'interface et premiers tests de fonctionnement
- synchronisation des environnements de travail des développeurs (notamment R et versions)
- définitions de standards de développement et de gestions des versions
- définitions de standards de formats pour les échanges R/serveur (JSON)
- définitions de standards de programmation et d'exemples pour les fonctions R et de standards de documentation pour les échanges stat / info
- mise en place des premiers workflows et d'une procédure d'échange sur les spécificités de ceux-ci
- définition de l'ergonomie globale de l'interface (grands menus)
- preuve de concept sur des premiers traitements : importation de données, analyses univariées
- préparation de deux jeux de données cas tests : un en version complète (PORCINET), un en version simplifiée (TCGA, version TCGA-Toy)
Retard sur :
- préparation de la version complète du cas test TCGA-Toy dont la date limite est repoussée à juin