Commit cc656886 authored by magali's avatar magali
Browse files

mise a jour avec test de l'effet cohorte

parent 8704381b
Pipeline #43975 passed with stage
in 4 minutes and 6 seconds
......@@ -28,7 +28,7 @@ always_allow_html: yes
---
```{r setup, include=FALSE}
knitr::opts_chunk$set(eval=FALSE, echo = TRUE, #echo=TRUE pour afficher le code dans rapport
knitr::opts_chunk$set(eval=FALSE, echo = FALSE, #echo=TRUE pour afficher le code dans rapport
cache = FALSE, message = FALSE,
warning = FALSE, cache.lazy = FALSE,
fig.height = 5, fig.width = 10.5)
......@@ -132,6 +132,39 @@ table(get_variable(frogs.data, "Statut"))
```{r variable-3, eval = TRUE, echo=TRUE}
table(get_variable(frogs.data, "Cohorte"))
```
## Vérification de l'effet cohorte
Est-ce que cohorte et groupe sont très corrélés ou non ?
<div class="alert alert-warning" role="alert">Il faut savoir si la cohorte est une variable de confusion potentielle ou non et donc il faut calculer un tableau de contingence croisé Cohorte / Group_bis et faire un test de Khi-2 et test de Fisher sur ce tableau.</div>
```{r test-correlation, eval = TRUE, echo=TRUE}
correlation <- table(get_variable(frogs.data, "Group_bis"), get_variable(frogs.data, "Cohorte"))
correlation
chisq.test(table(get_variable(frogs.data, "Group_bis"), get_variable(frogs.data, "Cohorte")))
fisher.test(table(get_variable(frogs.data, "Group_bis"), get_variable(frogs.data, "Cohorte")))
```
<div class="alert alert-warning" role="alert">Pour les 2 tests, la pvalue = 0.6 donc le résultat est non significatif, donc il n'y a pas de lien fort entre l'effet cohorte et l'effet groupe.
Je peux donc réaliser un pool des 2 cohortes pour l'analyse</div>
```{bash}
Ce qu'il faudrait calculer en plus pour savoir si la cohorte est une variable de confusion potentielle c'est un tableau de contingence croisé Cohorte / Group_bis par exemple avec
table(get_variable(frogs.data, "Group_bis"), get_variable(frogs.data, "Cohorte"))
pour voir à quel point les deux quantités sont corrélés (ou au contraire indépendantes) et donc à quel point l'effet cohorte peut polluer ton effet groupe.
Dans un monde idéal, les échantillons sont équirépartis entre cohorte et groupe (autant de cohorte 1 que de cohorte 2 dans chaque groupe). L'effet cohorte est source de variabilité et induit du bruit mais ne change pas l'estimation de l'effet groupe.
Dans un monde pourri, certains groupes sont intégralement attribués à la cohorte 1 et d'autres intégralement à la cohorte 2. Dans ce monde, il est impossible d'estimer l'effet groupe indépendamment de l'effet cohorte (il lui est subordonné).
```
## Visualisation de l'abondance par échantillon {.tabset}
......@@ -1032,19 +1065,34 @@ plot(p)
```
<div class="alert alert-info" role="alert">Pour confirmer l'effet du régime sur les distances, on va faire une permanova.
Analyse multivariée de la variance par permutations basée sur les matrices de distances</div>
Adonis sur la matrice Bray Curtis
<div class="alert alert-warning" role="alert">Test pour vérifier l'effet cohorte
Réponse Mahendra: Le plus simple consiste à pooler toutes tes données et à faire par exemple une PERMANOVA sur l'effet cohorte pour vérifier s'il est significatif et correspond à une valeur élevée de R2. Si oui, ce serait l'effet à mettre en premier dans ton modèle de PERMANOVA, puisque la procédure teste les effets séquentiellement</div>
</div>
```{bash}
Réponse Mahendra: Le plus simple consiste à pooler toutes tes données et à faire par exemple une PERMANOVA sur l'effet cohorte pour vérifier s'il est significatif et correspond à une valeur élevée de R2. Si oui, ce serait l'effet à mettre en premier dans ton modèle de PERMANOVA, puisque la procédure teste les effets séquentiellement
> Donc vu ces 2 résultats, c'est impossible de faire un pool ???
Pas exactement, ça veut dire que l'effet cohorte existe mais est finalement assez faible par rapport à la variance observée. C'est plutôt positif, ça veut dire que les deux cohortes sont certes systématiquement différentes mais que les différences sont très faibles par rapport à la variabilité induite par les groupes (dans ton exemple) et qu'il n'est donc pas absolument nécessaire de travailler par cohorte. Si le R2 de la cohorte avait été du même ordre de grandeur que celui du groupe, le problème aurait été différent.
Encore une fois, ce qui va vraiment compter c'est ton design: est-ce que cohorte et groupe sont très corrélés ou non?
```{r 34-adonis-bc-1, eval=TRUE}
adonis(dist.bc ~ Cohorte ,data = as(sample_data(frogs.data.rare), 'data.frame'))
Il faut surtout travailler cohorte par cohorte si:
- ton effet cohorte est confondu avec l'effet qui t'intéresse (par exemple l'effet groupe)
ou si
- ton effet cohorte est "très fort" par rapport à l'effet qui t'intéresse (du même ordre de grandeur) et risque de masquer avec l'effet qui t'intéresse (par exemple ici l'effet groupe) par la structure qu'il induit.
```
```{r 35-adonis-bc-1, eval=TRUE}
adonis(dist.bc ~ Cohorte + Group_bis ,data = as(sample_data(frogs.data.rare), 'data.frame'))
```
Df: degree of freedom.
Sums Of Sqs: sum of squares.
MeanSqs: sum of squares by degree of freedom.
......@@ -1052,17 +1100,20 @@ F: F statistics.
R2: partial R-squared.
Pr(>F) p-value based
<div class="alert alert-warning" role="alert">La pval sur l'effet cohorte est de 0,002 donc les 2 cohortes sont significativement différentes.
<div class="alert alert-warning" role="alert">La pval sur l'effet cohorte est de 0,001 donc les 2 cohortes sont significativement différentes.
Le R2 sur l'effet cohorte est très petit 0,02229 ce qui signifie qu'il y a moins de 3% de la variance qui est expliquée par l'effet cohorte donc beaucoup trop de variation inexpliqué.
Le modèle explique moins de 3 % des données.
</div>
Le R2 sur l'effet group est de 0.32, il est plus élevé que celui de l'effet cohorte.
```{r 35-adonis-bc-1, eval=TRUE}
adonis(dist.bc ~ Cohorte + Group_bis ,data = as(sample_data(frogs.data.rare), 'data.frame'))
```
Ces résultats montre que l'effet cohorte existe mais est finalement assez faible par rapport à la variance observée.
Cela veut dire que les deux cohortes sont certes systématiquement différentes mais que les différences sont très faibles par rapport à la variabilité induite par les groupes.
Ce résultat confirme les résultats des tests Khi-2 et Fisher, nous pouvons pooler les cohortes.</div>
```{r 26-network bray,fig.width=10,fig.height=10, eval=TRUE}
......
Markdown is supported
0% or .
You are about to add 0 people to the discussion. Proceed with caution.
Finish editing this message first!
Please register or to comment