Commit 633db2a5 authored by Isabelle Sanchez's avatar Isabelle Sanchez
Browse files

add SchemaTest.png pr 02_

parent cc8efc91
Pipeline #41803 failed with stage
in 22 seconds
......@@ -77,6 +77,7 @@ ggplot(res.pon, aes(.fitted, sqrt(abs(.stdresid)))) +
ylab(expression(sqrt("|Standardized residuals|"))) +
ggtitle("Scale-Location")+theme_bw()
```
Le problème d'hétérogénéité de la variance semble gommer par l'utilisation du poids.
- Comparons les résultats d'estimation des paramètres en régressions linéaires simple et pondérée.
......@@ -133,7 +134,7 @@ res.var <-gls(gs.rel~FTSW,weights=varPower(form=~FTSW),data=vignes, method="ML")
summary(res.var)
```
_Remarque: d'autres fonctions/modèles pour la variance sont disponibles dans nlme comme varIdent, varExp, varComb, varConstPower_
**Remarque**: d'autres fonctions/modèles pour la variance sont disponibles dans nlme comme varIdent, varExp, varComb, varConstPower.
Pour avoir une liste des différentes structures de covariance modélisables dans _nlme_, on peut consulter la notice.
......@@ -156,11 +157,12 @@ l'individu.
3. Pente: sa valeur dépend de la modalité $i$. On peut poser $b_{1,i} = b_1 + \gamma_i$, ce qui correspond à une autre écriture du même modèle pour laquelle on doit définir une contrainte d'identifiabilité (par exemple $\gamma_1 = 0$ ou $\sum \gamma_i=0$).
L'hétérogénéité observé pour la régression linéaire précédente de l'ouverture des stomates (_gs.rel_) en fonction du stress hydrique (_FTSW_) peut s'expliquer par des relations linéaires différentes selon le couple
variété-année (_Label_).
L'hétérogénéité observé pour la régression linéaire précédente de l'ouverture des stomates (_gs.rel_) en fonction du stress hydrique (_FTSW_) peut s'expliquer par des relations linéaires différentes selon le couple variété-année (_Label_).
```{r}
table(vignes$Label)
```
Le modèle d'analyse de covariance va ajuster une droite par modalité de la variable variété-année.
```{r}
......@@ -254,11 +256,11 @@ res.cov.pon <- gls(gs.rel~FTSW*Label,weights=varPower(form=~FTSW),data=vignes, m
anova(res.lin,res.pon) # Test L.Ratio effectué car bonne prise en compte des df
anova(res.cov,res.cov.pon)
# ![alt text](_bookdown_files/Cours_files/figure-html/SchemaTest.png)
```
Le Schéma des comparaisons de modèles possibles est le suivant
![alt text](SchemaTest.png)
......@@ -272,6 +274,7 @@ du modèle ont été proposés :
Plus leur valeur est petite meilleur est l'ajustement.
Enfin, on peut maintenant vérifier les résidus pour valider le modèle retenu.
```{r}
# graphiques des résidus
ggplot(vignes, aes(fitted(res.cov.pon), residuals(res.cov.pon, type="normalized"))) +
......@@ -288,7 +291,9 @@ ggplot(vignes, aes(fitted(res.cov.pon), residuals(res.cov.pon, type="normalized"
* PRESS: Predictive residuals sum of squares. Cette valeur prédictive se calcule avec la formule suivante:
$$\sum_{i=1}^n (y_i-\hat{y}_{i,(-i)})^2$$
où $\hat{y}_{i,(-i)}$ est l'estimation pour l'observation $i$ à partir d'un modèle estimé sans l'observation $i$. On utilise les techniques de validation croisée. On enlève les individus un par un. Ainsi, pour chaque individu $i$ on enlève son observation, on estime les paramètres du modèle et on prédit sa valeur. Remarque : la validation croisée permet aussi d'enlever les individus par paquets.
où $\hat{y}_{i,(-i)}$ est l'estimation pour l'observation $i$ à partir d'un modèle estimé sans l'observation $i$. On utilise les techniques de validation croisée. On enlève les individus un par un. Ainsi, pour chaque individu $i$ on enlève son observation, on estime les paramètres du modèle et on prédit sa valeur.
**Remarque** : la validation croisée permet aussi d'enlever les individus par paquets.
```{r}
require(qpcR) # fonctionne avec les sorties de lm, glm, nls
......
Markdown is supported
0% or .
You are about to add 0 people to the discussion. Proceed with caution.
Finish editing this message first!
Please register or to comment