Bonjour à toutes et à tous.
Je viens vers vous pour voir si vous pourriez m'aider sur un problème qui revient assez souvent, apparemment, mais je n'ai pas su trouver de réponse à ma quête donc je préfère créer un sujet à part... Il s'agit d'un cas de régression polynomiale (attention, message relativement long)
Je suis actuellement en stage dans une société s'occupant de la gestion de l'eau (distribution, assainissement, etc) et travaille sur un projet d'élaboration de courbes de tendance en dans le but de repérer des fuites sur un réseau d'eau.
En résumé, je dispose des relevés, heure par heure, du débit d'eau des différents secteurs d'un réseau d'eau potable. Par une simple soustraction j'ai donc la consommation horaire d'eau potable sur chaque secteur.
L'idée est d'établir un modèle suffisamment précis et fiable qui, par une méthode statistique assez classique, estime la consommation d'eau future, à partir des consommations passées. La détection de fuites se fait alors en remarquant un écart trop important entre ce qui est prévu et réellement consommé.
J'ai déjà commencé à établir des modèles (modèle additif et multiplicatif) mais leur précision n'est pas encore optimale, et je voudrais tenter quelque chose.
Je m'explique : à partir de la courbe représentant la moyenne mobile d'ordre 24 des consommations en fonction de la date (ou des consommations brutes en fonction de la date, peu importe), je cherche à estimer la tendance en appliquant tout simplement une courbe de tendance polynomiale. J'arrive à obtenir quelque chose qui visuellement pourrait être satisfaisant (estimation à l'ordre 6), et je fais donc afficher l'équation. L'idée est donc alors de récupérer cette équation (fonction du temps) et de l'appliquer aux dates de mon classeur.
Problème : en faisant cela, j'obtiens des valeurs tout à fait délirantes!
Même en utilisant une approximation du second degré plus simple, j'obtiens quelque chose qui n'a rien à voir.
Alors d'où peut venir le problème? Est-ce que j'aurais atteint les limites d'Excel en termes de quantité de données? Est-ce qu'il y a un changement de référentiel quand on bascule des données numériques aux courbes?
En pièce jointe, vous trouverez mon fichier. Dans l'onglet données, vous trouverez mes données (logique) qui ont servi de base. J'ai tracé la moyenne mobile (colonne G) en fonction du temps (colonne D). Cette courbe se trouve dans l'onglet "courbes", c'est la 3ème courbe (titre : moyenne mobile). J'ai laissé dessus la courbe de tendance avec son équation. Dans l'onglet données, à la colonne N "Approximation degré6", j'ai reporté cette équation en l'appliquant aux dates. Et vous voyez bien que ça ne colle pas...
Je me suis basé uniquement sur l'année 2013, pour faire mes tests.
Merci d'avance.
Je viens vers vous pour voir si vous pourriez m'aider sur un problème qui revient assez souvent, apparemment, mais je n'ai pas su trouver de réponse à ma quête donc je préfère créer un sujet à part... Il s'agit d'un cas de régression polynomiale (attention, message relativement long)
Je suis actuellement en stage dans une société s'occupant de la gestion de l'eau (distribution, assainissement, etc) et travaille sur un projet d'élaboration de courbes de tendance en dans le but de repérer des fuites sur un réseau d'eau.
En résumé, je dispose des relevés, heure par heure, du débit d'eau des différents secteurs d'un réseau d'eau potable. Par une simple soustraction j'ai donc la consommation horaire d'eau potable sur chaque secteur.
L'idée est d'établir un modèle suffisamment précis et fiable qui, par une méthode statistique assez classique, estime la consommation d'eau future, à partir des consommations passées. La détection de fuites se fait alors en remarquant un écart trop important entre ce qui est prévu et réellement consommé.
J'ai déjà commencé à établir des modèles (modèle additif et multiplicatif) mais leur précision n'est pas encore optimale, et je voudrais tenter quelque chose.
Je m'explique : à partir de la courbe représentant la moyenne mobile d'ordre 24 des consommations en fonction de la date (ou des consommations brutes en fonction de la date, peu importe), je cherche à estimer la tendance en appliquant tout simplement une courbe de tendance polynomiale. J'arrive à obtenir quelque chose qui visuellement pourrait être satisfaisant (estimation à l'ordre 6), et je fais donc afficher l'équation. L'idée est donc alors de récupérer cette équation (fonction du temps) et de l'appliquer aux dates de mon classeur.
Problème : en faisant cela, j'obtiens des valeurs tout à fait délirantes!
Même en utilisant une approximation du second degré plus simple, j'obtiens quelque chose qui n'a rien à voir.
Alors d'où peut venir le problème? Est-ce que j'aurais atteint les limites d'Excel en termes de quantité de données? Est-ce qu'il y a un changement de référentiel quand on bascule des données numériques aux courbes?
En pièce jointe, vous trouverez mon fichier. Dans l'onglet données, vous trouverez mes données (logique) qui ont servi de base. J'ai tracé la moyenne mobile (colonne G) en fonction du temps (colonne D). Cette courbe se trouve dans l'onglet "courbes", c'est la 3ème courbe (titre : moyenne mobile). J'ai laissé dessus la courbe de tendance avec son équation. Dans l'onglet données, à la colonne N "Approximation degré6", j'ai reporté cette équation en l'appliquant aux dates. Et vous voyez bien que ça ne colle pas...
Je me suis basé uniquement sur l'année 2013, pour faire mes tests.
Merci d'avance.