Bonjour à tous,
J'ai un fichier dans lequel j'ai une colonne avec des noms, une colonne avec des dates, une colonne avec des points GPS.
Pour chaque nom, j'ai plusieurs points GPS pour le même jour. Ce que je souhaite faire, c'est sélectionner aléatoirement pour chaque nom un point GPS par jour.
Je vous mets un exemple du fichier que j'ai.
Je pense que ce qu'il faudrait faire, c'est de "créer" des groupes Nom où on prendrait en compte le fait qu'il y ait des dates identiques, et ensuite donner un chiffre aléatoire à chaque ligne de chaque groupe Nom. Au final, il faudrait sélectionner à l'intérieur de chaque groupe, un point par jour.
Ce que j'ai fait pour le moment c'est de concatener ma colonne nom avec ma colonne date et ensuite de créer une colonne rand où j'ai donné un chiffre aléatoire à chaque ligne. Mais je ne sais pas aller plus loin que cela.
Est-ce que quelqu'un pourrait m'indiquer une solution à mon problème ? Je précise que mon fichier de base fait pas loin de 40 000 lignes donc le but est vraiment d'avoir une automatisation du processus.
Merci à vous !
J'ai un fichier dans lequel j'ai une colonne avec des noms, une colonne avec des dates, une colonne avec des points GPS.
Pour chaque nom, j'ai plusieurs points GPS pour le même jour. Ce que je souhaite faire, c'est sélectionner aléatoirement pour chaque nom un point GPS par jour.
Je vous mets un exemple du fichier que j'ai.
Je pense que ce qu'il faudrait faire, c'est de "créer" des groupes Nom où on prendrait en compte le fait qu'il y ait des dates identiques, et ensuite donner un chiffre aléatoire à chaque ligne de chaque groupe Nom. Au final, il faudrait sélectionner à l'intérieur de chaque groupe, un point par jour.
Ce que j'ai fait pour le moment c'est de concatener ma colonne nom avec ma colonne date et ensuite de créer une colonne rand où j'ai donné un chiffre aléatoire à chaque ligne. Mais je ne sais pas aller plus loin que cela.
Est-ce que quelqu'un pourrait m'indiquer une solution à mon problème ? Je précise que mon fichier de base fait pas loin de 40 000 lignes donc le but est vraiment d'avoir une automatisation du processus.
Merci à vous !