Power Query Supprimer les doublons et garder le récemment créer

Sofiane Boukecha

XLDnaute Nouveau
Bonjour tout le monde,

j'ai une table de produits avec lot et date de création prix ... etc, avec plus de 6 millions de lignes donc pas facile à manipuler,
mon besoin, est de supprimer les doublons de produits et garder ceux qui sont créer récemment, j'ai essayer plusieurs fois mais à chaque fois il me donne le résultat contraire , c'est à dire il garde les anciens créer.
svp, quelqu'un peut il m'aider?

merci beaucoup
 

Pièces jointes

  • Exemple Sup Double.xlsx
    16 KB · Affichages: 9
Solution
Bonjour,

Merci de ce retour.

J'avais enlevé les autres colonnes parce que dans votre exemple il n'y avait que "Date" qui était pertinente mais on peut remettre toutes les autres colonnes.

Vous aviez 2 requêtes
Groupes qui renvoyait toute les colonnes dans un record
et Groupes 2 que ne renvoyait que la date.
C'est à vous d'explorer vos requêtes et d'en faire et tirer ce que vous voulez, nous, nous ne vous montrons que des méthodes pour y arriver.

Dans la requête "Groupes", il suffisait de double-cliquer sur l'étape "Datas développé" et de choisir les colonnes que vous souhaitiez.

Dans le fichier joint, toutes les colonnes sont rapatriées et préfixées de "GRP" car power query n'aime pas le doublons dans les noms de colonne...

Sofiane Boukecha

XLDnaute Nouveau
re tout le monde,
@Hasco votre requête règle mon problème, merci beaucoup.
le temps d'exécution était de 19 minutes sur une machine de 256 go de RAM.
je vais surveiller le comportement du chargement lors des actualisations des données, est ce qu'elle va mettre à jour uniquement les nouveaux enregistrements, ou bien elle va refaire le chargement global.

je vous remercie infiniment
 

Hasco

XLDnaute Barbatruc
Repose en paix
Re,
le temps d'exécution était de 19 minutes sur une machine de 256 go de RAM.
quand même !

On peut :
- déconnecter de sa requête le résultat déjà importé (les anciennes)
- faire une requête pour ne charger que les données qui ne l'on pas été par fusion externe droite
- traiter les nouvelles pour n'en garder que les uniques récents
- copier les données du résultat dans le tableaux des anciennes.

Dans la feuilles "Nouveaux" du fichier joint
1 - cliquer sur le bouton vert pour actualiser la requête qui va chercher les nouveaux dans DataSource
2 - une fois la requête actualisée cliquez sur le bouton bleu pour transférer les données dans "Anciens"

Si vous réactualisez la requête du tableau RQ_Nouveaux, elle ne retournera aucune ligne, les nouveaux produits uniques récents ayant été transférés.

La logique voudrait que ce processus aille plus rapidement mais....????

Cordialement
 

Pièces jointes

  • Exemple Sup Double.xlsm
    64.7 KB · Affichages: 7

Discussions similaires

Statistiques des forums

Discussions
312 094
Messages
2 085 244
Membres
102 833
dernier inscrit
Hassna