Bonjour,
Avant toute chose, je suis allé sur les supers Tutos de JB (merci JB pour toutes ces sources d'inspiration) concernant les doublons, mais mon souci va plus loin (bref, j'ai pas trouvé comment ré-utiliser les codes...) : j'importe des données dont je n'ai pas la maitrise du format, et ce format change parfois ....j'ai des "_" qui s'en mêlent, des espaces entre les noms et prénoms, des espaces ou non entre des particules de nom....bref, que du bonheur....ce fichier fait 400000 lignes (et oui, et c’est lourd à traiter..lol...), en A, le "code" de la personne, en B, son nom/prénom. Donc, j'ai d'abord commencé à faire un TCD, histoire d'identifier les récurences des noms, mais....il n'a pas pris les 400000 lignes (d'ailleurs, je n'ai pas compris..., mais bon...)., donc, j'ai regardé les codes de JB, pensant trouver une solution, mais sans succès....
Donc, en fait, ce que je souhaiterai obtenir est d'avoir par code, le plus grand nombre de fois où un nom/prénom apparait (disons le format de texte le plus utilisé) et ne "retenir" par code que ce nom/prénom....
Comme je sais que je ne suis pas toujours très très clair dans mes explications (lol), j'ai mis un fichier test en PJ
En vous remerciant pour votre aide,