doublons et similitudes dans une liste

steppo08 · 4 Décembre 2009

Bonjour,

j'essaie d'apurer une liste importante (50 000 lignes) de ses doublons.

Pour se faire j'aimerai pour chaque enregistrement sortir le % de similitude le plus élevé et l'enregistrement ayant ce % le plus élevé (bien évidemment les doublons ne sont pas exactement écrits de la même manière).

A titre d'exemple :

enregistrements % similitude enregistrement le plus similaire
M. Jules Prissard 90% J. PRISSARD
Jacques Henry
J. PRISSARD ...

J'espère que je suis clair.

Si vous connaissez des utilitaires qui font ce genre de choses je suis preneur également.

Merci d'avance,

hoerwind · 4 Décembre 2009

Re : doublons et similitudes dans une liste

Bonjour et bienvenu sur le forum,

les doublons ne sont pas exactement écrits de la même manière
Je crains fort qu'il n'y ait pas de solution, mais sait-on jamais !

CISCO · 4 Décembre 2009

Re : doublons et similitudes dans une liste

Bonsoir

Sujet fort intéressant je pense...

Toutefois, il faudrait mieux que tu nous envoies un fichier, disons d'une centaine de lignes, avec quelques pseudo-doublons, et le résultat attendu, pour que nous puissions travailler sur une base solide.

@ plus

Effectuez une recherche sur Excel Downloads...

doublons et similitudes dans une liste

steppo08

Guest

hoerwind

XLDnaute Barbatruc

CISCO

XLDnaute Barbatruc

Discussions similaires

Nous accordons de l'importance à votre vie privée