S
steppo08
Guest
Bonjour,
j'essaie d'apurer une liste importante (50 000 lignes) de ses doublons.
Pour se faire j'aimerai pour chaque enregistrement sortir le % de similitude le plus élevé et l'enregistrement ayant ce % le plus élevé (bien évidemment les doublons ne sont pas exactement écrits de la même manière).
A titre d'exemple :
enregistrements % similitude enregistrement le plus similaire
M. Jules Prissard 90% J. PRISSARD
Jacques Henry
J. PRISSARD ...
J'espère que je suis clair.
Si vous connaissez des utilitaires qui font ce genre de choses je suis preneur également.
Merci d'avance,
j'essaie d'apurer une liste importante (50 000 lignes) de ses doublons.
Pour se faire j'aimerai pour chaque enregistrement sortir le % de similitude le plus élevé et l'enregistrement ayant ce % le plus élevé (bien évidemment les doublons ne sont pas exactement écrits de la même manière).
A titre d'exemple :
enregistrements % similitude enregistrement le plus similaire
M. Jules Prissard 90% J. PRISSARD
Jacques Henry
J. PRISSARD ...
J'espère que je suis clair.
Si vous connaissez des utilitaires qui font ce genre de choses je suis preneur également.
Merci d'avance,