Re : Compter le nombre de citations identiques dans 2 feuilles différentes
Bonsoir,
C'était bien là l'objet de ma précédente question ...
1. Comment distinguer les mots mal orthographiés
Là c'est un peu mission impossible
à quels criteres penses tu ?
Pour Donnay, faut il tester Donay et d'autres erreurs eventuelles.
Rien que de dire à une macro de tester les doubles consonnes, c'est tout un programme (c'est le cas de la dire
)
Puis les Williamson vs William et Donaldson vs Donald on trucs dans ce genre.
2. Idem pour les points. Si dans ma BD, j'ai écris Donnay P. et Donnay P , il ne le compte pas car il n'y a pas de point
Et s'il y a des homonymes Donnay Paul et Donnay Pierre ?
Mais à la limite gérer le point c'est facile. Il faudra sans doute gérer le "-" ou autre caracteres ...
Enfin un autre problème sera de savoir distinguer un auteur cité 3 fois mais qui en réalité ne revient qu'une fois car on citait son nom pour 2 autres de ses articles (la 2° colonne permettant cette distinction).
Si on arrive à les compter, comment doit on les dédoublonner ?...
Pas bien compris l'histoire de la 2eme colonne...
Il y a une chose qu'on peut faire, c'est enlever tous les caracteres de controle.
Càd => Jensen M.C., W. Meckling devient Jensen MCWMeckling et on compare les chaines.
Mais valable si on n'a pas ...
Jensen M.C., W. Meckling
et
Jensen M.C., William Meckling
... à comparer