Bien reçu, mais c'est quasiment inexploitable. J'ai ouvert les journaux du 15/6/2000, 15/6/1950 et 14/6/1975 :
En 1950, rien ne permet d'identifier la chronique nécrologique, sinon qu'elle est en dernière page
En 1975, même chose, mais elle n'est pas en dernière page et elle est coupée par un article qui n'a rien à voir
En 2000, on peut rechercher "Avis mortuaires", mais deux avis sont présents avant
De plus :
Il y a de nombreuses erreurs dues à l'océrisation (BOCHATAY est transcrit 60CHATAV, THEYTAZ est retranscrit Ti-B>TAZ)
Il y a des avis qu'on ne trouve que dans les paragraphes "Advertisements Column x"
Il y a des doublons pas toujours rigoureusement identiques
Il faut parfois déchiffrer le texte pour savoir qui est le défunt dans la liste de tous les proches
Il faut différentier les avis de décès des anniversaires de la mort
Les titres des articles ne sont pas toujours très explicites
On ne sait pas où s'arrête la chronique
On peut quand même s'aider de l'obèle
† qui est retranscrit T (il y a des paragraphes qui s'appellent T !)
Personnellement je ne saurais pas faire, il y a trop des choses à éplucher pour un résultat trop approximatif.
Dans le même esprit, j'ai un jour réalisé un parser sous Excel pour identifier des décès à partie du site
https://www.acte-deces.fr. On peut faire un travail relativement simple et rigoureux car tout est bien formalisé. Il y a certainement l'équivalent pour la Suisse. Le problème est que ça ne remonte qu'à 1970...
Je pense qu'il faut couper le travail en 2 :
- Une appli qui exploite des données récentes bien formalisées comme sur acte-deces.fr
- Une appli qui lit les anciens journaux du Nouvelliste