Réorganiser dans Excel des listes numérisées

bigjimparisien

XLDnaute Nouveau
Bonjour le forum,

Il y a quelques temps, je me suis sorti d'une belle difficulté grâce au forum... J'ai aujourd'hui un cas similaire, aussi je sollicite à nouveau votre aide !

J'ai numérisé et OCRisé des listings, et souhaite récupérer les données dans Excel.
Hélas, l'OCR dans Acrobat Pro génère beaucoup de déchets et de cases vides dans le fichier exporté vers Excel, sans compter des erreurs de lectures lié à l'OCR mais je ferai mon affaire plus tard.

Concrètement, je souhaite récupérer les données organisées sous la forme suivante :

Code / Statut / Raison Sociale / Siren / Adresse1 / Adresse2 / CP / Ville / Statut

Un exemple est disponible pour avis/faisabilité via le lien suivant.



Merci d'avance !

BigJimParisien
 

bigjimparisien

XLDnaute Nouveau
Merci JHA,

En fait les données sont déjà dans le fichier Excel mais le contenu est totalement désorganisé. Exemple :

Code / Raison Sociale / Adresse1 / Siren /
Statut / CP / Ville / Adresse2 /
+ un nombre énorme de caractères isolés dans des cellules...

Je dois à la fois supprimer (lignes, cellules voire colonnes inutiles)
- les données qui ne m'intéressent pas
- les données qui sont issues d'une mauvaise lecture de l'OCR
Donc à priori analyser le contenu des cellules car bien sûr toutes les pages ne sont pas identiques dans leur structure (ce serait trop simple !!!)

... et réorganiser selon l'ordre suivant :

Code / Statut / Raison Sociale / Siren / Adresse1 / Adresse2 / CP / Ville / Statut

... et le tout sur environ 2.000 pages numérisées... d'où la nécessité d'automatiser.

Bigjim
 

eriiic

XLDnaute Barbatruc
Bonjour,

C'est un travail de moine copiste là. Presque tout est à corriger.
Tu es sûr que tu ne peux pas avoir un meilleur scan avant l'OCR ?
Corriger 2000 page comme ça c'est mission impossible, tu vas y passer 2 ans...
eric
 

bigjimparisien

XLDnaute Nouveau
Bonjour,

C'est un travail de moine copiste là. Presque tout est à corriger.
Tu es sûr que tu ne peux pas avoir un meilleur scan avant l'OCR ?
Corriger 2000 page comme ça c'est mission impossible, tu vas y passer 2 ans...
eric
Bonjour Eric,

Hélas les originaux sont de mauvaise qualité, je ne peux obtenir mieux... c'est bien là le problème.
Heureusement j'ai pu exporter le résultat de l'OCR en 2 fichiers Excel et sur 1 onglet, mais le tri, et l'organisation... c'est une autre affaire...

Bigjim
 

Statistiques des forums

Discussions
312 884
Messages
2 093 244
Membres
105 658
dernier inscrit
Mario Richard