Réorganiser dans Excel des listes numérisées

  • Initiateur de la discussion Initiateur de la discussion bigjimparisien
  • Date de début Date de début

Boostez vos compétences Excel avec notre communauté !

Rejoignez Excel Downloads, le rendez-vous des passionnés où l'entraide fait la force. Apprenez, échangez, progressez – et tout ça gratuitement ! 👉 Inscrivez-vous maintenant !

B

bigjimparisien

Guest
Bonjour le forum,

Il y a quelques temps, je me suis sorti d'une belle difficulté grâce au forum... J'ai aujourd'hui un cas similaire, aussi je sollicite à nouveau votre aide !

J'ai numérisé et OCRisé des listings, et souhaite récupérer les données dans Excel.
Hélas, l'OCR dans Acrobat Pro génère beaucoup de déchets et de cases vides dans le fichier exporté vers Excel, sans compter des erreurs de lectures lié à l'OCR mais je ferai mon affaire plus tard.

Concrètement, je souhaite récupérer les données organisées sous la forme suivante :

Code / Statut / Raison Sociale / Siren / Adresse1 / Adresse2 / CP / Ville / Statut

Un exemple est disponible pour avis/faisabilité via le lien suivant.



Merci d'avance !

BigJimParisien
 
Merci JHA,

En fait les données sont déjà dans le fichier Excel mais le contenu est totalement désorganisé. Exemple :

Code / Raison Sociale / Adresse1 / Siren /
Statut / CP / Ville / Adresse2 /
+ un nombre énorme de caractères isolés dans des cellules...

Je dois à la fois supprimer (lignes, cellules voire colonnes inutiles)
- les données qui ne m'intéressent pas
- les données qui sont issues d'une mauvaise lecture de l'OCR
Donc à priori analyser le contenu des cellules car bien sûr toutes les pages ne sont pas identiques dans leur structure (ce serait trop simple !!!)

... et réorganiser selon l'ordre suivant :

Code / Statut / Raison Sociale / Siren / Adresse1 / Adresse2 / CP / Ville / Statut

... et le tout sur environ 2.000 pages numérisées... d'où la nécessité d'automatiser.

Bigjim
 
Bonjour,

C'est un travail de moine copiste là. Presque tout est à corriger.
Tu es sûr que tu ne peux pas avoir un meilleur scan avant l'OCR ?
Corriger 2000 page comme ça c'est mission impossible, tu vas y passer 2 ans...
eric
 
Bonjour,

C'est un travail de moine copiste là. Presque tout est à corriger.
Tu es sûr que tu ne peux pas avoir un meilleur scan avant l'OCR ?
Corriger 2000 page comme ça c'est mission impossible, tu vas y passer 2 ans...
eric
Bonjour Eric,

Hélas les originaux sont de mauvaise qualité, je ne peux obtenir mieux... c'est bien là le problème.
Heureusement j'ai pu exporter le résultat de l'OCR en 2 fichiers Excel et sur 1 onglet, mais le tri, et l'organisation... c'est une autre affaire...

Bigjim
 
- Navigue sans publicité
- Accède à Cléa, notre assistante IA experte Excel... et pas que...
- Profite de fonctionnalités exclusives
Ton soutien permet à Excel Downloads de rester 100% gratuit et de continuer à rassembler les passionnés d'Excel.
Je deviens Supporter XLD
Assurez vous de marquer un message comme solution pour une meilleure transparence.
Retour