Ceci est une page optimisée pour les mobiles. Cliquez sur ce texte pour afficher la vraie page.

XL 2016 VBA - Récupérer le texte d'un fichier PDF

Dudu2

XLDnaute Barbatruc
Bonjour,

Y a-t-il un moyen de chercher et récupérer du texte directement dans un PDF sans avoir à l'ouvrir / tout sélectionner / copier dans le clipboard texte ?

Merci pour toute information.

Edit: Titre modifié pour mieux refléter la solution de cette longue discussion.
 
Dernière édition:

Dudu2

XLDnaute Barbatruc
Alors voilà le fichier avec le Clipboard API en VBA7 pour le GetCliboard.
Je vais faire un fichier séparé uniquement pour le Clipboard API en VBA7 pour le GetCliboard et le LetClipboard.
 

Pièces jointes

  • Classeur1.xlsm
    55.1 KB · Affichages: 1

patricktoulon

XLDnaute Barbatruc
juste pour info
mais juste comme ça en passant hein je veux pas de decevoir
avec chrome je récupère beaucoup moins de données qu'avec firefox
je le dis juste au cas ou tu ne t'en serait pas apercu

mais en même temps je ne suis pas étonné firefox a un module pdfmaker ce que chrome n'a pas bien sur
ci join un xlsx de ce que je récupère du 62 mega avec ma méthode mais clipboard api

je suis désolé d'abattre le couperet , lglas de tout tes espoirs, la mort de la chance,

j'allucine 11 pages que l'on travaille dessus pour se rendre compte de ça
c'est bon abandonne chrome c'est mort
 

Pièces jointes

  • ce que je récupère du 62 mega avec fire fox.xlsx
    570.9 KB · Affichages: 0
  • ce que je récupère du 62 mega avec chrome .xlsx
    20.7 KB · Affichages: 0

Dudu2

XLDnaute Barbatruc
Ok, pour Chrome ça ne m'étonne pas. C'est bien que tu l'aies découvert.
De toutes façons, pour la personne à qui s'est destiné ce sont de petits PDF.

Voilà au passage l'API Clipboard qui fonctionne. Lecture / Écriture / Vidage / Test si vide.
Y avait encore une pouille dans le cottage sur la déclaration de SetClipboardData de MS.
 

Pièces jointes

  • Clipboad API.xlsm
    23.1 KB · Affichages: 1

patricktoulon

XLDnaute Barbatruc
cette partie la fonctionne je l'ai déjà testé je l'ai péché au même endroit que toi

pour info même les petis pdf il y a beaucoup plus à récupérer
en fait visiblement chrome recupère les 3/4 premières pages
firefox lui récupère tout
mais je le redit c'est normal
il a le plugin de adobe ceator pdf DC dedans tout du moins un erzats mais bien utile quand même
j'ai remis chrome pour te filer un coup de main mais honnêtement c'est une grosse daube
fait un sondage au près d'autres membres ils vont t'en parler

c'est la première chose que je conseille a ceux a qui je touche le pc
virez moi ce chrome !!!!!
 

Dudu2

XLDnaute Barbatruc
Ok, de mon coté, en test unitaire pas de souci.
En tests en boucle sans pause dans Excel ça part en vrille. La boucle GetActiveWindow ne s'y retrouve pas.
J'essaie de trouver une parade.
Décidément, c'est jamais fini ce truc.
 

patricktoulon

XLDnaute Barbatruc
re
pour moi y a que le clipboard qui doit mener le jeu
car c'est le seul repère accécible
le handle tu le chope parfois la fenêtre n'est pas prête et ca envoie les sendkeys trop tot
resultat c'est la fentre chrome parent et non le document qui est pointé
conclusion j'ai une fenêtre toute bleu de selection et pas que le texte

dis moi un peu est ce que tu te sert d'un webbrowser toi ?
 

Dudu2

XLDnaute Barbatruc
Alors trouvé le problème qui arrive quand on teste en boucle, ce qui serait le cas par exemple d'un traitement batch de PDF.

En fait après le Alt ou Ctrl F4 qui dézingue le Browser, il faut attendre qu'il ait disparu car si on revient trop vite sur Excel, il ne prend pas les touches. Excel non plus ce qui m'étonne mais ça fout la grouille dans les Activewindow.

Pfff ! Est-ce la dernière mouture ?

Edit: En tous cas le test en boucle x 10 du gros fichier chez moi ça roule sans aucune anicroche.
 

Pièces jointes

  • Classeur1.xlsm
    55.3 KB · Affichages: 1
Dernière édition:

Dudu2

XLDnaute Barbatruc
si tu a le webbrowser dispo dans tes controls vba et que tu au moins le reader d'acrobat d'instalé
fait le sur un webbrowser et oubli chrome
Le WebBrowser ne gère pas nativement le PDF et donc il faut un outil PDF, perso j'utilise PDF XChange Viewer.
Mais le problème reste le même. Il faut gérer le PDF Reader de la même manière que le Web Browser et boucler. Alors sans doute retournera-t-il plus de texte que Chrome. Autant garer Firefox.

Avec Edge ça fonctionne aussi. Je le rajoute en tête de liste puisqu'il est présent par défaut sur toutes les nouvelles versions Windows.

Solution mises à jour.
 
Dernière édition:

Discussions similaires

Les cookies sont requis pour utiliser ce site. Vous devez les accepter pour continuer à utiliser le site. En savoir plus…