Y a-t-il un moyen de chercher et récupérer du texte directement dans un PDF sans avoir à l'ouvrir / tout sélectionner / copier dans le clipboard texte ?
Merci pour toute information.
Edit: Titre modifié pour mieux refléter la solution de cette longue discussion.
Le fichier à télécharger contient: Le Module_GetPDFText Le Module_Test qui donnent un exemple d'utilisation Les principales caractéristiques: La Fonction GetPDFText() retourne le texte d'un fichier PDF reçu en argument. Si un erreur se...
Alors voilà le fichier avec le Clipboard API en VBA7 pour le GetCliboard.
Je vais faire un fichier séparé uniquement pour le Clipboard API en VBA7 pour le GetCliboard et le LetClipboard.
juste pour info
mais juste comme ça en passant hein je veux pas de decevoir
avec chrome je récupère beaucoup moins de données qu'avec firefox
je le dis juste au cas ou tu ne t'en serait pas apercu
mais en même temps je ne suis pas étonné firefox a un module pdfmaker ce que chrome n'a pas bien sur
ci join un xlsx de ce que je récupère du 62 mega avec ma méthode mais clipboard api
je suis désolé d'abattre le couperet , lglas de tout tes espoirs, la mort de la chance,
j'allucine 11 pages que l'on travaille dessus pour se rendre compte de ça
c'est bon abandonne chrome c'est mort
Ok, pour Chrome ça ne m'étonne pas. C'est bien que tu l'aies découvert.
De toutes façons, pour la personne à qui s'est destiné ce sont de petits PDF.
Voilà au passage l'API Clipboard qui fonctionne. Lecture / Écriture / Vidage / Test si vide.
Y avait encore une pouille dans le cottage sur la déclaration de SetClipboardData de MS.
Bon alors, c'est quoi qui ne fonctionne pas dans mon code chez toi ?
C'était juste une méprise ou c'est bien réel ?
Si c'est bien réel t'as trouvé la cause ?
Allez ! Au boulot !
cette partie la fonctionne je l'ai déjà testé je l'ai péché au même endroit que toi
pour info même les petis pdf il y a beaucoup plus à récupérer
en fait visiblement chrome recupère les 3/4 premières pages
firefox lui récupère tout
mais je le redit c'est normal
il a le plugin de adobe ceator pdf DC dedans tout du moins un erzats mais bien utile quand même
j'ai remis chrome pour te filer un coup de main mais honnêtement c'est une grosse daube
fait un sondage au près d'autres membres ils vont t'en parler
c'est la première chose que je conseille a ceux a qui je touche le pc
virez moi ce chrome !!!!!
Ok, de mon coté, en test unitaire pas de souci.
En tests en boucle sans pause dans Excel ça part en vrille. La boucle GetActiveWindow ne s'y retrouve pas.
J'essaie de trouver une parade.
Décidément, c'est jamais fini ce truc.
re
pour moi y a que le clipboard qui doit mener le jeu
car c'est le seul repère accécible
le handle tu le chope parfois la fenêtre n'est pas prête et ca envoie les sendkeys trop tot
resultat c'est la fentre chrome parent et non le document qui est pointé
conclusion j'ai une fenêtre toute bleu de selection et pas que le texte
dis moi un peu est ce que tu te sert d'un webbrowser toi ?
Alors trouvé le problème qui arrive quand on teste en boucle, ce qui serait le cas par exemple d'un traitement batch de PDF.
En fait après le Alt ou Ctrl F4 qui dézingue le Browser, il faut attendre qu'il ait disparu car si on revient trop vite sur Excel, il ne prend pas les touches. Excel non plus ce qui m'étonne mais ça fout la grouille dans les Activewindow.
Pfff ! Est-ce la dernière mouture ?
Edit: En tous cas le test en boucle x 10 du gros fichier chez moi ça roule sans aucune anicroche.
Le WebBrowser ne gère pas nativement le PDF et donc il faut un outil PDF, perso j'utilise PDF XChange Viewer.
Mais le problème reste le même. Il faut gérer le PDF Reader de la même manière que le Web Browser et boucler. Alors sans doute retournera-t-il plus de texte que Chrome. Autant garer Firefox.
Avec Edge ça fonctionne aussi. Je le rajoute en tête de liste puisqu'il est présent par défaut sur toutes les nouvelles versions Windows.