Ceci est une page optimisée pour les mobiles. Cliquez sur ce texte pour afficher la vraie page.

Power Query Lister les tables présentes dans un document pdf

Gégé-45550

XLDnaute Accro
Bonjour amis Excel'lents,
Je voudrais automatiser l'importation dans Excel, via PowerQuery, des tables contenues dans un fichier pdf que je reçois chaque mois.
Problèmes :
  • le fichier ne comporte pas que des tables, mais aussi des pages (voir image ci-dessous)
  • d'un mois sur l'autre, il n'y a pas le même nombre de tables et leur nom change (par ex : Table002 (Page 2)
Question : Existe-t-il une solution pour lister les objets contenus dans le pdf, ce qui me permettrait de ne garder que les objets tables et d'utiliser leur nom dans des variables injectées dans ma requête ?

Merci d'avance pour vos brillants apports !
 
Solution
Bonjour,

A l'étape de votre post1, cliquez sur le bouton "Transformer les données" après avoir sélectionné au moins une table.
Dans l'éditeur power query, sélectionnez l'étape "Navigation", click-droit -> supprimer jusqu'à la fin.
Il ne doit vous rester que l'étape "Source"
A droite de la colonne 'Name' cliquez sur la flèche pour filtrer, choisir "Filtre textuel/Commence par"

Mettez "Table" dans la zone idoine puis validez


Vous aurez uniquement les tables du fichier dont les données seront dans la colonne "Data"
Cordialement

Hasco

XLDnaute Barbatruc
Repose en paix
Re,

Du côté du demandeur, sauf à créer lui-même un pdf avec des données fictives, difficile de communiquer un relevé bancaire pdf.

De notre côté, les banques éditant chacunes des relevés pdf différents, difficile de vous donner une requête efficace.

Mais sachez qu'il est souvent plus facile de ne traiter que les 'Pages' et laisser tomber les 'Tables' dans lesquelles il manque souvent des morceaux.
Pour ça le connecteur Pdf de PowerQuery n'est pas encore au point (le sera-t-il un jour ?)

Cordialement
 

Deadpool_CC

XLDnaute Accro
Bonjour,
par contre toutes les banques (ou presque) permette de télécharger les opérations sur compte en CSV
cela serais plus facile que de traiter des PDF générer par des outils qui peuvent changer et faire la génération de l'orgnisation du pdf de manière aléatoire ... lol
A réfléchir avant d'aller trop loin dans un décorticage de pdf de relevés bancaire
 

Gégé-45550

XLDnaute Accro
Bonsoir à tous et merci de l'intérêt que vous portez à ma requête.
À la demande générale, j'ai construit (pitoyablement) un fichier test baptisé Anonymous.pdf que vous trouverez en PJ.
Je n'en voyais pas trop l'intérêt car c'est moins son contenu que sa structure que je voudrais obtenir par VBA.
Si on active Power Query sur le fichier Anonymous.pdf, le Navigateur propose 33 tables, de Table001 (Page 2) à Table033 (Page 28), puis 29 pages, de Page001 à Page029.
C'est cette liste que je cherche à obtenir (par VBA ?) car elle me permettrait de stocker les noms des tables dans une variable que je pourrai injecter dans ma requête.
Pour répondre à Hasco, les 'Pages' sont plus difficiles à traiter car elles comportent un nombre de colonnes variable, alors que les 'Tables' sont parfaitement structurées (ce qui n'est pas le cas dans Anonymous.pdf ... avant qu'on ne me fasse la réflexion !).
Pour répondre à Deadpool_CC, ce n'est pas moi qui fournit les relevés ; je les reçois et dois les exploiter tels quels (mais j'essayerai quand même d'obtenir un exemplaire en CSV, sans trop d'illusions).
Merci encore de votre attention et bonne soirée.
 

Pièces jointes

  • Anonymous.pdf
    130.6 KB · Affichages: 7

Hasco

XLDnaute Barbatruc
Repose en paix
Bonjour,

A l'étape de votre post1, cliquez sur le bouton "Transformer les données" après avoir sélectionné au moins une table.
Dans l'éditeur power query, sélectionnez l'étape "Navigation", click-droit -> supprimer jusqu'à la fin.
Il ne doit vous rester que l'étape "Source"
A droite de la colonne 'Name' cliquez sur la flèche pour filtrer, choisir "Filtre textuel/Commence par"

Mettez "Table" dans la zone idoine puis validez


Vous aurez uniquement les tables du fichier dont les données seront dans la colonne "Data"
Cordialement
 

Discussions similaires

Les cookies sont requis pour utiliser ce site. Vous devez les accepter pour continuer à utiliser le site. En savoir plus…