Microsoft 365 Recherche d'un code à 13 chiffres dans des fichiers PDF via excel ou PowerQuery

Lulu974

XLDnaute Nouveau
Bonjour à tous,
Voilà j'ai une liste de codes GTIN à 13 chiffres (1 code à 13 chiffres par cellules) dans excel (5637 codes) que je souhaite rechercher en masse dans des PDF présents dans un dossier (9036 PDF).
Si cette recherche aboutie, elle devrait me donner le nom du fichier PDF (pour que je puisse l'identifier rapidement + le code à 13 chiffres trouvé).

Je ne sais pas si ma demande est compréhensible.

Est-ce que cela vous semble possible ?

Je vous remercie d'avance pour votre aide.

Bonne soirée.
Lucie
 

Pièces jointes

  • Recherche_GTIN_PDF.xlsm
    10.1 KB · Affichages: 8

Cousinhub

XLDnaute Barbatruc
Bonsoir,
Ma participation n'engage en rien une quelconque résolution de ton problème, mais si je comprends bien :
- Tu disposes d'une liste de codes GTIN à 13 chiffres dans un fichier Excel
- Tu as 9036 fichiers *.pdf dans un répertoire
- Ces fichiers peuvent avoir un nom quelconque
- Dans ces fichiers, il se pourrait que se trouve un de tes codes GTIN, à un endroit quelconque
Et ton souhait serait de relier tes codes au(x) fichier(s) contenant ce code

Me trompé-je?
Si j'ai bon, peut-être qu'en plus de ton fichier Excel, il serait bon de fournir un (ou des) fichier(s) *.pdf (mode OCR, donc lisible(s) par PQ)
Mais je fais peut-être fausse route...
 

Lulu974

XLDnaute Nouveau
Bonsoir,
Ma participation n'engage en rien une quelconque résolution de ton problème, mais si je comprends bien :
- Tu disposes d'une liste de codes GTIN à 13 chiffres dans un fichier Excel
- Tu as 9036 fichiers *.pdf dans un répertoire
- Ces fichiers peuvent avoir un nom quelconque
- Dans ces fichiers, il se pourrait que se trouve un de tes codes GTIN, à un endroit quelconque
Et ton souhait serait de relier tes codes au(x) fichier(s) contenant ce code

Me trompé-je?
Si j'ai bon, peut-être qu'en plus de ton fichier Excel, il serait bon de fournir un (ou des) fichier(s) *.pdf (mode OCR, donc lisible(s) par PQ)
Mais je fais peut-être fausse route...
Bonsoir @bhbh ,
Mes réponses en vert
- Tu disposes d'une liste de codes GTIN à 13 chiffres dans un fichier Excel <= Oui
- Tu as 9036 fichiers *.pdf dans un répertoire <= Oui
- Ces fichiers peuvent avoir un nom quelconque <= Oui
- Dans ces fichiers, il se pourrait que se trouve un de tes codes GTIN, à un endroit quelconque <= Oui
Et ton souhait serait de relier tes codes au(x) fichier(s) contenant ce code <= Oui
Me trompé-je? <= Non tu as bien compris :)
Si j'ai bon, peut-être qu'en plus de ton fichier Excel, il serait bon de fournir un (ou des) fichier(s) *.pdf (mode OCR, donc lisible(s) par PQ) <= ci-joint 4 fichiers PDF + le fichier excel V2 où j'ai modifié certains codes GTIN pour tester. 5/12 devraient être retrouvés dans les fichiers PDF.
Mais je fais peut-être fausse route.. <= Non tu ne fais pas fausse route c'est bien ça.

Merci pour ton aide.
Bonne soirée Lucie
 

Pièces jointes

  • Recherche_GTIN_PDF_V2.xlsm
    10.3 KB · Affichages: 4
  • 758_Fiche_1.pdf
    130.9 KB · Affichages: 7
  • 859_Fiche_2.pdf
    138.6 KB · Affichages: 7
  • 2054_Fiche_3.pdf
    53 KB · Affichages: 7
  • 2056_Fiche_4.pdf
    39.6 KB · Affichages: 9
Dernière édition:

Lulu974

XLDnaute Nouveau
Bonsoir @eastwick ,
Merci pour ton retour :).
En fait je me suis mal exprimé.
Comme la si bien détaillé @bhbh voici ce que je souhaitais :
- je dispose d'une liste de codes GTIN à 13 chiffres dans un fichier Excel
- j'ai 9036 fichiers *.pdf dans un répertoire
- Ces fichiers peuvent avoir un nom quelconque
- Dans ces fichiers, il se pourrait que se trouve un de tes codes GTIN, à un endroit quelconque
Et mon souhait serait de relier mes codes au(x) fichier(s) contenant ce code

Encore merci pour ton aide.
Bonne soirée.
Lucie
 
Dernière édition:

Lulu974

XLDnaute Nouveau
Salut, voir via liste contributions PDF ( post# 5 6 101 104 105 ) avec les outils appropriés : Acrobat Pro, Acrobat Reader, PDFCreator 1.7.3
Bonsoir @kiki29 ,
Merci pour ton retour. En effet, j'ai parcouru cette discussion "liste contributeurs PDF". J'ai peut être loupé des choses :( . J'arrive pas à accéder aux post # 5 6 101 104 105. je ne vois au les posts # 1 2 3 4.
Ca tombe bien j'ai l'outil Adobe Pro :) Bonne nouvelle :).
Comment puis-je voir les posts que tu m'as indiqué ?
Merci pour ton aide
Bonne soirée.
Lucie
 

kiki29

XLDnaute Barbatruc
Salut, en ouvrant Liste_Contributions_PDF.xls tu auras accès dans la colonne B Post #
via un lien pour le moment 1 à 202 à des codes permettant de faire ce qui est nommé dans la colonne C
J'obtiens ceci via XPDF 3.04
 

Pièces jointes

  • 3.png
    3.png
    218.8 KB · Affichages: 26
  • Fusion_01.txt
    2.6 KB · Affichages: 4
  • Fusion_02.txt
    5.9 KB · Affichages: 2

Lulu974

XLDnaute Nouveau
Merci @kiki29 je viens de réussir à charger des données seulement si la fiche PDF 3 est ouverte dans Adobe reader. Si le fichier PDF n'est pas ouvert dans Adobe Adobe le fichier excel pdf2xls... ne charge pas les données ça me met erreur.
Et c'est vrai que j'aurai voulu qu'il charge uniquement les codes à 13 chiffres dans l'onglet extraction ainsi que le nom du fichier PDF.

Encore merci pour ton aide 😉.
Lucie
 

kiki29

XLDnaute Barbatruc
Re, la moulinette/procédure excel pour n'extraire que les données utiles est à ta charge, et cela n'est pas souvent une sinécure. Elle sera à intégrer dans la procédure de sélection des fichiers.
Tu me parles de pdf2xls mais moi ici j'en ai tellement de versions que cela n'évoque plus rien pour moi ( donc à fournir pour vérif )
 
Dernière édition:

chris

XLDnaute Barbatruc
Bonjour à tous

Une 1ère ébauche PowerQuery (j'ai modifié 2 codes de ton Excel qui avaient 14 caractères avec un 9 devant...)
Modifier le chemin d'accès de la cellule jaune et les paramètres de PowerQuery
Fichier, Options et paramètres, Options de requête, partie GLOBAL : Confidentialité, Toujours ignorer les paramètres de niveau de confidentialité

Aucune idée de temps sur 9000 fichiers...
 

Pièces jointes

  • Recherche_GTIN_PDF_PQ.xlsx
    22.4 KB · Affichages: 6

Lulu974

XLDnaute Nouveau
Re, la moulinette/procédure excel pour n'extraire que les données utiles est à ta charge, et cela n'est pas souvent une sinécure. Elle sera à intégrer dans la procédure de sélection des fichiers.
Tu me parles de pdf2xls mais moi ici j'en ai tellement de versions que cela n'évoque plus rien pour moi ( donc à fournir pour vérif )
Re @kiki29 c'est noté pour l'extraction des données utiles ;o)
Voici la version sur laquelle j'ai testé et où je rencontre le problème que si la fiche n'est pas déjà ouverte dans Adobe dans une autre fenêtre ça ne fonctionne pas de mon côté.
Merci à toi pour ton aide.
Lucie
 

Pièces jointes

  • Pdf2Xls_02_FSO.xls
    104 KB · Affichages: 3

Lulu974

XLDnaute Nouveau
Bonjour à tous

Une 1ère ébauche PowerQuery (j'ai modifié 2 codes de ton Excel qui avaient 14 caractères avec un 9 devant...)
Modifier le chemin d'accès de la cellule jaune et les paramètres de PowerQuery
Fichier, Options et paramètres, Options de requête, partie GLOBAL : Confidentialité, Toujours ignorer les paramètres de niveau de confidentialité

Aucune idée de temps sur 9000 fichiers...
Bonjour @chris
Merci pour ton retour. Je viens de tester l'alternative PowerQuery. Ca a l'air de fonctionner. En revanche je vois qu'elle fonctionne pour certain des PDF que j'ai communiqué. J'ai poussé le test avec d'autres PDF et là ça ne fonctionne pas trop pour certaines fiches :( . C'est super bizarre. Lorsque je regarde dans la requête "développée" PDF le EAN/GTIN n'apparaît pas pour certaines fiches notamment la fiche 4 la fiche 9.
J'ai loupé quelques chose peut être ?
Peux-tu me dire si c'est chez moi le problème ?
Je te remets ci-joint les 11 PDF que j'ai testé dans le fichier PowerQuery que j'ai testé que je te remets également ci-joint.
Merci pour ton aide @chris
 

Pièces jointes

  • Recherche_GTIN_PDF_PQ_V1-Test_Lulu.xlsx
    23.3 KB · Affichages: 4
  • 2599_Fiche_7.pdf
    130.1 KB · Affichages: 7
  • 2101_Fiche_10.pdf
    105.7 KB · Affichages: 4
  • 2101_Fiche_6.pdf
    105.7 KB · Affichages: 4
  • 2090_Fiche_5.pdf
    74.5 KB · Affichages: 4
  • 2056_Fiche_4.pdf
    39.6 KB · Affichages: 4
  • 2054_Fiche_3.pdf
    53 KB · Affichages: 3
  • 859_Fiche_2.pdf
    138.6 KB · Affichages: 3
  • 758_Fiche_1.pdf
    130.9 KB · Affichages: 3
  • 334_Fiche_11.pdf
    176.8 KB · Affichages: 6
  • 2935_Fiche_8.pdf
    147.9 KB · Affichages: 4
  • 2985_Fiche_9.pdf
    128.2 KB · Affichages: 4

kiki29

XLDnaute Barbatruc
Salut, voir la remarque en début de procédure Pdf2Txt sur l'usage des sendkey$ avec le Reader , il y a aussi certaines fois à jouer sur la valeur de la const Tempo ici à 750 ms. Car ici tout fonctionne.
 

Pièces jointes

  • 1.png
    1.png
    7.5 KB · Affichages: 19
  • Essai.xls
    29 KB · Affichages: 5

Discussions similaires