Bonjour,
J'ai plusieurs documents, plus précisément des arrêtés. Je voudrais extraire certaines données "noyées" dans le texte vers une base de données Excel. La difficulté c'est que j'ai 1500 arrêtés!! Je dois trouver le moyen d'extraire ces informations de tous ces arrêtés automatiquement.
Voici un exemple visible ci dessous :
" Par arrêté de la ministre de l'écologie, du développement durable, des transports et du logement et du ministre auprès de la ministre de l'économie, des finances et de l'industrie, chargé de l'industrie, de l'énergie et de l'économie numérique, en date du 19 avril 2011, la SAS Q-Cells Meaux Solaire, dont le siège social est situé tour Part-Dieu, 129, rue Servient, 69326 Lyon Cedex 03, est autorisée à exploiter une installation photovoltaïque, d'une capacité de production de 11,15 MWc, localisée lieudit Le Fonds des Carrières, La Pièce aux Cannes, 77100 Meaux. Cette autorisation ne dispense pas son bénéficiaire d'obtenir les titres requis par d'autres législations. "
Tout ce qui est en rouge doit se retrouver dans une base de donnée dont les champs devrons êtres: "date d'arrêté", "nom société", "siège social", "adresse", "code postal", "type énergie", "puissance/ capacité de production", "lieu dit", "adresse du site géographique"...
De plus cette opération doit se faire pour plusieurs centaines de fichiers word (ou pdf) de même format sauf que biensur l'information en rouge change afin de pouvoir remplir ma base de données.
J'espère que vous pourrez trouver une solution parce que là je sais plus quoi faire et l'échéance approche bientôt!!!!
merci pour tout😉
J'ai plusieurs documents, plus précisément des arrêtés. Je voudrais extraire certaines données "noyées" dans le texte vers une base de données Excel. La difficulté c'est que j'ai 1500 arrêtés!! Je dois trouver le moyen d'extraire ces informations de tous ces arrêtés automatiquement.
Voici un exemple visible ci dessous :
" Par arrêté de la ministre de l'écologie, du développement durable, des transports et du logement et du ministre auprès de la ministre de l'économie, des finances et de l'industrie, chargé de l'industrie, de l'énergie et de l'économie numérique, en date du 19 avril 2011, la SAS Q-Cells Meaux Solaire, dont le siège social est situé tour Part-Dieu, 129, rue Servient, 69326 Lyon Cedex 03, est autorisée à exploiter une installation photovoltaïque, d'une capacité de production de 11,15 MWc, localisée lieudit Le Fonds des Carrières, La Pièce aux Cannes, 77100 Meaux. Cette autorisation ne dispense pas son bénéficiaire d'obtenir les titres requis par d'autres législations. "
Tout ce qui est en rouge doit se retrouver dans une base de donnée dont les champs devrons êtres: "date d'arrêté", "nom société", "siège social", "adresse", "code postal", "type énergie", "puissance/ capacité de production", "lieu dit", "adresse du site géographique"...
De plus cette opération doit se faire pour plusieurs centaines de fichiers word (ou pdf) de même format sauf que biensur l'information en rouge change afin de pouvoir remplir ma base de données.
J'espère que vous pourrez trouver une solution parce que là je sais plus quoi faire et l'échéance approche bientôt!!!!
merci pour tout😉