Bonjour,
Je dois travailler avec des fichiers csv de plus d'1 million de ligne et près de 80 champs. Un csv fait environ 800 Mo. C'est beaucoup trop gros et je dois faire des contrôles en tout genre sur chaque champ pour valider les fichiers. Egalement je dois songer aux personnes qui vont ensuite devoir contrôler ces données.
Pas moyen d'importer un csv dans Access car ça dépasse largement les 2Go. En liant le csv, ça marche mais je vous raconte pas la lenteur d'exécution des requêtes de contrôle.
Question 1 : Comment faire pour gérer des fichiers de données gigantesques avec des petits moyens svp ?
Question 2 : Vu les dimensions des csv, par lot de combien de lignes découperiez-vous les csv pour avoir un volume supportable afin de pouvoir exécuter des contrôles dans une perspective Access d'une part (contrôle par exécution de requêtes successives) et dans une perspective Excel d'autre part (contrôle par formules et/ou vba - fonctions personnelles) ?
Je précise que je vais devoir traiter environ 80 fichiers csv. Alors si je dois divise chaque csv par 10 je vais devoir lancer le programme de contrôle 800 fois. Si je découpe en 100 je vais devoir lancer le programme de contrôle 8000 fois. Je préfère lancer 8000 fois un programmes très rapide que 800 fois un programme très lent (plus de 10 fois trop lent par rapport au premier
Je ferai bien des tests mais mon programme de contrôle n'est pas encore créer car justement je ne sais pas encore quel techno choisir. Dans Access, par exemple, je peux faire un programme qui va boucler sur les 800 csv (ou 8000), changeant la liaison et lançant le contrôle par requête. Dans Excel, je peux par exemple créer un masque de contrôle par formule que j'enregistre dans un classeur, et je change la source en bouclant sur tous les fichiers csv. Exemple, en Feuille1 la source à contrôler (import csv), en feuille 2 les résultats automatiques du contrôle par un jeu de formules. Et je boucle sur les fichiers csv ...
J'en appelle donc à vos retours d'expériences sur Excel et sur Access pour traiter des gros volumes.
Dans tous les cas je vais boucler mais globalement vous feriez cela où ?
Merci d'avance,
David
Je dois travailler avec des fichiers csv de plus d'1 million de ligne et près de 80 champs. Un csv fait environ 800 Mo. C'est beaucoup trop gros et je dois faire des contrôles en tout genre sur chaque champ pour valider les fichiers. Egalement je dois songer aux personnes qui vont ensuite devoir contrôler ces données.
Pas moyen d'importer un csv dans Access car ça dépasse largement les 2Go. En liant le csv, ça marche mais je vous raconte pas la lenteur d'exécution des requêtes de contrôle.
Question 1 : Comment faire pour gérer des fichiers de données gigantesques avec des petits moyens svp ?
Question 2 : Vu les dimensions des csv, par lot de combien de lignes découperiez-vous les csv pour avoir un volume supportable afin de pouvoir exécuter des contrôles dans une perspective Access d'une part (contrôle par exécution de requêtes successives) et dans une perspective Excel d'autre part (contrôle par formules et/ou vba - fonctions personnelles) ?
Je précise que je vais devoir traiter environ 80 fichiers csv. Alors si je dois divise chaque csv par 10 je vais devoir lancer le programme de contrôle 800 fois. Si je découpe en 100 je vais devoir lancer le programme de contrôle 8000 fois. Je préfère lancer 8000 fois un programmes très rapide que 800 fois un programme très lent (plus de 10 fois trop lent par rapport au premier
Je ferai bien des tests mais mon programme de contrôle n'est pas encore créer car justement je ne sais pas encore quel techno choisir. Dans Access, par exemple, je peux faire un programme qui va boucler sur les 800 csv (ou 8000), changeant la liaison et lançant le contrôle par requête. Dans Excel, je peux par exemple créer un masque de contrôle par formule que j'enregistre dans un classeur, et je change la source en bouclant sur tous les fichiers csv. Exemple, en Feuille1 la source à contrôler (import csv), en feuille 2 les résultats automatiques du contrôle par un jeu de formules. Et je boucle sur les fichiers csv ...
J'en appelle donc à vos retours d'expériences sur Excel et sur Access pour traiter des gros volumes.
Dans tous les cas je vais boucler mais globalement vous feriez cela où ?
Merci d'avance,
David