recherche de doublons entre deux colonnes et répartition en 3 colonnes

steph

XLDnaute Nouveau
Bonjour
Pour mon travail, je cherche à analyser des listes de gènes. Dans le cas simple, j'ai 2 liste de gènes (Genbank 1 et 2 du fichier joint). Je cherche à trouver de façon automatique lesquels se retrouvent dans les deux listes. Puis de créer automatiquement 3 colonnes: ceux uniques à Genbank1, ceux uniques à Genbank2, et ceux se trouvant dans les deux listes.

Pour compliquer un peu, à chaque gènes est associé une valeur (un nombre positif ou négatif). Cette valeur doit rester à côté du nom des gènes dans les 3 nouvelles colonnes. Dans le cas des gènes communs, il y a alors deux valeurs pour un même gène. J'a besoin de garder ces deux valeurs, peu importe la présentation (nouvelle colonne ou autre).

L'idée est que par la suite, j'ai juste à faire copier/coller de nouvelles listes pour les comparer entre elles, de façon automatique.

Certains d'entre vous auront peut être vu que je cherche à réaliser un diagram de Venn en quelque sorte.

Mes compétences en excel sont trop basiques pour y arriver seul.
J'utilise excel 2004 sous Mac

merci d'avance pour vos conseils
 

Pièces jointes

  • analyse gènes.xls
    39 KB · Affichages: 104
  • analyse gènes.xls
    39 KB · Affichages: 107
  • analyse gènes.xls
    39 KB · Affichages: 111

ROGER2327

XLDnaute Barbatruc
Re : recherche de doublons entre deux colonnes et répartition en 3 colonnes

Bonjour steph
(…)
Pour compliquer un peu, à chaque gènes est associé une valeur (un nombre positif ou négatif).
(…)
Sauf qu'en réalité, chaque gènes est associé à une ou plusieurs valeurs.
(Banque de gènes 1 : AY061571 associé à 3.63 et 3.6.
Banque de gènes 2 : AY061571 associé à 4.12 et 4.01.)
Merci de donner complètement la règle du jeu.​
ROGER2327
#4872


Mardi 17 Décervelage 138 (Saint Mandrin, poète et philosophe, SQ)
25 Nivôse An CCXIX
2011-W02-5T10:35:39Z
 

hoerwind

XLDnaute Barbatruc
Re : recherche de doublons entre deux colonnes et répartition en 3 colonnes

Bonjour et bienvenu sur le forum,

Dans GenBank1 (colonne a) il y a aussi des doublons, par exemple A5 et A6.
Que faut-il en faire, en reporter un en colonne E, avec les deux valeurs, ou les deux sur deux lignes avec leurs valeurs ?

Édition : salut Roger, pas vu, mais même combat !
 

steph

XLDnaute Nouveau
Re : recherche de doublons entre deux colonnes et répartition en 3 colonnes

Oups! désolé, j'avais oublié certains détails de mes expériences qui font qu'on peut se retrouver avec deux Genbank identiques dans une même colonne.:eek:

J'ai réactualisé mon fichier avec d'autres identifiants de mes données. Cette fois ils sont uniques.
 

Pièces jointes

  • analyse gènes.xls
    41.5 KB · Affichages: 82
  • analyse gènes.xls
    41.5 KB · Affichages: 91
  • analyse gènes.xls
    41.5 KB · Affichages: 87

steph

XLDnaute Nouveau
Re : recherche de doublons entre deux colonnes et répartition en 3 colonnes

Re,

Il faut reprendre alors le premier fichier ?

Idéalement oui.

Mais je ne veux pas abuser de votre temps. Si le cas 1 seul identifiant unique par colonne est plus simple, alors je peux trouver de mon coté un moyen de ne garder qu'un seul identifiant (mais je perdrais quelque informations expérimentales).

merci d'avance
 

ROGER2327

XLDnaute Barbatruc
Re : recherche de doublons entre deux colonnes et répartition en 3 colonnes

Re…
Un essai dans le classeur joint. C'est brut de décoffrage, assez lent (~30 s chez moi), mais c'est juste pour savoir si les résultats trouvés sont ceux attendus, car je ne suis pas certain d'avoir tout compris…

Pour lancer le calcul : double-clic sur la cellule A1.

Si on est sur la bonne voie, il sera temps d'optimiser et de faire quelque chose de plus propre.​
ROGER2327
#4873


Mardi 17 Décervelage 138 (Saint Mandrin, poète et philosophe, SQ)
25 Nivôse An CCXIX
2011-W02-5T15:23:50Z
 

Pièces jointes

  • Copie de analyse gènes.xls
    31.5 KB · Affichages: 98

steph

XLDnaute Nouveau
Re : recherche de doublons entre deux colonnes et répartition en 3 colonnes

Re…
Un essai dans le classeur joint. C'est brut de décoffrage, assez lent (~30 s chez moi), mais c'est juste pour savoir si les résultats trouvés sont ceux attendus, car je ne suis pas certain d'avoir tout compris…

Pour lancer le calcul : double-clic sur la cellule A1.

Si on est sur la bonne voie, il sera temps d'optimiser et de faire quelque chose de plus propre.​
ROGER2327
#4873



Mardi 17 Décervelage 138 (Saint Mandrin, poète et philosophe, SQ)
25 Nivôse An CCXIX
2011-W02-5T15:23:50Z

excellent!
J'ai essayé avec d'autres données, ça marche impeccable!
Je vais essayer la semaine prochaine avec des séries de 20 000 données pour comparer avec des résultats obtenus différemment et de façon très fastidueuse.
 

ROGER2327

XLDnaute Barbatruc
Re : recherche de doublons entre deux colonnes et répartition en 3 colonnes

Re...
Tant mieux si "ça marche", mais avec 20 000 données, ce sera très lent : je pense que le temps d'exécution doit croître au moins proportionnellement au carré du nombre de données. Comme l'optimisation est un travail assez long, je souhaiterais que vous confirmiez qu'il n'y a pas de modification de principe à envisager avant que je l'entreprenne. Merci d'avance.​
ROGER2327
#4875


Mardi 17 Décervelage 138 (Saint Mandrin, poète et philosophe, SQ)
25 Nivôse An CCXIX
2011-W02-5T17:15:46Z
 

laetitia90

XLDnaute Barbatruc
Re : recherche de doublons entre deux colonnes et répartition en 3 colonnes

bonjour steph ,hoerwind , ROGER
pas si simple le pb..... je pense que passer par Dictionary plus rapide que collection
un exemple en utilisant les colonnes inter de colonne k a p.Une approche assez simpliste pas optimiser du tout a tester..... par contre je sais pas sur Mac si ca marche
 

Pièces jointes

  • test.zip
    19.2 KB · Affichages: 44
  • test.zip
    19.2 KB · Affichages: 47
  • test.zip
    19.2 KB · Affichages: 46

ROGER2327

XLDnaute Barbatruc
Re : recherche de doublons entre deux colonnes et répartition en 3 colonnes

Re...
(…) je pense que passer par Dictionary plus rapide que collection
..... par contre je sais pas sur Mac si ca marche (…)
Entièrement d'accord. À tout hasard, je dépose ma proposition à coup de "Scripting.Dictionary".
(Pour lancer le calcul : double-clic sur la cellule A1.)​
ROGER2327
#4877


Mercredi 18 Décervelage 138 (Saints Pirates et Flibustiers, thaumathurges, SQ)
26 Nivôse An CCXIX
2011-W02-6T18:31:49Z
 
Dernière édition:

Paritec

XLDnaute Barbatruc
Re : recherche de doublons entre deux colonnes et répartition en 3 colonnes

Re Bonsoir Tous,
alors j'avais pas vu qu'il y avait deux fichiers différent
alors voilà avec le deuxième
a+
papou :eek:
 

Pièces jointes

  • analyse gènes1.zip
    22.1 KB · Affichages: 45

ROGER2327

XLDnaute Barbatruc
Re : recherche de doublons entre deux colonnes et répartition en 3 colonnes

Suite…
J'ai fait une erreur dans le message #12 : le fichier joint n'est pas le bon.
Je dépose donc la version correcte.
Mais pas sûr que MAC soit d'accord !​
ROGER2327
#4878


Mercredi 18 Décervelage 138 (Saints Pirates et Flibustiers, thaumathurges, SQ)
26 Nivôse An CCXIX
2011-W02-6T23:52:01Z
 

Pièces jointes

  • VENN_2.xls
    31.5 KB · Affichages: 114
Dernière édition:

Discussions similaires

Statistiques des forums

Discussions
312 506
Messages
2 089 122
Membres
104 039
dernier inscrit
ERe