XL 2016 travail sur tableau

Boostez vos compétences Excel avec notre communauté !

Rejoignez Excel Downloads, le rendez-vous des passionnés où l'entraide fait la force. Apprenez, échangez, progressez – et tout ça gratuitement ! 👉 Inscrivez-vous maintenant !

finarobert

XLDnaute Occasionnel
Supporter XLD
bonsoir
je cherche à faire deux programmes.
je possède un tableau excel avec 3 onglets : solutions, semblables et doublons (voir fichier joint)
l'onglet solutions est l'onglet de base et connu. Il n'y a que la première colonne d'alimenté. Comment est-elle construite?
Il y a des mots (voir 2726 en A1, 6746 en A184) et en dessous des paquets de 2 lignes avec la première ligne qui commence par >sp, c'est la ligne identité et une deuxième ligne qui commence par >c. Cette deuxième ligne porte les données de la ligne 1 qui comporte le mot en question (2726 en A1), on met alors ce mot en caractère gras.
onglet "semblables"
premier programme : on retrouve toutes les lignes identités qui ont au moins 2 mots dans leur ligne de données
deuxième programme : onglet doublons. Plus compliqué. le début de la ligne identité commence par une structure genre <sp IAb3DE.4 I. Deux identités sont considérés identiques sont sont considérés doublons lorsque les caractères voir exemple Ab3D sont identiques. On commence au premier caractère après la barre I et on finit à l'avant dernier caractère avant le point (D dans l'exemple)
merci pour le coup de main
Robert
 
bonsoir
je cherche à faire deux programmes.
je possède un tableau excel avec 3 onglets : solutions, semblables et doublons (voir fichier joint)
l'onglet solutions est l'onglet de base et connu. Il n'y a que la première colonne d'alimenté. Comment est-elle construite?
Il y a des mots (voir 2726 en A1, 6746 en A184) et en dessous des paquets de 2 lignes avec la première ligne qui commence par >sp, c'est la ligne identité et une deuxième ligne qui commence par >c. Cette deuxième ligne porte les données de la ligne 1 qui comporte le mot en question (2726 en A1), on met alors ce mot en caractère gras.
onglet "semblables"
premier programme : on retrouve toutes les lignes identités qui ont au moins 2 mots dans leur ligne de données
deuxième programme : onglet doublons. Plus compliqué. le début de la ligne identité commence par une structure genre <sp IAb3DE.4 I. Deux identités sont considérés identiques sont sont considérés doublons lorsque les caractères voir exemple Ab3D sont identiques. On commence au premier caractère après la barre I et on finit à l'avant dernier caractère avant le point (D dans l'exemple)
merci pour le coup de main
Robert
 

Pièces jointes

l'onglet semblables et doublons du fichier excel ont été complétés à la main pour vision de l'attendu
cordialement
robert
C'est une blague ou quoi. que contient ton fichier (image ci-dessous)
1758870813418.png
 
Bonjour

Doublons est facile à faire par PowerQuery (tu as 2 lignes en trop dans ton exemple)

Pour Semblables : tu indiques
l'onglet solutions est l'onglet de base et connu. Il n'y a que la première colonne d'alimenté. Comment est-elle construite?
Il y a des mots (voir 2726 en A1, 6746 en A184) et en dessous des paquets de 2 lignes avec la première ligne qui commence par >sp, c'est la ligne identité et une deuxième ligne qui commence par >c. Cette deuxième ligne porte les données de la ligne 1 qui comporte le mot en question
mais il y a 3 lignes qui commencent par >sp mais sont suivies de 2 lignes commençant par <c
il s'agit pour la 1ère de
>sp|Q8WZ42.4|TITIN_HUMAN RecName: Full=Titin; AltName: Full=Connectin; AltName: Full=Rhabdomyosarcoma antigen MU-RMS-40.14

Est-ce une erreur ? Si non, on cherche le Mot dans les 2 lignes ?
 
Dernière édition:
Bonsoir
merci Cathodique, TooFatboy et Chris pour vos remarques
Ce fichier fait partie d'une étude d'étudiant sur certaines protéines. Je me suis engagé de l'aider mais il y a des moments où je coince dur!
Chris tu as raison c'est une erreur les 3 lignes qui commencent par sp et les deux par <c. Je ne connais pas Powerquery, je vais regarder
cordialement
Robert
 
RE
Je peux te fournir les requêtes : un pour Doublons et une pour Semblables mais il faut être sûr qu'il n'y a bien qu'un c pour un sp...
Merci Chris, je ne sais pas où apparait ma dernière réponse alors je la réécris, il y a bien un sp suivi d'un<c unique.
le nombre de lignes total par contre est variable suivant le nombre de protéines regardées
cordialement
Robert
 
Re

J'ai supprimé les lignes en trop dans l'onglet Solution_C

Pour info la plage est nommée Sol_C par formule : on prend le nombre de lignes de l'onglet + 50 pour tenir compte des lignes sautées.

Une requête retraite partiellement cette base puis les 2 autres font les Doublons et les Semblables
 

Pièces jointes

Dernière édition:
- Navigue sans publicité
- Accède à Cléa, notre assistante IA experte Excel... et pas que...
- Profite de fonctionnalités exclusives
Ton soutien permet à Excel Downloads de rester 100% gratuit et de continuer à rassembler les passionnés d'Excel.
Je deviens Supporter XLD

Discussions similaires

Réponses
19
Affichages
548
Réponses
1
Affichages
2 K
Retour