Fusion de lignes dans calc

Bonjour

Dans un "survey", je récolte régulièrement des données de la part d'un
groupe de personnes volontaires.
Pour pouvoir analyser l'évolution des réponses, j'ai besoins de fusionner
chaque "survey", soit plusieurs fichiers calc.

Donc il me faudrait une fonction, je suppose, qui aille lire la colonne clef
(l'e-mail est l'ID que j'ai retennu) de chaque fichier et qui ajoute la
ligne correspondante dans une feuille.

Je n'ai aucune idée de comment faire ... :slight_smile:

La fonction correspondante en bash serait "join". En sql on pourrait
facilement faire un select, mais dans calc j'ai aucune idée et je ne trouve
pas les bons mots clef pour trouver la doc.

J'avais pensé créer une feuille par fichier, copier/coller chaque fichier
dans chaque feuille, puis écrire une formule qui aille recherche l'info.
C'est quel type de formule qui peut faire ça ?

Mille merci d'avance

Bonjour,

Ca ressemble aux tableaux croisés dynamiques.

Régis Perdreau

Bonjour
vu ce que tu décris, pourquoi n'as tu pas essayé Base ? Car tu sais
exactement comment faire en sql on dirait, non ?un fichier tableur peut
être utilsié comme source de données (et plusieurs aussi, à l'import,
tu auras autant de tables que de fichiers...)
Dans Calc
pour reprendre le contenu des différents fichiers, une feuille par
réponsesolution 1 : macro (je laisse les gens compétents
compléter)solution 2 : un lien vers les fichiers (à la condition qu'en
cas de mise à jour les fichiers aient toujours le même nomsolution 3 :
copier les feuilles via le navigateur (pour simplifier la manip) :tous
les fichiers sont ouverts, tu es dans le fichier final, et via le
naviagateur (en mode copie) ntu glisses la feuille de chaque fichier.
ce que je ne comprends pas c'est ta clé sur le mailqu'est ce qui évolue
? Les réponses d'une personne, ou de façon plus générale, les réponses
à ton formulaire ?
Pour fusionner toutes les réponses... ben si toutes les réponses
étaient dans une seule et même feuille tu pourrais faire une recherche
sur l'ID + la question une recherche sur un seul critère : recherche
vune recherche sur plusieurs critères : index / equiv ou sommeprod
si ce n'est pas suffisnat, dis-nous !
Claire

arf, ben si oui, je vois pas bien...dans ce cas, la limite c'est quand
même toujours un fichier, ou une feuille (peu importe) par "survey"
Mais si on a une seule feuille avec toutes les données, pourquoi pas ?
Claire

Bonjour,

Sans plus de précision sur la forme des données en entrée, le type de traitement, et le résultat souhaité, on ne pourra que discuter dans le vide,  où bien jouer à Mme Irma :slight_smile:

Cordialement,

JM

Bonjour,
Je ne sais pas combien de fichier tu as à traiter, mais si pas trop,

Je pense que tu dois utiliser - Feuille - Insérer une feuille à partir d'un
fichier - <sélectionner fichier survey1>.
ça va te créer une NOUVELLE feuille avec le contenu du survey1.
copier - coller le contenu total de cette feuille et le coller dans ta
"Feuille1" (feuille originale de ton tableur).
(idem pour chaque fichier)
et tu traites tes données à partir de "feuille1".

nb: google forms fait cette opération automatiquement pour toi de mémoire...
Yves

J'avais pensé créer une feuille par fichier, copier/coller chaque fichier
dans chaque feuille, puis écrire une formule qui aille recherche l'info.
C'est quel type de formule qui peut faire ça ?

Ce genre de travail répétitif est typique d'une macro, mais il faut avoir une idée de la forme des données.

Cordialement,

Bonjour à tous

Merci pour toutes ces réponses !
Je fais un petit récap dans l'ordre :

*Base*
Ce serait une option, cependant:
- Je ne connais pas du tout Base. Mes compétences en DB se limitent à du
sysadmin.
- Je suis sensé tenir les données anonymisées à dispo. Or je ne peux pas
exiger des autres qu'ils disposent et connaissent le logiciel Base. Avec
calc je peux leur envoyer un fichier excel.
De plus un fichier calc c'est plus visuel.

*les tableaux dynamiques croisés*
J'ai tenté de comprendre comme ça marche et à quoi ça sert.
Est-il possible d'avoir plusieurs sources - plusieurs feuilles - qu'on
récapitule dans un même tableau ou faut-il d'abord réunir toutes les données
en un seul tableau pour ensuite l'analyser avec le TDC ?
Au pire, je pourrai faire un TDC une fois les données réunies, ça va bien me
servir, merci !

*index / equiv ou sommeprod*
Cool merci !
Ces outils sont effectivement utilisables.
Vu la taille des donnés à analyser (environ 1000 lignes et 200 colonnes) ça
va me faire du travail et pas mal de possibilités d'erreurs, mais c'est
jouable.

* forme des données en entrée, le type de traitement, et le résultat
souhaité*
Bonjour Mme Irma
La forme des données est issue de survey. Probablement surveyguizmo.
Chaque survey génère un fichier dans lequel chaque ligne représente les
réponses d'une personne, avec des identifiants, la date de la réponse et
autre.
Le résultat est une analyse statistique avec des graph et des %.

*Yves*
Oui je pensais regrouper les données, une feuille par fichier source. Je
devrais avoir 4 fichiers donc c'est pas le soucis.
Par contre pour le récapitulatif en feuille 1, j'avais pas trouvé index et
equiv qui permettent d'aller chercher les données.

*Jean-Michel COSTE*
Je ne sais pas faire de macro. As-tu un tuto à me conseiller ?

Merci à tous !

Bonjour,

Pour le récap en 1 feuille, pas besoin de Index ou equiv ?? tout est sur la
même feuille. (feuille1) vu que tu as tout collé dedans (la feuile1 est
censée contenir le contenu de tes 4 fichiers importés).
Il suffit ensuite de travailler sur cette feuille1 seule.
si ces 4 feuilles doivent être "différenciées", réponse des mêmes personnes
dans le temps, alors dans la feuille1, tu dois ajouter une colonne
spécifiant par exemple "Fichier1", "Fichier2", "Fichier3","Fichier4", qui
te permettra ensuite de savoir de quel fichier provenait la réponse.

Ensuite pour triturer ces lignes, le mieux, c'est d'utiliser données -
table dynamique. (très facile une fois qu'on a compris le système :wink: ).
si tu m'envoies des fichiers "exemples" (sans données confidentielles), je
peux te préparer un modèle.

Yves

*@Yves dutrieux*

Merci pour la réponse.
Je vais donner un petit exemple pour qu'on se comprenne bien ...
C'est un suivis d'arrêt tabagique. Il y aura plein de questions, j'en met
juste deux pour l'exemple.
Je devrais avoir environ 1000 réponses par année, donc 1000 lignes, ce qui
fait d'assez gros tableaux.

source

Bonjour,

De prime abord, comme ça (et après avoir regardé ton message de 19h47, même s'il était devenu un peu moins lisible), j'aurais tendance à penser "Base".

Tu n'as pas besoin que ceux qui saisissent les données connaissent Base ; tu peux leur envoyer un Calc ou un Excel et lorsque le truc revient, tu l'ouvres et le sauvegardes au format csv (ou mieux encore, tu demandes à l'opérateur de saisie de le sauvegarder ainsi - Enregistrer sous- et de te le repasser en pièce jointe, tel quel) ; ensuite, ajouter le contenu du csv dans Base est tout ce qu'il y a de simple.

Ensuite, les calculs, les stats, les regroupements, tout ça, c'est le coeur de métier des SGBD ; du coup, tu peux parfaitement sortir tes données, tout en en supprimant certaines pour la cosmétique (pour permettre une présentation anonymisée par exemple), tout en ayant l'information dans ta base.

En tout cas, vu d'ici, ça me semble le plus proche de ce que tu veux faire.

(je précise que pour ce qui me concerne, j'ai abordé les bases de données avec Base, à l'époque de OOo 2.0 ; ça a des limites, ce n'est -apparemment- pas l'axe privilégié de développement de la suite, mais c'est un bon moyen de se familiariser avec le sujet ; depuis, je me suis un peu éloigné de Base, il y a un peu longtemps que je ne l'ai pas ouvert et j'éprouverais surement des difficultés à dépanner quelqu'un ici, mais si on doit traiter souvent des données, je pense que ça vaut la peine de d'investir un peu de temps dans la prise en main du truc)

Bonne soirée en tout cas.

Voici ce que je vois en gros :
nb: ce qui m'étonne c'est que les survey1 et survey2 ne contiennent pas les
mêmes données (en général, si ce sont des surveys à la suite, ils
contiennent le même nombre de champs - même si pas rempli).

Yves

Merci Nicolas
on avance avec ces infostes "enquêtés" répondent toujours au même
questionnaire, et quand tu as le résultat à 2 semaines, un mois, tu as
les résultats des périodes précédentes dans le même fichier en entrée
(des colonnes supplémentaires dans le fichier) ?? ou tu obtiens un
fichier séparé par période + individu ??
oui ce que tu fait s'approche du traitement statistique et j'ai donc un
peu l'habitude de cottoyer ce genre de problématiques... mais tu ferais
des choses plus sympa avec d'autres outils/langages... (R, Python par
exemple... si tu connais le SQL, tu vas pouvoir en faire avec R et
Python en regroupant tes fichiers)quand à ce que tu imposerais ensuite
au relecteur, ben ça ne conditionne rien, il suffit de faire un export
en csv, ou autre.... (c'est aussi valable pour Base)
Est-ce que ton moteur de questionnaire peut te poposer directement un
export des résultats pour tous les individus en un seul fichier
? (typiquement, certains le font, et j'insiste un fichier tableur ods,
xls ou texte csv... est une source de données exploitable pour Base)
Si oui : pas besoin de macro, il est probable que tu aies la
présentation voulue : une ligne par individu et chaque question en
colonneSi non, il faudrait une macro pour regrouper l'ensemble des
résultats par individus / question avec la disposition adequates=> pour
ça il y a bien quelqu'un qui pourra te dire comment faire. Mais je
trouve vraiment dommage dans ce cas de ne pas passer par R, Python, qui
te permettront de faire l'analyse des données derrière. Qui seront
beaucoup plus puissant pour générer des graphiques que tu pourras
rafraichir avec les nouvelles données. Voir (moi je ne fais pas, mais
j'ai des collègues qui y passent leur journée) de générer un document
textuel avec des tableaux, des graphiques qui s'actualisent à chaque
période... (R+ Markdown) avec une sortie possible odt/pdf/html (donc
site web...)

si tous tes résultats sont dans un même tableau (1000 lignes c'est
rien, 5 ou 10 000 un peu plus !) avec une ligne par individu+question
=> n'est ce pas finalement le résultat final que tu souhaites ???(bon
si tu as besoin ensuite d'analyser ces résultats, le sommeprod/index-
equiv te permet de recupérer les résultats pour une question données,
pour chaque individu.
@yves je crois : pourquoi je parlais d'index/equiv (ou sommeprod que je
préfère) : parce qu'il y a une correspondance sur 2 conditions le
couple individu et question, et pas seulement l'individu...
Pour la table dynamique, il me semble que ça coince quelque part car tu
ne cumules rien... et la table dynamique a pour role de faire des
calculs par ensemble, moins de fusionner des "libellés" (quand bien
même il s'agisse de chiffres). Je confirme que tu ne peux pas générer
une table dynamique à partir d'une sélection multiple. Ce n'est pas son
rôle de toute façon. Il vaut mieux utiliser chaque outil et
fonctionnalités pour ce pour quoi ils sont fait, sinon on se complique
la vie pour contourner le fonctionnement prévu, et on se prépare à des
surprises en cas d'évolution...
Le truc le moins agréable mais qui est possible (je déconseille, mais
certains le font) : tu construis ton tableau de base avec ta colonne
individu et chacune des questions. Selon tes fichiers d'entrée (un seul
par individu, incrémenté ou un fichier par période par individu), tu
paramètres tes fonctions de recherche (vers ces fichiers) à partir du
moment où tes noms de fichiers sont normés, tu peux le faire par
anticipation. Mais je trouve ça vraiment mauvais, et source d'erreur...
(les fonctions avec des liens vers des fichiers "externes" c'est
sensible à cause du chemin du fichier, et du coup d'un calcul effectué
à partir d'un autre fichier...)
Bonne journée
Claire

Hello à tous

Encore merci pour toutes ces réponses.
Ancien utilisateur de usenet, cela me rappelle bien des souvenirs :slight_smile:
Vous êtes au top.

@Claire
Je n'ai hélas pas le temps ni l'énergie d'apprendre de nouveaux langages
de statistiques, ou un nouveau logiciel de base de données.
Dans une ancienne vie d'étais informaticien donc j'ai quelques
notions mais je suis désormais patron et débordé.

Je comprend bien votre réaction, le mec il veux bricoler avec calc alors
qu'il y a des outils plus performants. Sauf que j'ai pas 40 heures à
consacrer à l'analyse de ces données, il faut que j'avance.
Etudier R+python ou simplement Base, c'est trop long je ne peut pas.

Donc je répète ma question, désolé pour la mise en page j'ai pas encore
compris comment nabble fonctionne.

Bonjour,

C'est beaucoup plus clair.

N'est-ce pas directement l'objectif et l’utilisation de la fonction Données | Consolider avec les options jointes de "Étiquettes de lignes " et "Étiquettes de colonnes" ??

(et tu remplaces les oui/non par 0/1 si possible dans le formulaire).

Application de ton exemple ici :
https://www.cjoint.com/c/JImuFxnzhTn

Bonne soirée

Oupss...
Fichier joint avant l'enregistrement...

Voici :
https://www.cjoint.com/c/JImuKZ3pF7n

Ça fonctionne même sans avoir à sélectionner la zone de données complète (les 1000 lignes), il suffit de sélectionner la cellule A1 de chaque feuille et ça sort ton tableau sans autre langage de prog, sans Base, sans macro, sans formule, et le tout avec les données de résultat liées aux feuilles sources !

https://www.cjoint.com/c/JImuYy36Lzn

Bon, cellule A1 seulement, c'est peut-être une bêtise, c'est Calc qui semble conserver les consolidations même si l'on supprime la zone.

Bonjour,

La démo complète en 1'30 :

https://www.cjoint.com/c/JImvHrbnAFn

Génial Stéphane !
tu m'as fait découvrir la consolidation que je n'avais jamais utilisé.

Yves