Recherche dans plusieurs fichiers

Bonjour Bernard,

Je viens d'essayer ce DocFetcher sur les 30.000 pages du Vlaamse Stam de
1964 à 2001 (CD vendu par le VVF). Le résultat est super rapide. Tous
les fichiers - un par année - sont des .pdf et sont examinés en quelques
secondes. Excellent outil, merci pour le tuyau.

Henri De Backer

Bonjour,

Je travaille avec Copernic Desktop Search Light qui indexe bien toutes les formats et exclut des dossiers à souhait (par exemple le dossier programmes).

DocFetcher est-il capable de travailler sur plusieurs dossiers qui ne sont pas arrangés de manière hiérarchique ?
J'aurai des dossiers à indexer sur le bureau, mais aussi dans c:\pc\documents, à l'exception de c:\pc\telechargements.
Est-ce possible ? Je n'ai pas trouvé la bonne solution.

Merci
- ftr

Bonjour ,

Une autre solution... l'excellent... le plus rapide.... en local ou en réseau : il s'agit de*Wilbur* !!! Le *meilleur* en libre: il lit instantanément dans les fichiers odt, zip, doc, etc...

J'ai créé une GED (côté moteur de recherche) pour les administrations à partir de cet outil d (1,1 Mo seulement à installer)

http://www.framasoft.net/article1613.html
et sa petite soeur wilma :
http://sourceforge.net/projects/wilma-indexer/

Cordialement,
Philippe

Ou plus simplement ce lien :

https://s3.amazonaws.com/redtree/wilbur/download_fr.htm

Cordialement,
Philippe

Pas de problème. On peut indexer les dossiers souhaités en dehors de toute hiérarchie. De plus dans un dossier on peut désélectionner les sous-dossiers à ne pas indexer.

Bernard

Bonjour Philippe,

Bonjour ,

Une autre solution... l'excellent... le plus rapide.... en local ou en réseau : il s'agit de*Wilbur* !!! Le *meilleur* en libre: il lit instantanément dans les fichiers odt, zip, doc, etc...

J'ai créé une GED (côté moteur de recherche) pour les administrations à partir de cet outil d (1,1 Mo seulement à installer)

http://www.framasoft.net/article1613.html
et sa petite soeur wilma :
http://sourceforge.net/projects/wilma-indexer/

Cordialement,
Philippe

Je l'avais essayé il y a longtemps et n'avais pas été convaincu, mais j'avoue ne plus me souvenir pour quelle(s) raison(s).

Ce que j'apprécie dans DocFetcher, outre sa rapidité et sa simplicité , c'est son langage de requête :
- support des opérateurs logiques : AND, OR, NOT,
- recherche d'expressions / phrases
- recherche de mots proches (à une certaine distance dans le texte) d'un mot donné
- recherche de mots similaires à un mot donné (recherche floue),
- support des caractères de substitution ? *
- rechercha dans certaines meta-don/nées : ///filename, title, author ou subject, sender, recipients pour les e-mails.

/Bernard

/

Bonsoir Bernard,

J'avais utilisé cet utilitaire pour recréer une GED (propriétaire) existante dans un service (sur un dossier réseau comprenant plusieurs Go de documents). L'avantage de Wilbur est qu'il est open source, d'une part, et d'autre part qu'il lit dans dans les fichiers compressés (zip, odt, ods etc.) à partir d'une requête et affiche un aperçu (txt) pour chaque résultat.
Le fait que tu n'avais pas été convaincu résidait peut être dans le fait que nativment Wilbur ne lit pas dans les pdf ; pour cela il faut installer la petite extension pdftotext (à décompacter dans le répertoire d'installation de Wilbur)
http://philia.online.fr/wilbur/fiche_wilbur_fr.pdf

Amicalement,
Philippe

Bonsoir,
Dans LO Writer, le résultat d'une recherche (Ctrl F ou Ctrl H) apparaît sélectionné avec un fond bleu clair par défaut. Apparemment c'est la même couleur que lorsqu'on sélectionne une partie de document en traînant la souris ou bien avec la touche MAJ + flèche.
Comment peut-on changer cette couleur et en mettre une autre par défaut ?
Merci d'avance
Cordialement
Sylvie Ferrié

Bonsoir Philippe,

Bonjour Philippe,

Je l'avais essayé il y a longtemps et n'avais pas été convaincu, mais j'avoue ne plus me souvenir pour quelle(s) raison(s).

Ce que j'apprécie dans DocFetcher, outre sa rapidité et sa simplicité , c'est son langage de requête :
- support des opérateurs logiques : AND, OR, NOT,
- recherche d'expressions / phrases
- recherche de mots proches (à une certaine distance dans le texte) d'un mot donné
- recherche de mots similaires à un mot donné (recherche floue),
- support des caractères de substitution ? *
- rechercha dans certaines meta-don/nées : ///filename, title, author ou subject, sender, recipients pour les e-mails.

/Bernard

Bonsoir Bernard,

J'avais utilisé cet utilitaire pour recréer une GED (propriétaire) existante dans un service (sur un dossier réseau comprenant plusieurs Go de documents). L'avantage de Wilbur est qu'il est open source, d'une part, et d'autre part qu'il lit dans dans les fichiers compressés (zip, odt, ods etc.) à partir d'une requête et affiche un aperçu (txt) pour chaque résultat.
Le fait que tu n'avais pas été convaincu résidait peut être dans le fait que nativment Wilbur ne lit pas dans les pdf ; pour cela il faut installer la petite extension pdftotext (à décompacter dans le répertoire d'installation de Wilbur)
http://philia.online.fr/wilbur/fiche_wilbur_fr.pdf

Amicalement,
Philippe

Pour en terminer avec ce presque hors-sujet :slight_smile: et pour information, voici la liste des formats que peut ouvrir DocFetcher :

  * AbiWord (abw, abw.gz, zabw)
  * EPUB (epub)
  * FLAC (flac)
  * HTML (htmi, htm, ..)
  * JPEG (jpg, jpeg)
  * HP3 (mp3)
  * MS Compiled HTML Help (chm)
  * MS Excel (xls)
  * MS Powerpoint (ppt)
  * MS Powerpoint 2007 (pptx, pptm)
  * MS Visio (vsd)
  * MS Word (doc)
  * MS Word 2007 (docx, docm)
  * OpenOffice.org Cale (ods, ots)
  * OpenOffice.org Draw (odg, otg)
  * OpenOffice.org Impress (odp, otp)
  * OpenOffice.org Writer (odt, ott)
  * PDF Document (pdf)
  * Rich Text Format (rtf)
  * Scalable Vector Graphics (svg)
  * Simple texte

Il affiche un aperçu en format texte, certains dans leur format d'origine, tel HTML. Pour les images il affiche les propriétés (dimensions, etc.). Je n'ai pas tout essayé (et pas tout indexé), seuls les documents ODF, MS, PDF et texte m'intéressant.
Un bon point pour Wilbur en ce qui concerne les zip, DocFetcher a beaucoup de mal. Il y a aussi quelques problèmes avec les CHM. Je n'ai jamais pris le temps de remonter ces problèmes à l'éditeur.

Mais je vais réessayer Wilbur "un de ces quatre..." :slight_smile:

Bernard

Bonsoir,

Bonsoir,
Dans LO Writer, le résultat d'une recherche (Ctrl F ou Ctrl H) apparaît sélectionné avec un fond bleu clair par défaut. Apparemment c'est la même couleur que lorsqu'on sélectionne une partie de document en traînant la souris ou bien avec la touche MAJ + flèche.
Comment peut-on changer cette couleur et en mettre une autre par défaut ?
Merci d'avance
Cordialement
Sylvie Ferrié

Ce serait bien d'ouvrir un nouveau fil pour poser une nouvelle question.
Merci.
Bernard

Bonsoir,
Oui, je veux bien, mais je ne sais pas ce que c'est qu'un fil ni comment on en ouvre un nouveau. Si je l'ai déjà fait par le passé je n'ai pas fait exprès.
Je suis simplement quelqu'un qui a utilisé Word et Excel pendant des années, qui les connaissait par coeur, et qui un jour s'est lassé de leurs changements perpétuels, et de l'attitude hégémonique de Microsoft.

J'ai changé pour Libre Office, et je regrette les points suivants :
a) - que l'aide intégrée soit si spartiate, et uniquement descriptive. Je n'ai jamais trouvé ce que je cherchais dedans.
b) - que l'on doive être abonnée à une liste de discussion comme la vôtre pour obtenir des réponses qui devraient se trouver dans l'aide intégrée.
c) - ne pas comprendre le quart de la moitié de ce dont vous parlez, je ne suis pas spécialiste comme vous.
d) - ne pas avoir le temps de suivre l'actualité des nouvelles versions, j'ai plein d'occupations annexes.
e) - ne pas comprendre s'il faut les installer ou pas (à quoi ça sert des versions instables ?) parce que la stabilité n'est pas indiquée quand la notif arrive.
f) - ne pas avoir le temps ni l'envie d'écumer Internet pour le savoir.

Peut-être ne suis-je pas sur le bon forum pour poser des questions bêtes et basiques, peut-être pourrez-vous m'en indiquer un autre.
Salutations fatiguées

Sylvie Ferrié
Professeur des écoles
(Je suis en train de passer toutes mes fiches de l'année de CE2 de Microsoft à Libre Office, et ça fait du monde dans l'ordi.)
Directrice d'école, 11 classes, 300 élèves.
(Si vous saviez la bataille pour utiliser Libre Office sur les ordis de l'école, et comme les collègues freinent des 4 fers)
Syndicaliste militante
(Là on l'a, LO, et ça marche nickel.)
Adhérente militante d'un parti politique
Adhérente active d'une brouettes d'associations.

Bonsoir,

Il suffit de créer un mail et l'expédier à users@fr.libreoffice.org. Ce mail avec son sujet va créer un nouveau "fil de discussion" (un enchaînement de mails ayant le même sujet).

Bernard

Bonjour Sylvie,

Si, vous êtes sur la bonne liste, continuez à y poser vos questions. :slight_smile:

Ce que dit Bernard ne concerne pas LibreOffice ni même une quelconque
connaissance en informatique. J'essaye d'être clair :

Ici c'est une liste de discussion (cherchez au besoin sur le web des
explications, c'est très simple, sinon vous pouvez questionner ici).
Ça marche comme pour les courriels.
Il y a 2 (au moins) manière d'afficher les messages : les uns à la suite
des autres, par ordre chronologique ou alphabétique ou autres critères,
l'autre possibilité étant d'afficher sous forme de fils de discussion,
c'est à dire que les réponses à un message s'attachent au message auquel
elles répondent. C'est un affichage qui permet de suivre l'ordre des
réponses à un même sujet.

Donc si vous répondez à un message, il viendra se "coller" au message
auquel vous avez répondu, même si vous avez changé le sujet et changé le
contenu du message. Si vous n'affichez pas les fils de discussion vous
ne le voyez pas, mais les autres si, et votre message à propos d'une
question se trouve mbriqué dans une autre discussion sans rapport.

Bien sûr cette méthode est pratique, en faisant "répondre" on a
directement l'adresse du destinataire (ici la liste de discussion), mais
il ne faut pas faire ça. Une conséquence de ce que j'ai décrit
ci-dessus est que des personnes qui auraient pu avoir la réponse ne
verront pas votre message puisqu'il fait partie d'une discussion qui ne
les intéressent pas, qu'ils ne regarderont donc pas.

J'ai dit "ce n'est pas un problème informatique", tout simplement parce
qu'ici l'informatique fait exactement ce que ferait un humain : si vous
faites "répondre", ça répond. Il faut donc créer un nouveau sujet, comme
vous le faites pour écrire à quelqu'un avec un nouveau message, et en
mettant comme destinataire l'adresse de la liste.

Si vous avez lu jusque là, bravo, et sachez que je n'ai pas la réponse à
votre question :slight_smile:

PS : ne vous fiez pas aux logiciels mal foutus qui génèrent les fils de
discussion en fonction du sujet, Peut-être que vous avez ça et pensez
que le simple fait de changer le sujet cassera le classement, mais ce
n'est pas le cas pour la plupart des logiciels de courriels qui
respectent les normes.