Tracker et alternative - Switch to Debian (aide et question)

Bonjour

Comment fait-on pour que tracker effectue les recherches dans les fichiers qu’il à indexer ?
Comment savoir quel type de fichier indexe-t-il et dont il indexe le contenu ?

Disposez vous d’un tutoriel assez extensif sur l’installation et la configuration de tracker ?




Les détails
J’ai vu qu’il existait plusieurs logiciels de recherches qui peuvent fouiller dans les fichiers, dont tracker, qui est étroitement lié à gnome shell.

Je viens d’installer Debian stretch (up to date) à partir du live usb de debian, qui installe gnome-shell et pas mal de chose out of the box, dont tracker et ses dépendances (au moins de base)

Je viens de faire quelque essais, la recherche s’effectue, mais que dans les noms, pas dans les fichiers

Pourtant j’ai bien vérifier que la case à cocher “indexerle contenu des fichiers trouvé” soit marquée lorsque je lance “tracker-preference” depuis la console, et que l’indexation est finie avec “tracker status”

J’ai fait des test avec un .pdf ainsi qu’un fichier .txt que j’ai créé et qui ne contient que trois mots.
Tous deux sont trouvés par tracker si je fait une recherche par nom, mais pas si je cherche quelque chose de leur contenu.

Je comprend de la doc de tracker que la recherche dans les fichier peut dépendre de package supplémentaire, cependant les noms de package ne correspondent pas à des nom de package trouvé sur les dépôts de debian ; on en trouve des similaires, par expemple “poppler” est installé sous le nom de “poppler-data” et “poppler-utils”

Bref, j’ai fait pas mal de recherche, mais suis un peu bloqué.

J’espère que l’un de vous peut m’aider !


Enfin, j’aime bien l’idée de tout configurer, mais aussi des systèmes intégrés, et si je trouve ma route avec tracker et son intégration à gnome-shell et nautilus, c’est parfait, sinon quel outils de recherche recomenderiez vous ? catfish, recoll, searchmonkey, etc. ?

Merci

Salut
As tu installe tracker-miner-fs ?https://wiki.gnome.org/Projects/Tracker/Documentation/Configuration

il faut que ce qui est relatif à FTS soit activé

gsettings list-recursively | grep -i org.freedesktop.Tracker | sort | uniq

Attention a la consommation cpu et au gel du PC quand tout ça s’indexe :rage:, en outre Tracker est connu pour consommer l’énergie de la batterie et réduire l’autonomie du PC

Salut :slight_smile:

Oui
sudo apt-get install -s tracker-miner-fs
Lecture des listes de paquets… Fait
Construction de l’arbre des dépendances
Lecture des informations d’état… Fait
tracker-miner-fs is already the newest version (1.10.5-1).
tracker-miner-fs passé en « installé manuellement ».
0 mis à jour, 0 nouvellement installés, 0 à enlever et 0 non mis à jour.

C’est bien la toute la question ?

A vrai dire, je ne comprends pas où (et comment) changer ces paramètres, en dehors du tracker-preferences qui ouvre une fenêtre GUI, et ce n’est pas faute d’avoir éplucher la doc de tracker, donc la page que tu as mis en lien
Voici le retrour de ta commande

org.freedesktop.Tracker.DB journal-chunk-size 50
org.freedesktop.Tracker.DB journal-rotate-destination ''
org.freedesktop.Tracker.Extract max-bytes 1048576
org.freedesktop.Tracker.Extract max-media-art-width 0
org.freedesktop.Tracker.Extract sched-idle 'first-index'
org.freedesktop.Tracker.Extract verbosity 'errors'
org.freedesktop.Tracker.Extract wait-for-miner-fs false
org.freedesktop.Tracker.FTS enable-stemmer false
org.freedesktop.Tracker.FTS enable-unaccent true
org.freedesktop.Tracker.FTS ignore-numbers true
org.freedesktop.Tracker.FTS ignore-stop-words true
org.freedesktop.Tracker.FTS max-word-length 30
org.freedesktop.Tracker.FTS max-words-to-index 10000
org.freedesktop.Tracker.Miner.Files crawling-interval -1
org.freedesktop.Tracker.Miner.Files enable-monitors true
org.freedesktop.Tracker.Miner.Files enable-writeback true
org.freedesktop.Tracker.Miner.Files ignored-directories ['core-dumps', 'CVS', 'lost+found', 'po']
org.freedesktop.Tracker.Miner.Files ignored-directories-with-content ['.git', '.trackerignore']
org.freedesktop.Tracker.Miner.Files ignored-files ['*~', '#*#', 'autom4te', '*.aux', 'confdefs.h', 'config.status', 'configure', 'confstat', 'conftest', '*.csproj', '*.desktop', '*.directory', '~$*.doc?', '~$*.dot?', '*.gmo', '*.in', '*.la', 'libtool', '*.lo', '*.loT', 'ltmain.sh', '*.lzo', '*.m4', 'Makefile', '*.nvram', '*.o', '*.omf', '*.orig', '*.part', '*.pc', '*.po', '~$*.pot?', '~$*.ppam', '~$*.ppsm', '~$*.ppsx', '~$*.ppt?', '*.rcore', '*.rej', 'SCCS', '*.tmp', '*.vm*', '*.vmdk', '~$*.vsd?', '~$*.vss?', '~$*.vst?', '~$*.xlam', '~$*.xls?', '~$*.xlt?']
org.freedesktop.Tracker.Miner.Files index-on-battery-first-time true
org.freedesktop.Tracker.Miner.Files index-on-battery true
org.freedesktop.Tracker.Miner.Files index-optical-discs false
org.freedesktop.Tracker.Miner.Files index-recursive-directories ['&DESKTOP', '&DOCUMENTS', '&PICTURES', '&MUSIC', '&DOWNLOAD', '&VIDEOS']
org.freedesktop.Tracker.Miner.Files index-removable-devices false
org.freedesktop.Tracker.Miner.Files index-single-directories ['$HOME']
org.freedesktop.Tracker.Miner.Files initial-sleep 15
org.freedesktop.Tracker.Miner.Files low-disk-space-limit -1
org.freedesktop.Tracker.Miner.Files removable-days-threshold 3
org.freedesktop.Tracker.Miner.Files sched-idle 'first-index'
org.freedesktop.Tracker.Miner.Files throttle 0
org.freedesktop.Tracker.Miner.Files verbosity 'errors'
org.freedesktop.Tracker.Needle default-view 2
org.freedesktop.Tracker.Store graphupdated-delay 1000
org.freedesktop.Tracker.Store verbosity 'errors'
org.freedesktop.Tracker.Writeback verbosity 'errors'

Hum, c’est bon à savoir, et super chiant !
ok je peux désactiver l’indexation sur batterie, c’est une première solution.

Sinon, je quitte MacOS pour faire de debian mon OS primaire, mais il me faut absolument un équivalent de spotlight, idéalement intégré à un explorateur de fichier, et qui se combine avec gnome-suchi (qui est en dessous de quickview).
Je veux bien faire quelques concessions, et prendre du temps pour mettre celà en place, et suis ouvert à toutes propositions.
A nouveau je partais sur tracker car c’est celui proposé par défaut avec gnome shell, mais je n’ai pas de préférences.

Merci pour ton aide et tes conseils

ça dépends peut etre aussi de tes parametres gnome
moi je laisse s’afficher que les noms d’applications, confidentialité d’abord je ne me sers pas vraiment de tracker

Oui, je suis passé par là déjà, documents et fichiers sont activé (j’ai désactivé agenda, contact, horloges, mot d passe )

as tu indexé une fois?

tracker-control -s

https://packages.debian.org/jessie/amd64/tracker/filelist

pour faire une recherche

tracker-needle

Dans Debian les outils ne sont pas dans toutes les versions

https://packages.debian.org/jessie/tracker-utils

Donc dépendant de la version Jessie, Stretch, Buster, le contenu de tracker a été revu.
Pour connaitre les paquets et leur contenu
https://packages.debian.org/search?keywords=tracker

Par exemple ce tuto me semble convenir uniquement pour Debian Jessie
http://tuxdiary.com/2015/09/02/tracker/

Oui en effet, il semble qu’il y ai plusieur version de tracker, construite assez différemment d’ailleurs

Je suis sur stretch
Par exemple, je n’ai pas tracker-control, et il n’est pas dans les dépots

Chez moi, on dirait que c’est tracker daemon -s

J’ai fait

tracker reset -r
tracker daemon -s
tracker status

j’ai bien

blabla@debian:~$ tracker status
Actuellement indexé: 21 files, 11 folders
Il reste de la place sur la partition de la base de données: 218,0 Go (88,98%)
Tous les collecteurs de données sont arrêtés. L'indexation est terminée

oui oui, Tracker touve les doc quand ma recherche est dans le nom, mais pas quand elle est à l’intérieure

Oui, j’ai vu ce post hier, c’est une des raisons pour lesquelles je me suis dit pourquoi pas tracker plutôt qu’un autre

Oui je connais ce site, et vérifier les versions des packages selon les dépots (j’en ai eu besoin pour firefox, zotero, qgis, virtualbox… cf. ici )

j’ai ça sur ma machine

root@debian:/home/blabla# dpkg -l | grep tracker
ii  gir1.2-tracker-1.0:amd64                 1.10.5-1                                    amd64        GObject introspection data for Tracker
ii  libtracker-control-1.0-0:amd64           1.10.5-1                                    amd64        library to control/monitor tracker miners
ii  libtracker-miner-1.0-0:amd64             1.10.5-1                                    amd64        tracker data miner library
ii  libtracker-sparql-1.0-0:amd64            1.10.5-1                                    amd64        metadata database, indexer and search tool - library
ii  libxatracker2:amd64                      13.0.6-1+b2                                 amd64        X acceleration library -- runtime
ii  rygel-tracker                            0.32.1-3                                    amd64        GNOME UPnP/DLNA services - Tracker plugin
ii  tracker                                  1.10.5-1                                    amd64        metadata database, indexer and search tool
ii  tracker-extract                          1.10.5-1                                    amd64        metadata database, indexer and search tool - metadata extractors
ii  tracker-gui                              1.10.5-1                                    amd64        metadata database, indexer and search tool - GNOME frontends
ii  tracker-miner-fs                         1.10.5-1                                    amd64        metadata database, indexer and search tool - filesystem indexer

Bon, mais ce ne me dit pas si et comment fouiller dans les pdf par exemple.

Si je me trompe pas sur la doc de tracker, il disent que tracker utilise poppler, or j’ai

root@debian:/home/blabla# dpkg -l | grep poppler
ii  libpoppler-glib8:amd64                   0.48.0-2+deb9u2                             amd64        PDF rendering library (GLib-based shared library)
ii  libpoppler64:amd64                       0.48.0-2+deb9u2                             amd64        PDF rendering library
ii  poppler-data                             0.4.7-8                                     all          encoding data for the poppler PDF rendering library
ii  poppler-utils                            0.48.0-2+deb9u2                             amd64        PDF utilities (based on Poppler)

Il y a certes d’autre package contenant le mot poppler dans les dépots debian, mais comment je sais de quoi j’ai besoin ?

Oui, je l’ai lu hier aussi :slight_smile:

ça est intéressant concernant le 'full text search" qui est sensé fonctionner dès que l’indexation est complète

Cannot find results
Tracker with a default configuration, and after indexing your documents, should be able to run a “full text search”: you type one or more words in tracker-needle and the results are there.

There are a couple of details to take into account though:

Tracker ignores words with less than 3 characters. This is a common practice in any index service to avoid “useless” words like “or”, “a”, “if”…
Tracker has a list of “stop words” that will be ignored. Those are words without much content, like “anyway”. Explanation of stop words, lists used by Tracker

This means that searching for “anyway indeed nowhere” (all stop words) or “The a and the b” (shorted than 3) will answer “no valid terms in the query”.

Both stop words and minimum length of a word to be indexed, can be enabled/disabled in the configuration.
https://wiki.gnome.org/Projects/Tracker/Documentation/First5Minutes

pour le pdf

https://wiki.gnome.org/Projects/Tracker/SupportedFormats
PDF application/pdf --enable-poppler poppler >= 0.16.0

peut etre passer par IRC pour avoir des réponses d’expert irc://irc.gnome.org/%23tracker
https://wiki.debian.org/fr/IRC

Merci @grandtoubab

Oui, j’avais lu, en l’occurence, je cherche soit “afea” soit “bulletin” qui sont dans un pdf ou soit “green” soit “tomatoes” dans un txt, donc je devrais être dans les clous

Oui ça aussi j’ai lu, mais je ne sais pas quoi en faire ?
que dois-je faire ?
et ou ?

Oui peut être si ça ne se débloque pas !

merci pour ton aide !

Pour le pdf , as tu essayé recoll?

vu du tuto ça a l’air facile :grinning:

j’ai limité à mon /home Documents, Images, Musique , Téléchargements, Videos

ça a mis une bonne heure pour tout indexer
mais ça fonctionne

Oui recoll à l’air puisant…
j’avais lu que la base de donnée généré par xiapian, qui est “à l’arrière” est énorme, 5Go pour 50Go de doc, mais le post datait de 2009 donc ça a peut être changé

Je sent que je vais devoir faire des test à n’en plus finir…

dans mon cas

 df -h
Sys. de fichiers Taille Utilisé Dispo Uti% Monté sur
/dev/sda6          268G    191G   64G  76% /home
du -h ~/.recoll/xapiandb
234M	

on ne peut pas avoir le beurre et l’argent du beurre

234M pour 191Go c’est pas cher payé, je veux le beure et je laisse l’argent :slight_smile:

là t’es à grosso-modo à 0.1% alors que dans le cas du post que j’avais lu c’était 10%, un rapport de 100 quand même