Hello à tous,
Je rencontre un petit souci qui m’arrache les cheveux.
Ce que j'aimerais faire, c'est une recherche dans un répertoire (de manière récursive), sur un pattern dans de nombreux fichiers PDF, afin qu'il m'affiche les fichiers dans l'ordre décroissant avec le nombre d'occurrences les plus fortes en premier
find ~ -type f -name '*.pdf' -exec bash -c 'pdftotext "{}" - 2>/dev/null | grep -iH --label="$(basename "{}")" --color "pistache" 2>/dev/null' \;
Cette sortie m’affiche bien le nom des fichiers sans l’extension qui contienne le pattern choisi ‹ pistache › ici pour l’exemple
Jusque là c’est OK pour moi rien à signaler
maintenant j'aimerais qu'il me compte les occurrences trouvées Je change donc en
find -type f -name '*.pdf' -exec bash -c 'pdftotext "{}" - 2>/dev/null | grep -icH --label="$(basename "{}")" --color "pistache" 2>/dev/null' \;
Voila ce que ça donne
Donc ça c'est ok aussi
Seulement j’aimerais trier par ordre décroissant et la rien y fait j’arrive pas
find ~ -type f -name '*.pdf' -exec bash -c 'pdftotext "{}" - 2>/dev/null | grep -icH --label="$(basename "{}")" --color "pistache" 2>/dev/null | sort -t: -k2 -rn ' \;
ne fonctionne pas , il ne me les trie pas
j'ai essayé avec un cut comme ceci
find ~ -type f -name '*.pdf' -exec bash -c 'pdftotext "{}" - 2>/dev/null | grep -icH --label="$(basename "{}")" --color "pistache" 2>/dev/null | cut -d ":" -f2 ' \;
il me les coupe bien sans souci
mais la encore si j’essai de trier ca ne fonctionne pas
find ~ -type f -name '*.pdf' -exec bash -c 'pdftotext "{}" - 2>/dev/null | grep -icH --label="$(basename "{}")" --color "pistache" 2>/dev/null | cut -d ":" -f2 | sort -rn ' \;
Si vous aviez une piste ce serait sympa
Merci