Il s’agit d’une fonction dans un script Perl.
J’ai choisi Perl plut ôt que Bash et ses compagnons, a priori pour sa puissance à traiter du texte, peut-être à tord (la puissance du langage n’étant pas celle du programmeur!)
Voici 3 lignes données par Dumper(@paragraphes) du tableau que je veux exploiter:
(c’est un premier traitement par Perl du fichier texlive:
texmf-dist/doc/texlive/index.html
passé par w3m pour le récupérer au format txt.)
$VAR984 = '984. flashmovie: Directly embed flash movies into PDF files test-beamer-0.pdf, test-flv.pdf.';
$VAR985 = '985. flipbook: Typeset flipbook animations, in the corners of documents im01.pdf, im02.pdf, im03.pdf, im04.pdf, im05.pdf, im06.pdf, im0.pdf, im1.pdf, im10.pdf, im11.pdf, im12.pdf, im13.pdf, im14.pdf, im15.pdf, im16.pdf, im2.pdf, im3.pdf, im4.pdf, im5.pdf, im6.pdf, im7.pdf, im8.pdf, im9.pdf, flipbook-doc.pdf, flipbook-ex.pdf.';
$VAR986 = '986. flippdf: Horizontal flipping of pages with pdfLaTeX flippdf.pdf.';
La difficulté vient du format qui ne différencie pas les espaces dans la phrase description de l’espace qui inaugure la liste des fichiers pdf. Je ne vois pas bien comment utiliser cut dans ce contexte.
Il est possible que l’utilisation de la fonction split de perl soit aussi une piste (à explorer).
L’enjeu est essentiellement pour moi de me remettre à Perl, après des années de quasi inutilisation, mais une solution autre m’intéresse autant.
Merci
PS
Voici le résultat correspondant de mon code:
nom: flashmovie
comment: Directly embed flash movies into PDF files test-beamer-0.pdf,
$VAR1 = ' test-flv.pdf';
nom: flipbook
comment: Typeset flipbook animations, in the corners of documents im01.pdf, im02.pdf, im03.pdf, im04.pdf, im05.pdf, im06.pdf, im0.pdf, im1.pdf, im10.pdf, im11.pdf, im12.pdf, im13.pdf, im14.pdf, im15.pdf, im16.pdf, im2.pdf, im3.pdf, im4.pdf, im5.pdf, im6.pdf, im7.pdf, im8.pdf, im9.pdf, flipbook-doc.pdf,
$VAR1 = ' flipbook-ex.pdf';
nom: flippdf
comment: Horizontal flipping of pages with pdfLaTeX
$VAR1 = ' flippdf.pdf';
où on voit qu’il n’y a qu’une seule variable au tableau des pdf ($3) (le dernier de la ligne), et que les autres sont restés dans la chaine de description ($2)