Les caractères accentués dans les html

Bonjour,

Je dois traduire en français des fichiers html rédigés en anglais.
Pour cela, je ne touche pas au code proprement dit mais uniquement à des contenus de texte.

Par exemple :

<!DOCTYPE html>
<html lang="en"><head>
<meta http-equiv="content-type" content="text/html; charset=UTF-8">
<meta charset="UTF-8">
<title>Dentelle aux fuseaux : navigateur de modèles</title>

Si chez moi, tout se passe bien, lorsque mon interlocuteur (sous Windows) veut utiliser ma traduction, les caractères accentués présentent, une fois sur le site des “formes” inadéquates.
Mon interlocuteur voudrait que je transforme directement ces caractères accentués en “é” par exemple.
Je pensais qu’avec les entêtes du fichier html, il n’y aurait pas ce genre de problème.

Edit :
Ces fichiers html sont “téléchargés” (clic droit => Afficher le code de la page => copier/coller dans mon éditeur Gedit) depuis GitHub sur mon poste Debian. Ensuite, j’envoie ma traduction au dépositaire du site qui va placer la traduction où le veut dans ses pages.

Y a-t-il un moyen pour que ces modifications se fassent soit toutes seules, lors de la frappe du texte ou par un traitement ultérieur ?

Merci.

Les problèmes d’encodage, dans ton cas, sont tout-à-fait normaux.

Les pages sur le github sont en ISO-8859-15.
Toi, tu es normalement en UTF-8.

Première recommandation : qu’il change le charset de ses pages si c’est bien lui l’éditeur, pour passer de ISO-8859-15 à UTF-8.
Concernant l’encodage HTML, ce n’est pas que ce soit compliqué … s’il y tient réellement.

Tu t’écris un petit script shell, qui avec ed, te changera tous les caractères accentués dans leur version encodé HTML, par exemple.

Bonjour PengouinPdt,

J’ai contacté mon interlocuteur propriétaire des pages et voic ce qu’il m’écrit :

Il a, semble-t-il également des problème de caractères accentués avec tous les fichiers que je lui envoie.
Les fichiers html sont écrits avec Gedit puis enregistrés en html ET en TXT. Les autres fichiers qui sont placés dans des pages GitHub sont écrits, au format TXT dans LibO Writer. Je copie le texte ensuite et le colle dans la page GitHub et le met en forme avec Markdown.

Ce qu’il y a de curieux, c’est que j’ai déjà écrit une page dans GitHub sans que cela pose problème, il y a quelques mois mais maintenant, nous avons ce défaut.

Il y aurait, semble-t-il deux tuf-08 légèrement différents selon l’âge de l’OS !?
Comment puis-je savoir quel est l’encodage utilisé sur ma machine ?

J’aimerais bien comprendre pour éviter ce travail de conversion de caractères après coup.

Et comme je suis une bille au niveau des scripts, écrire une telle routine n’est vraiment pas dans mes cordes mais j’ai vu qu’il y a quelques logiciels disponibles : iconv, recode, par exemple.

Je vais lui faire part de tes recommandations et voir sa réaction.

Edit :
Je viens d’effectuer une convertion de mon fichier .txt avec

et j’ai obtenu un texte où les caractères accentués ont été remplacés. Mais je ne sais pas si cela lui convient.

A+

1/ Si je ne me trompe pas, Windows n’est pas Unicode UTF-8… mais UTF-16.
De fait, il faut paramétrer les logiciels utilisés pour qu’ils fassent des sorties UTF-8.

2/ Non, il n’y a pas deux UTF-8, selon les âges. UTF-8 est une norme qui ne bouge pas.

3/ Normalement tu es en UTF-8 … pour le vérifier, tu peux lire le fichier /etc/locale.gen, les valeurs décommentées sont celles paramétrées.
Voire le fichier /etc/environment, selon la version de Debian installée …
wiki.debian.org/Locale
Donc, vérifies tes locales … mais, ce serait étonnant, que tu sois encore en ISO-8859-xyz …

Le plus simple est que sa sortie logiciel soit de l’UTF-8. Ce n’est pas difficile de faire en sorte que la sortie (x)HTML ait le charset en UTF-8, et non pas ISO-8859-15.
Parce que si c’est toi qui doit faire de l’iconv de UTF-8 vers ISO-8859-xyz, tu vas y perdre quelques caractères au passage :wink:

Attention, à ta commande iconv, tel que tu l’as écrit, tu vas de ISO vers UTF … hors, c’est l’inverse qu’il te faudrait faire.

Oui, le problème provient bien de Windows.
Mon interlocuteur utilise habituellement un Mac. Ces jours-ci, il n’a qu’un poste sous Windows pour travailler.

Avec le Mac, il n’avait aucun problème d’affichage.

Merci pour ces infos précieuses.

A+