Avoir un environnement proche de l'UTF-8

Je donne ma solution pour avoir un environnement en UTF-8.
Pour plus d’info sur ce qu’est l’unicode:

man unicode man charsets
Plus un lien:
fr.wikipedia.org/wiki/UTF-8

Il faut déja que les locales soient bien reglées:
LANG=fr_FR.UTF-8
LC_CTYPE=“fr_FR.UTF-8”

Je conseille l’utilisation du package language-env pour faire ces modifs
apt-get install language-env
dpkg-reconfigure locales
puis choisir tous les fr_FR ( y compris celui en UTF-8 )

  1. Terminal X qui gère completement UTF-8:

J’en ai testé plusieurs. rxvt, aterm et konsole ne marchent pas.

Xterm marche sauf pour l’ethiopien :slightly_smiling: l’alignement est parfait (c’est le seul que j’ai trouvé, là ou meme firefox ne marche pas):
Il faut un encodage unicode ISO10646
xterm -fn '-Misc-Fixed-Medium-R-SemiCondensed–13-120-75-75-C-60-ISO10646-1’
wget cl.cam.ac.uk/~mgk25/ucs/exam … 8-demo.txt
cat UTF-8-demo.txt
L’avantage est que xterm est petit, standard et n’a pas bcp de dependances.

Autre solution, utiliser pango:
pango.org/
Pango is a library for laying out and rendering of text, with an emphasis on internationalization.
Je crois que c’est clair, c’est censé marcher.

J’ai donc cherché les terminaux qui dépendaient de la fameuse libpango, via cette petite commande (désolé j’ai pas trouvé plus simple…)

Résultat:

[quote]xiterm
Tag: devel::i18n, interface::x11, role::sw:utility, uitoolkit::athena, uitoolkit::gtk, x11::terminal

mlterm-tools
Tag: admin::configuring, role::sw:utility, uitoolkit::gtk, use::configuring, x11::terminal

gnome-terminal
Tag: interface::x11, made-of::lang:c, role::sw:application, suite::gnome, uitoolkit::gtk, use::login, x11::terminal
[/quote]

J’ai installé les 3. xiterm et mlterm n’ont pas pu afficher completement l’UTF8. En plus ils ont une convention d’option hors du commun, recallés.

Reste gnome-terminal

Avantage, plus besoin de fixer une fonte avec telle ou telle encodage (d’ailleurs on ne peut meme pas) par défaut on dirait que tout est en unicode.
wget…
cat…
Parfait. Sauf l’alignement des boites et certains caractères.

Edit: Je viens de trouver uxterm
uxterm − X terminal emulator for for Unicode (UTF‐8) environments
qui fixe les bonnes fontes (/etc/X11/app-defaults)

Edit2: Mieux: rxvt-unicode

[quote] rxvt-unicode is a modern, Unicode-aware color xterm replacement that uses
significantly less memory than a conventional xterm and many other Unicode
supporting terminal emulators.
.
It supports using multiple fonts at the same time, including Xft fonts, and
client-server technology to reduce memory consumption when using multiple
windows.[/quote]

  1. Console:
    Il faut lancer /usr/bin/utf8 (dispo dans le package fonty-rg).
    Pour automatiser à chaque reboot, j’ai fait ca sur mon système (dans ce cas, pas besoin du paquet fonty-rg):
    ln -s /etc/init.d/keymap.sh /etc/rc2.d/S05keymap.sh
    S’assurer aussi que le package console-tools est installé
    Puis fixer:
    SCREEN_FONT=LatCyrGr-16.psf
    dans /etc/console-tools/config

Au boot, tous vos VT devrais utiliser cette fonte qui est alors compatible avec votre locale UTF-8. console-tools va appeler unicode_start qui met tout en place.

ps: Je suis sous Sid à jour, problable que ca ne marche pas sur d’autres releases.

debian.org/devel/debian-installer/errata

[quote]Problèmes courants après le redémarrage à cause du codage UTF-8 utilisé par défaut
Le système d’installation est désormais paramétré en UTF-8 par défaut. Cependant, toutes les applications ne supportent pas encore correctement l’UTF-8 ce qui peut engendrer de petits problèmes ou des problèmes plus importants lors de leur utilisation.
Veuillez vérifier si de tels problèmes ont déjà été reportés avant de remplir un rapport de bogue contre le paquet correspondant (pas l’installateur) [/quote]

Ah ca fait plaisir de voir que je suis pas le seul a galerer :slightly_smiling:

Salut,

Je viens de lire ton post sur l’utf-8 et je comprends pas pourquoi tu fais tout ça … Si tu pouvais m’expliquer le but, ce serait cool :smiley:
Ca m’a interpelé parce que je me crée des difficultés en voulant faire mes sites en utf-8 parce que c’est censé être universel et comme je compte me faire un petit serveur web sous debian est ce que ca aura une incidence sur mon système ??

[quote=“bud46”]Salut,

Je viens de lire ton post sur l’utf-8 et je comprends pas pourquoi tu fais tout ça … Si tu pouvais m’expliquer le but, ce serait cool :smiley:
[/quote]
Salut bud46, bienvenu.
L’utf-8, ben … euh… c’est l’avenir et ca m’a permis d’occuper plusieurs après-midi.

[quote]
Ca m’a interpelé parce que je me crée des difficultés en voulant faire mes sites en utf-8 parce que c’est censé être universel et comme je compte me faire un petit serveur web sous debian est ce que ca aura une incidence sur mon système ??[/quote]
Non non, tu te crée pas des difficultés pour rien.
Je suis loin d’etre un expert en codage donc a prendre avec des pincettes:
Si tu lis la page sur la wiki, tu verras l’interet. Internationalisation!!
Si en plus tu lis ca : fr.wikipedia.org/wiki/ASCII, tu vois la liste des caractères que tout le monde a au minimum sur son système, inspiré de la langue américaine.

Prenons l’exemple de ton site web. Tu te rends compte qu’un chinois pourra pas lire tes accents (leur code ASCII etant superieur à 128) Pour résoudre ca, il faut que tu mettes Charset 8859-1 (latin) pour etendre les code ascii de 128 à 255 pour y inclure les accents.
Si tu as un forum et que des chinois débarquent et veulent echanger des messages en chinois… ils auront besoin d’autres caractères.
Pour permettre à tout le monde d’afficher ses caractères, il faut utiliser l’utf-8 qui permet d’afficher beaucoup de caractères.
Firefox par défaut essaye d’afficher en utf8 donc tes sites utf8 seront directement lisibles sans demander au gens de modifier leur client.
L’UTF8 en plus est compatible avec l’ASCII, cad qu’un A est codé 0041 alors qu’en ASCII ca serait 41.

En pratique, pour le web on peut aussi utiliser le XHTML qui est interprété par les browser pour afficher beaucoup de caractères, a la maniere de l’UTF8.

Pour un xterm, une console, tu ne peux pas utiliser le XHTML donc autant utiliser de l’UTF8 partout.

Et si tu veux passer d’une convention de codage à une autre tu peux toujours le faire a postériori avec iconv(1)

ok c’est ce que j’avais plus ou moins compris pour le utf-8 sur internet.
en tout cas merci pour la réponse :smt023
et je m’occuperai un de ces quatre en lisant le wiki :smiley:

wiki.debian.org/DebFrUTF8
et-omnia-vanitas.net/documentation.php pour probèmes avec firefox
fr.wikipedia.org/wiki/Wikip%C3%A … icode/Test d’autres page de test

Je réveille un peu ce poste…
Je suis actuellement sous sarge… et j’ai un petit problème.

Les fichiers que j’ai importé de ma ubuntu ont des noms encodés en utf8 donc les accents sont mal gérés dans les noms de fichiers.

Y’a-t-il un moyen de les rebasculé en ISO ?