View previous topic :: View next topic |
Author |
Message |
nemo13 Veteran
Joined: 08 Oct 2004 Posts: 1016 Location: France/Istres
|
Posted: Mon Nov 07, 2005 11:12 pm Post subject: [Unicode]utf8 ou UTF8 ? ( résolu ) |
|
|
Bonsoir ,
Préalable :
ok c'est un topic de plus sur UTF8 / unicode/ ces put.. d'accent francais.
ok le dernier en date est celui de Ophilim.
donc pourquoi celui-ci ?
parce que j'aimes pas squatter les posts ; mais si les modos l'estime utile, je déménagerai sur le post qu'ils m'indiqueront.
Intro :
mon passage utf8 n'est pas satisfaisant et je recherche à quel moment j'ai dérappé.
premier point :
doit-on mettre utf en minuscule ?
UTF en majuscule ?
En effet dans le tuto : http://www.gentoo.org/doc/fr/utf-8.xml
l'exemple 2.1 montre :
Code: | # locale -a | grep 'fr_FR'
fr_FR
fr_FR.UTF-8 |
UTF est en majuscule
or quand je le fais sur ma machine j'obtiens :
Code: | nemo13@gentoo ~ $ locale -a |grep 'fr_FR'
fr_FR
fr_FR@euro
fr_FR.utf8
nemo13@gentoo ~ $
|
utf est en minuscule
et évidement dans mon /etc/locales.build j'ai mis :
UTF en majuscule
Sui-je bon pour tout recommencer ?[/code]
edit : en plus en lisant ce post je vois qu'il y a un "-" entre UTF et 8
donc je dois avoir tout faux dans mon build ?
Last edited by nemo13 on Sun Jan 22, 2006 10:44 pm; edited 2 times in total |
|
Back to top |
|
|
kernelsensei Bodhisattva
Joined: 22 Feb 2004 Posts: 5619 Location: Woustviller/Moselle/FRANCE (49.07°N;7.02°E)
|
Posted: Mon Nov 07, 2005 11:20 pm Post subject: |
|
|
il faut l'écrire comme listé dans locale -a (mais il me semble que c'est pas sensible a la casse)
EDIT: en fait non, moi j'ai tout en majuscules dans les locales.build et en minuscules dans locale -a et ça marche !
dans locales.build Code: | en_US/ISO-8859-1
en_US.UTF-8/UTF-8
ja_JP.EUC-JP/EUC-JP
ja_JP.UTF-8/UTF-8
ja_JP/EUC-JP
fr_FR/ISO-8859-1
fr_FR@euro/ISO-8859-15
fr_FR.UTF-8/UTF-8
|
Code: | $ locale -a
C
en_US
en_US.utf8
fr_FR
fr_FR@euro
fr_FR.utf8
ja_JP
ja_JP.eucjp
ja_JP.utf8
POSIX
|
_________________ $ ruby -e'puts " .:@BFegiklnorst".unpack("x4ax7aaX6ax5aX15ax4aax6aaX7ax2aX5aX8 \
axaX3ax8aX4ax6aX3aX6ax3ax3aX9ax4ax2aX9axaX6ax3aX2ax4ax3aX4aXaX12ax10aaX7a").join' |
|
Back to top |
|
|
Antares Apprentice
Joined: 04 Apr 2005 Posts: 184 Location: France
|
Posted: Mon Nov 07, 2005 11:38 pm Post subject: |
|
|
me suis posé la meme question que toi en passant en utf8. J'ai tout mis en minuscule et ca fonctionne impeccable.... :d |
|
Back to top |
|
|
nemo13 Veteran
Joined: 08 Oct 2004 Posts: 1016 Location: France/Istres
|
Posted: Mon Nov 07, 2005 11:39 pm Post subject: |
|
|
bonsoir K_S ,
Flute, je croyais tenir une piste puis celà s'effondre puisque j'ai aussi :
Code: | nemo13@gentoo ~ $ locale
LANG=
LC_CTYPE="fr_FR.UTF-8"
LC_NUMERIC="fr_FR.UTF-8"
LC_TIME="fr_FR.UTF-8"
LC_COLLATE="fr_FR.UTF-8"
LC_MONETARY="fr_FR.UTF-8"
LC_MESSAGES="fr_FR.UTF-8"
LC_PAPER="fr_FR.UTF-8"
LC_NAME="fr_FR.UTF-8"
LC_ADDRESS="fr_FR.UTF-8"
LC_TELEPHONE="fr_FR.UTF-8"
LC_MEASUREMENT="fr_FR.UTF-8"
LC_IDENTIFICATION="fr_FR.UTF-8"
LC_ALL=fr_FR.UTF-8
nemo13@gentoo ~ $ |
Code: | nemo13@gentoo ~ $ cat /etc/locales.build
# modifie par jlp le 2005-10-26 d'apres la doc gentoo
# http://www.gentoo.org/doc/fr/utf-8.xml
#
# This file names the list of locales to be built when glibc is installed.
# The format is <locale>/<charmap>, where <locale> is a locale from the
# /usr/share/i18n/locales directory, and <charmap> is name of one of the files
# in /usr/share/i18n/charmaps/. All blank lines and lines starting with # are
# ignored. Here is an example:
# en_US/ISO-8859-1
en_US/ISO-8859-1
en_US.UTF-8/UTF-8
fr_FR/ISO-8859-1
fr_FR@euro/ISO-8859-15
fr_FR.UTF-8/UTF-8
|
Code: | nemo13@gentoo ~ $ locale -a |grep 'fr_FR'
fr_FR
fr_FR@euro
fr_FR.utf8
nemo13@gentoo ~ $ |
donc à priori, c'est pas la bonne piste
Peut-être dans consolefonte et translation ?
Code: |
CONSOLEFONT="lat9w-16"
# la ligne suivante doit me donner la langue francaise et les accents
CONSOLETRANSLATION="8859-15_to_uni"
|
pour le moment je vais faire dormir les yeux
A+:jlp |
|
Back to top |
|
|
ultrabug Developer
Joined: 24 Jan 2005 Posts: 698 Location: Paris
|
Posted: Tue Nov 08, 2005 8:26 am Post subject: |
|
|
Salut !
Alors c'est pas tant hors sujet mais c'est un TIP !
Si vous voulez les accents pris en compte MAIS que le système reste en anglais (man, wm etc...) vous devrez avoir cela :
Code: |
$ locale
LANG=fr_FR.UTF-8
LC_CTYPE=fr_FR.UTF-8
LC_NUMERIC=fr_FR.UTF-8
LC_TIME=fr_FR.UTF-8
LC_COLLATE=fr_FR.UTF-8
LC_MONETARY=fr_FR.UTF-8
LC_MESSAGES=en_US.UTF-8
LC_PAPER=fr_FR.UTF-8
LC_NAME=fr_FR.UTF-8
LC_ADDRESS=fr_FR.UTF-8
LC_TELEPHONE=fr_FR.UTF-8
LC_MEASUREMENT=fr_FR.UTF-8
LC_IDENTIFICATION=fr_FR.UTF-8
LC_ALL=
|
Ca marche, c'est bien plus propre (à mon gout) et pas d'écart de traduction comme ca
Sinon j'ai les memes locales.build que les autres amis, et j'ai ceci en /etc/env.d/02locale
Code: |
$ more /etc/env.d/02locale
LANG="fr_FR.UTF-8"
LC_CTYPE="fr_FR.UTF-8"
LC_NUMERIC="fr_FR.UTF-8"
LC_TIME="fr_FR.UTF-8"
LC_COLLATE="fr_FR.UTF-8"
LC_MONETARY="fr_FR.UTF-8"
LC_MESSAGES="en_US.UTF-8"
LC_PAPER="fr_FR.UTF-8"
LC_NAME="fr_FR.UTF-8"
LC_ADDRESS="fr_FR.UTF-8"
LC_TELEPHONE="fr_FR.UTF-8"
LC_MEASUREMENT="fr_FR.UTF-8"
LC_IDENTIFICATION="fr_FR.UTF-8"
LC_ALL=""
|
Bonne continuation |
|
Back to top |
|
|
marvin rouge Veteran
Joined: 01 Aug 2004 Posts: 1422 Location: Villa Lumierrante, Zonelibre
|
Posted: Tue Nov 08, 2005 8:32 am Post subject: |
|
|
Et pour avoir tout le système en francais, sauf les man-pages, il faut mettre sys-apps/man-pages -nls dans /etc/portage/package.use
|
|
Back to top |
|
|
nemo13 Veteran
Joined: 08 Oct 2004 Posts: 1016 Location: France/Istres
|
Posted: Thu Nov 10, 2005 10:27 pm Post subject: |
|
|
bonsoir,
Merci à tous ceux qui se sont penchés sur ce post
donc après deux soirs de lecture sur le web des réussites ou des déboires de ceux
qui ont taté de l'utf8 j'en suis resté , pour le moment , à l'étape suivante:
dans /etc/man.conf
Code: | NROFF iconv -f utf8 -t iso8859-1 | /usr/bin/nroff -mandoc -c -mandoc -Tutf8 |
A priori, pour tous les man-fr que j'ai lu, il n'y aurait celui de mplayer
qui présenterait des artéfacts d'affichage.
j'essaye maintenat de voir les pistes suivantes :
1) serait-ce ma fonte qui n'est adaptée à l'utf8 ?
(mais pourquoi que pour mplayer ?)
2) mon noyau qui est mal configuré ?
Code: | nemo13@gentoo ~ $ grep -i nls /usr/src/linux/.config
CONFIG_UDF_NLS=y
CONFIG_NLS=y
CONFIG_NLS_DEFAULT="iso8859-1"
CONFIG_NLS_CODEPAGE_850=y
CONFIG_NLS_ASCII=y
CONFIG_NLS_ISO8859_1=y
CONFIG_NLS_ISO8859_15=y
CONFIG_NLS_UTF8=y
|
( A propos pourquoi n'y aurait-il pas dans le noyau un
Code: | CONFIG_NLS_ISO10646= |
puisque la normalisation ISO de l'unicode est 10646 ?
A+:jlp |
|
Back to top |
|
|
nemo13 Veteran
Joined: 08 Oct 2004 Posts: 1016 Location: France/Istres
|
Posted: Tue Jan 17, 2006 11:24 pm Post subject: |
|
|
Bonsoir,
ok c'est une "ressucitation" de topic mais j'ai avancé sur les point suivants :
1) mon titre n'est plus bon car après analyse
ce n'est pas une histoire utf8 majuscule ou minuscule
c'est :flute je suis en UTF8 et à l'écran je perd mes caractères accentués
mais pas dans toutes les applis !
( je pense pas que ce titre passe )
c'est une somme de différents problèmes :
Pour les pages man_fr :
bien qu'en modifiant NROFF dans /etc/man.conf
( au choix de l'experimentateur )
Code: |
#NROFF /usr/bin/nroff -Tascii -c -mandoc
#result mplayer francais sans accent c bidon man 7 utf-8 bidon
#NROFF /usr/bin/nroff -mandoc -c
#result mplayer ok c bidon man 7 utf-8 bidon
#NROFF /usr/bin/nroff -Tlatin1 -c -mandoc
# perte des "à" et apparition codes
#NROFF iconv -f utf8 -t iso8859-1 | /usr/bin/nroff -mandoc -c -mandoc -Tutf8
# mplayer plante c ok man 7 utf-8 ok
#NROFF iconv -f utf8 -t iso8859-15 | /usr/bin/nroff -mandoc -c -mandoc -Tutf8
# a priori rien de plus que ligne precedente
#NROFF recode utf8 iso8859-15 | /usr/bin/nroff -mandoc -Tlatin1 #marche pas syntaxe ?
#NROFF /usr/bin/nroff -utf8 -c -mandoc
#mplayer ok c bidon man 7 utf-8 bidon |
donc pour le moment faut choisir :
ou man mplayer , ou man C et man 7 utf-8
Pourquoi cette différence ?
d' après moi elle vient de là :
(j'ai décompressé les fichiers
/usr/share/man/fr/man1/mplayer.1.gz
/usr/share/man/fr/man1/c.1.gz
dans mon home )
Code: | nemo13@gentoo ~ $ file -i mplayer.1
mplayer.1: text/troff; charset=iso-8859-1
nemo13@gentoo ~ $ file -i c.1
c.1: text/troff; charset=utf-8
|
donc encodage texte man de mplayer :iso-8859-1
encodage texte man de c :utf-8
Conclusion pour les man_fr : la solution n'est pas en modifiant /etc/man.conf
Pour les autres problèmes d'accents
il s'agissait d'applis en gtk ( Xmms pour pas le nommer ) qui ne supportent
pas nativement l'utf8
plus de problème puisque maintenant la doc gentoo utf8 donne la solution.
( il y a aussi des topics récents sur notre forum )
voili voila pour le moment :
pour avancer plus sur les man_fr j'aurais voulu explorer les autres fichiers
mais
Code: | file -i /usr/share/man/fr/man1/mplayer.1.gz
/usr/share/man/fr/man1/mplayer.1.gz: application/x-gzip |
et
Code: | file -i `/bin/gunzip -c /usr/share/man/fr/man1/mplayer.1.gz`
bash: /usr/bin/file: Liste d'arguments trop longue |
bref sur ce truc de "programmation" chui une bille
Quelle syntaxe dois-je utiliser pour extraire que l'info de charset sans devoir me frapper la décompression des fichiers ?
edit pour ma bête question
faut lire le man de file jusqu'au bout :
Code: | -z, --uncompress
Try to look inside compressed files. |
d'où par exemple :
nemo13@gentoo ~ $ file -iz /usr/share/man/fr/man1/mplayer.1.gz
/usr/share/man/fr/man1/mplayer.1.gz: text/troff; charset=iso-8859-1 (application/x-gzip)
nemo13@gentoo ~ $ file -iz /usr/share/man/fr/man1/c.1.gz
/usr/share/man/fr/man1/c.1.gz: text/troff; charset=utf-8 (application/x-gzip)
nemo13@gentoo ~ $ file -iz /usr/share/man/fr/man1/passwd.1.gz
/usr/share/man/fr/man1/passwd.1.gz: text/troff; charset=iso-8859-1 (application/x-gzip)
nemo13@gentoo ~ $ file -iz /usr/share/man/fr/man1/write.1.gz
/usr/share/man/fr/man1/write.1.gz: text/troff; charset=utf-8 (application/x-gzip)
nemo13@gentoo ~ $ Code: |
et comme par hazard, en ayant dans /etc/man.conf
| NROFF iconv -f utf8 -t iso8859-1 | /usr/bin/nroff -mandoc -c -mandoc -Tutf8 Code: |
les man de mplayer et password plantent
les man de c et write passent pile poil. |
|
|
Back to top |
|
|
ryo-san l33t
Joined: 17 Feb 2005 Posts: 729
|
Posted: Wed Jan 18, 2006 6:17 am Post subject: |
|
|
ok pas vu que tu avais trouvé la soluce. |
|
Back to top |
|
|
_kal_ l33t
Joined: 04 Mar 2005 Posts: 602 Location: Paris
|
Posted: Wed Jan 18, 2006 9:15 am Post subject: |
|
|
Code: | vaio ~ # cat /etc/env.d/02locale
LC_ALL="fr_FR.UTF-8"
|
Perso, si je met en minuscule, les applis ncurses sont buggué a mort chez moi.
En revanche, en majuscule c'est parfait |
|
Back to top |
|
|
Adrien Advocate
Joined: 13 Jul 2004 Posts: 2311 Location: Bretagne
|
Posted: Wed Jan 18, 2006 9:30 am Post subject: |
|
|
nemo13 wrote: | Bonsoir,
ok c'est une "ressucitation" |
..... "résurrection"
Merci à tous pour ces tips fort utiles! |
|
Back to top |
|
|
nemo13 Veteran
Joined: 08 Oct 2004 Posts: 1016 Location: France/Istres
|
Posted: Wed Jan 18, 2006 4:43 pm Post subject: |
|
|
bonsoir à tous ,
_KAL_ > je suis aussi en Maj dans /etc/env.d/02locale
je n'ai pas testé en minuscule.
Adrien > à l'origine ce n'était un tip mais un appel au secours
mon pb des man_fr n'est pas résolu mais +- contourné
ce que je n'arrive pas à comprendre c'est pourquoi il y a des man_fr
encodé utf8 et d'autres en 8859
il aurait bien la solution de passer tous ces man par iconv
mais je crains qu'au prochain emerge je perde toutes les modif !
"ressucitation" était entre double crochets |
|
Back to top |
|
|
nemo13 Veteran
Joined: 08 Oct 2004 Posts: 1016 Location: France/Istres
|
Posted: Fri Jan 20, 2006 9:03 pm Post subject: |
|
|
bonsoir,
Je viens de faire un tour sur https://bugs.gentoo.org/
Pour mplayer
https://bugs.gentoo.org/show_bug.cgi?id=92017
pour le peu que je comprenne l'anglais , il y aurait une modif de l'Ebuild car mplayer filtrait le charset dommage que la modif ne serait appliqué que pour les localisations :
Code: | Here latest ebuild (mplayer-1.0pre7-r1 from rsync) with unicode support.
Now configure script support option "--charset".
Added keyword - unicode.
Supported language: bg cs de en hu pl ru uk. |
(enfin si j'ai bien décodé )
sinon man aurait aussi des pbs mais là j'ai pas capté grand chose
( rechercher avec "manpage")
A+:jlp |
|
Back to top |
|
|
nemo13 Veteran
Joined: 08 Oct 2004 Posts: 1016 Location: France/Istres
|
Posted: Sun Jan 22, 2006 10:33 pm Post subject: |
|
|
bonsoir,
\o/ le script qui va bien
quel courageux osera essayer ce kindy-script de la mort ..qui tue
https://forums.gentoo.org/viewtopic-t-425826.html
euh pas la tête c'est mon premier!
édit ben cà alors et mon e accent circonflex ? ê à é ù è |
|
Back to top |
|
|
|