View previous topic :: View next topic |
Utilisez vous des locales UTF-8 ? |
Oué ! Et ça rOxOr, je code même en unicode avec un gcc patché ! |
|
7% |
[ 4 ] |
Je fais un mix, UTF-8 le plus possible, sauf quand ça marche pas. |
|
26% |
[ 14 ] |
J'utilise UTF-8 à l'occasion, quand nécéssaire, mais je suis plus ISO-8859-1(5). |
|
17% |
[ 9 ] |
Nan, la flemme, dans quelques années peut-être si c'est par défaut... |
|
32% |
[ 17 ] |
C'est quoi un encodage, les locales, unicode et iso-truc ? |
|
15% |
[ 8 ] |
|
Total Votes : 52 |
|
Author |
Message |
TGL Bodhisattva
![Bodhisattva Bodhisattva](/images/ranks/rank-bodhisattva.gif)
Joined: 02 Jun 2002 Posts: 1978 Location: Rennes, France
|
Posted: Tue May 27, 2003 4:09 pm Post subject: Locales : UTF-8 vs. ISO-8859-1(5) |
|
|
Bonjour les gens,
J'aimerais connaitre un peu vos avis et expériences sur l'utilisation de locales UTF-8 (genre fr_FR.UTF-8, au hasard...). En fait, jusque maintenant, je suis resté en fr_FR@euro, donc en ISO-8859-15 je crois, et j'hésite à franchir le pas de l'unicode. J'étais bien content sans jusque là, mais depuis quelques temps j'essaye d'utiliser des trucs modernes et ils font rien qu'à se plaindre. C'est que j'utilise des noms de fichiers en ISO-8859-15 alors que Rox Filer ne supporte que le UTF-8, que les tags de mes mp3/ogg aussi sont en ISO-8859-15 alors que Net-Rhythmbox les voudrait en UTF-8, etc.
Donc je songe à changer de locale disais-je, mais je me doute que ça n'ira pas sans mal... Il faudra je suppose que je recode les noms de fichiers (bon, ça avec un script autour de iconv ça devrais pouvoir se faire), que je crée les locales qui vont bien (bon, ça aussi, j'ai vu le truc, ça devrais aller), que je convertisse éventuellement certains fichiers texte (encore que, ça doit pas être vraiment la peine), etc. Mais je m'attends à des emmerdes, il parait que XFree il aime pas ça par exemple, je me doute bien que plein d'applis utilisants d'autres bibliothèques n'aimeront pas non plus, que j'aurais du mal à trouver mon bonheur niveaux fonts, etc. Donc si certains ont de l'expérience, bonne ou mauvaise là dedans, je suis preneur.
L'autre solution est de feinter pour rester en ISO-8859-15 malgré les exigeances de GTK-2, avec des bidouilles genre Code: | export G_BROKEN_FILENAMES=1
export CHARSET=iso-8859-15 |
Mais ça n'a pas l'air suffisant pour virer les salves de warnings de certaines applis... Ou encore de mixer un peu les deux locales, genre se mettre en UTF-8 que pour les machins modernes qui ne veulent que ça, mais là je suppose que ça va être le bazar pour les noms de fichiers accentués par exemple. Donc sur ce plan des bidouilles aussi, si vous avez des astuces, je suis preneur.
À titre de référence, voilà ce que j'ai sous le coude pour l'instant, mais si vous avez autre chose ça m'intérresse:
UTF-8 and Unicode FAQ for Unix/Linux
The Unicode HOWTO |
|
Back to top |
|
![](templates/gentoo/images/spacer.gif) |
yuk159 Veteran
![Veteran Veteran](/images/ranks/rank_rect_5_vet.gif)
![](images/avatars/44288576244ba5392c2df1.jpg)
Joined: 18 Apr 2003 Posts: 1803 Location: noumea ,nouvelle-caledonie
|
Posted: Tue May 27, 2003 10:25 pm Post subject: |
|
|
tu pourrai m'expliquer en deux mots a quoi ca sert .
j'ai lu (un peu) la FAQ mais j'ai pas compris grand chose.
pour l'instant en tout cas moi c'est fr_FR@euro _________________ The box said: "Requires Windows 98/2000/XP/NT, or better."
So, I installed LINUX!
Instagram |
|
Back to top |
|
![](templates/gentoo/images/spacer.gif) |
TGL Bodhisattva
![Bodhisattva Bodhisattva](/images/ranks/rank-bodhisattva.gif)
Joined: 02 Jun 2002 Posts: 1978 Location: Rennes, France
|
Posted: Tue May 27, 2003 11:31 pm Post subject: |
|
|
yuk159 wrote: | tu pourrai m'expliquer en deux mots a quoi ca sert . |
Bon, je m'y connais pas des masses, je vais surement dire des conneries, mais temps pis, allons y...
À quoi que ça sert ? Heu... à rien, enfin pas grand chose pour tous ceux qui sont déjà contents sans en fait (typiquement nous, qui pouvons nous exprimer avec un jeux de caractères contenant l'ASCII plus quelques bidouilles).
Mais vu que c'est pas le cas de tout le monde, unicode arrive à la rescousse. C'est un jeu de caractères énorme (y'a une version 16bits et une 32 je crois, donc 65536 caractères pour la première, et vachement beaucoup pour l'autre), censé +/- englober tout ceux déjà existants, et à termes les remplacer. T'as sûrement souvent reçu des mails avec les accents qui passaient pas bien, ou vu ça sur des pages web ? Et bah c'est des symptôme des problèmes que posent la multiplicité des encodages existants, et encore, ça c'est juste pour le français... Donc unicode est une solution pour se débarrasser une fois pour toute de tout ces soucis en mettant tout le monde d'accord, de la France à la Chine.
UTF-8 là dedans c'est un moyen relativement compact de représenter l'unicode, en restant compatible avec le ASCII pour ce qui est des caractères ASCII. Grosso modo, "toto" en iso-8859-15 comme chez toi ou en UTF-8, c'est la même chaîne de bits. Le truc, c'est juste que pour les caractères plus zarbs, genre les kanji ou bien nos caractères accentués, et bah on utilise plusieurs octets de suite en UTF-8. Du coup, si tu code "tïtï" en UTF-8, et que tu relis la chaîne en l'interprétant comme du iso-8859-15, tu vois "tïtï". C'est un codage utilisé déjà pas mal pour des contenus textuels, surtout sur le web, parceque c'est là que y'a le plus besoin d'universalité (tu dois probablement browser des pages en utf8 sans le savoir de temps en temps, ou recevoir des mails avec cet encodage). Habituellement, on fait plutôt ses fichiers textes en iso-8859-(1 ou 15), mais les faire en utf8 ne pose pas trop de problème (emacs et vim supportent ça très bien par exemple).
Mais là ou ça se complique, c'est pour tout ce qui est système et réseau. Par exemple, et quel exemple, les noms de fichiers sur ton dur ont eux aussi un encodage. Si t'as un fichier "tïtï", un russe qui fait un ssh chez toi il ne verra ce nom tout déformé. D'où l'idée très en vogue d'utiliser UTF-8 pour coder aussi son filesystem par exemple. Autre exemple, les url sur le web sont pour l'instant limités aux caractères ascii, mais les papous ça les embête un peu, c'est pas leur alphabet... allez zou, un jour ça passera en unicode ! Mais je te dis pa le boulot pour adapter tout les bon vieux softs qui font marcher internet...
Alors pour l'instant, toi et moi, on s'en fout un peu, c'est clair. Mais comme c'est l'avenir, et bah y'en a qui ont déjà pris de l'avance. Par exemple dans Qt et Gtk, depuis quelques temps, UTF-8 est l'encodage par défaut des chaînes de caractères. Pour l'instant, la plupart des applications se cognent la conversion locale->utf8 quand elles lisent sur ton dur, et utf8->locale quand elle écrivent. Mais ça n'est déjà plus toujours vrai (cf. net-rhythmbox ou rox cités dans mon 1er message). D'où l'idée que j'avais de franchir moi aussi le pas pour rattraper ces applications. C'est le principal intérêt que je vois à passer en UTF-8 sous linux. Mais en même temps y' a aussi des applis à la traine, dont certains machins assez essentiels pour le système. Bref, la transition est assez cahotique et risquée. Ceci dit, certaines distribs (redhat par exemple), ont franchi le cap déjà, et utilisent maintenant UTF-8 par défaut. Alors pourquoi pas nous ?
Bon, bah je sais pas si c'est clair, et y'a surement des boulettes, donc t'arrêtes pas à ma prose non plus. Tu peux lire ça aussi si tu veux:
http://www.unicode.org/standard/translations/french.html |
|
Back to top |
|
![](templates/gentoo/images/spacer.gif) |
yuk159 Veteran
![Veteran Veteran](/images/ranks/rank_rect_5_vet.gif)
![](images/avatars/44288576244ba5392c2df1.jpg)
Joined: 18 Apr 2003 Posts: 1803 Location: noumea ,nouvelle-caledonie
|
Posted: Wed May 28, 2003 12:02 am Post subject: |
|
|
merci pour ta reponse , elle est tres claire est je comprend mieux l'interet de la chose .
je vais aller lire un peut sur le sujet
a+ _________________ The box said: "Requires Windows 98/2000/XP/NT, or better."
So, I installed LINUX!
Instagram |
|
Back to top |
|
![](templates/gentoo/images/spacer.gif) |
arlequin l33t
![l33t l33t](/images/ranks/rank_rect_4.gif)
![](images/avatars/c1fd32733dd67e8e5736a.jpg)
Joined: 16 Nov 2002 Posts: 707 Location: grep $USER /etc/passwd | cut -d':' -f6
|
Posted: Wed May 28, 2003 7:51 am Post subject: |
|
|
Ah voilà... ç peine lu les premières lignes du sujet que j'avais déjà la Red Hat en tête. C'est vrai que eux font le pari de l'UTF-8. Et ça tient pas mal la route. Si tout ton système est homogène et a été batît sur cet encodage, alors là ça rulez... Enfin, jusqu'à un certains point ! Ainsi, chat ne fonctionnait pas correctement jusqu'à sa version 2 (qui apportent le support des locales). Alors quand t'es un petit frenchy comme moi et que tous les accents partent en lattes quand tu écris... ça énerve
Pour la Mandrake, il me semble qu'ils sont restés en ISO-machin-15. Et ça marche plutôt bien. Mais jusqu'à quel point ? Parce que passer comme paramètre une locale quand tu mount un volume, faut le savoir. Ralala, si je n'avais pas de FAT32/NTFS.
Pour l'instant, chui en ISO-machin-1. Je n'ai encore pas trop à me plaindre. Les accents sous galleon passent mieux que sur mon IE5 du boulot. Alors c'est cool. Maintenant, ce qu'il serait intéressant de voir, c'est que se passera-t-il si demain je passe entièrement en UTF-8 ?? Ahah !
Je pense que c'est une question que pas mal de gens (qui ont réfléchis au sujet) se posent... A voir...
Ceci dit, les locales restent encore un petit point noir sur le nez de notre Nunux... _________________ J'vous dis ciao !
Au fait, ciao ça veut dire bye en anglais. |
|
Back to top |
|
![](templates/gentoo/images/spacer.gif) |
TGL Bodhisattva
![Bodhisattva Bodhisattva](/images/ranks/rank-bodhisattva.gif)
Joined: 02 Jun 2002 Posts: 1978 Location: Rennes, France
|
Posted: Wed May 28, 2003 12:37 pm Post subject: |
|
|
Est-ce que le (les) «Je fais un mix, UTF-8 le plus possible, sauf quand ça marche pas.» pourrai(en)t détailler un peu... Je suis sûr que ce serait très utile.
Merci d'avance. |
|
Back to top |
|
![](templates/gentoo/images/spacer.gif) |
DuF Advocate
![Advocate Advocate](/images/ranks/rank-G-1-advocate.gif)
![](images/avatars/500f78f33e18696e0a90f.jpg)
Joined: 09 Dec 2002 Posts: 2687 Location: Paris
|
Posted: Wed May 28, 2003 12:59 pm Post subject: |
|
|
bon moi pour le moment la flemme, même si c'est bien comme principe, qu'il faudra y venir, pour le moment c'est trop d'emmerdes pour y passer complètement ! |
|
Back to top |
|
![](templates/gentoo/images/spacer.gif) |
dioxmat Bodhisattva
![Bodhisattva Bodhisattva](/images/ranks/rank-bodhisattva.gif)
Joined: 04 May 2002 Posts: 709 Location: /home/mat
|
Posted: Wed May 28, 2003 11:27 pm Post subject: |
|
|
Moi j'ai la solution ultime: je tape avec un qwerty, jai la flemme de mettre les accents, et du coup tout est en ascii ou presque, et compatible avec le plus grand monde :) _________________ mat |
|
Back to top |
|
![](templates/gentoo/images/spacer.gif) |
DuF Advocate
![Advocate Advocate](/images/ranks/rank-G-1-advocate.gif)
![](images/avatars/500f78f33e18696e0a90f.jpg)
Joined: 09 Dec 2002 Posts: 2687 Location: Paris
|
Posted: Thu May 29, 2003 4:27 pm Post subject: |
|
|
Le problème dans ta technique, voir raisonnemnet, c'est que dans ce cas là pour être tranquille dans l'absolu, le plus simple serait d'écrire en anglais, comme ça personne n'aurait de problèmes et tout le monde se comprendrait... nous on a les accents, les espagnols ont leur spécificités, les russes aussi, enfin bon t'as de la chance que tu peux écrire sans accent et que le français reste compréhensible malgré tout
Imagine que tu sois brésilien ou autre, des langues avec des caractères tout chelou, ton clavier en qwerty ne t'aiderait pas beaucoup
C'est marrant comment une même motivation (la flemme) débouche sur des technique différentes....
Plus sérieusement, ce problème on ne pourra pas y échapper, il faudra bien y venir, mais bon faut avouer que c'est le bordel, et tant que les gros projets ne montreront pas le bon exemple.... c'est pas gagné....
Sinon si certains utilisent l'UTF-8 pour pas mal d'applis, sans parler de comment ils ont fait (il y a déjà des how-to) mais ce serait intéressant comme l'a dit TGL d'avoir des infos sur ce type d'expérience, pb rencontrés, etc....
[rêve]Au passage en kernel 2.6, on passe tous en UTF-8, les programmes et les utilisateurs, et tout le monde l'est content [/rêve] |
|
Back to top |
|
![](templates/gentoo/images/spacer.gif) |
erwan Apprentice
![Apprentice Apprentice](/images/ranks/rank_rect_2.gif)
![](images/avatars/17276382053ed99608d2186.jpg)
Joined: 01 Jun 2003 Posts: 150 Location: Tokyo
|
Posted: Tue Jun 03, 2003 4:31 am Post subject: |
|
|
Ben oui, par exemple moi j'ai le malheur d'etre français et d'habiter au Japon alors l'unicode c'est indispensable.
Pour ça on est vraiment à la traine, Windows XP et MacOSX sont déjà tout en unicode... Vivement que ce soit enfin le cas pour Linux ! _________________ See me on Jabber: erwan@im.loisant.org |
|
Back to top |
|
![](templates/gentoo/images/spacer.gif) |
dioxmat Bodhisattva
![Bodhisattva Bodhisattva](/images/ranks/rank-bodhisattva.gif)
Joined: 04 May 2002 Posts: 709 Location: /home/mat
|
Posted: Tue Jun 03, 2003 9:30 am Post subject: |
|
|
Bah techniquement c'est ce que fait redhat. et il est possible de le faire avec gentoo en forcant un peu. _________________ mat |
|
Back to top |
|
![](templates/gentoo/images/spacer.gif) |
erwan Apprentice
![Apprentice Apprentice](/images/ranks/rank_rect_2.gif)
![](images/avatars/17276382053ed99608d2186.jpg)
Joined: 01 Jun 2003 Posts: 150 Location: Tokyo
|
Posted: Tue Jun 03, 2003 1:30 pm Post subject: |
|
|
Tiens, pour le moment j'ai remarque que quand elles etaient disponibles, gdm choisit des locales unicodes (si on choisit de fixer la langue).
C'est une bonne chose. _________________ See me on Jabber: erwan@im.loisant.org |
|
Back to top |
|
![](templates/gentoo/images/spacer.gif) |
michel v Tux's lil' helper
![Tux's lil' helper Tux's lil' helper](/images/ranks/rank_rect_1.gif)
Joined: 10 Jul 2003 Posts: 100 Location: Corsica
|
Posted: Thu Jul 10, 2003 8:36 pm Post subject: |
|
|
erwan wrote: | Pour ça on est vraiment à la traine, Windows XP et MacOSX sont déjà tout en unicode... Vivement que ce soit enfin le cas pour Linux ! |
OSX peut être mais Windows XP, au moins dans sa version française, n'utilise pas l'Unicode partout. Il y a le support de l'Unicode, mais encore faut-il que l'application qui ouvre ton fichier UTF8 supporte ça.
Et manque de bol, j'en connais pas des masses.
Du coup je reste en fr_FR@euro, parce que le dual-boot avec des ïïï dans mes noms de fichiers d'un coté (créés par une appli Windows) comme de l'autre (créés par une appli Linux en UTF8) c'est lourd.
--
Par contre y'a une lueur d'espoir à la lecture de 'locale' et 'mount' dans la même phrase. Je vais voir si y'a moyen d'ouvrir les fichiers iso-8859-1 sur les partitions windows comme s'ils étaient en utf8 à partir de fstab. ![Smile :)](images/smiles/icon_smile.gif) |
|
Back to top |
|
![](templates/gentoo/images/spacer.gif) |
erwan Apprentice
![Apprentice Apprentice](/images/ranks/rank_rect_2.gif)
![](images/avatars/17276382053ed99608d2186.jpg)
Joined: 01 Jun 2003 Posts: 150 Location: Tokyo
|
Posted: Fri Jul 11, 2003 5:03 am Post subject: |
|
|
michel v wrote: |
OSX peut être mais Windows XP, au moins dans sa version française, n'utilise pas l'Unicode partout. Il y a le support de l'Unicode, mais encore faut-il que l'application qui ouvre ton fichier UTF8 supporte ça.
Et manque de bol, j'en connais pas des masses.
|
Oui, c'est vrai qu'il faut que les applis soient unicode. C'est le cas des applis MS recentes, de Mozilla mais le reste est generalement en "vieille locale" (iso-8859-1(5) pour le francais et Shift_JIS pour le japonais). Donc a l'epoque ou j'avais encore Windows, c'etait une version anglaise avec une locale japonaise ; ca me permettait de faire tourner les applis japonaises codees en Shift_JIS.
Finalement gtk2 ayant un bon support du multilingue j'ai reussi a me passer completement de Windows. Et ca fait du bien ; a ce niveau-la quelque chose de tres sympa sous Linux c'est qu'on peut avoir des langues differentes sur un meme ordinateur, alors que Windows n'a qu'une langue (CD different suivant les langues).
Ca permet d'avoir un systeme en francais, alors que les collegues meme etrangers doivent generalement utiliser un Windows en japonais ; par ailleurs a l'epoque ou j'avais mon Windows anglais les collegues japonais etaient paumes quand ils venaient sur ma machine.
Bref, j'ai change d'avis depuis mon dernier message du 3 juin ; Gtk+ 2 et par consequent Gnome 2 sont tres bons pour le multilingue. _________________ See me on Jabber: erwan@im.loisant.org |
|
Back to top |
|
![](templates/gentoo/images/spacer.gif) |
TGL Bodhisattva
![Bodhisattva Bodhisattva](/images/ranks/rank-bodhisattva.gif)
Joined: 02 Jun 2002 Posts: 1978 Location: Rennes, France
|
Posted: Fri Jul 11, 2003 10:07 am Post subject: |
|
|
erwan wrote: | Bref, j'ai change d'avis depuis mon dernier message du 3 juin ; Gtk+ 2 et par consequent Gnome 2 sont tres bons pour le multilingue. |
Mouais, eux c'est clair. Je crois que le couple Qt/KDE n'a aucun soucis non plus. Mais bon, ces applis modernes ne remplacent pas encore tout. |
|
Back to top |
|
![](templates/gentoo/images/spacer.gif) |
grimko n00b
![n00b n00b](/images/ranks/rank_rect_0.gif)
Joined: 21 Jul 2003 Posts: 7 Location: Rouen / France
|
Posted: Tue Jul 22, 2003 10:19 am Post subject: |
|
|
Bonjour a tous,
je debarque sous Gentoo et je nai pas encore vu l'unicode a l'oeuvre mais voila la config que javais avant (pardon pour les accents je suis au Japon aussi) sous un autre Linux sous gnome2 :
javais un systeme entierement en unicode ce qui permettait d'ecrire en Japonais comme en Francais dans une partition partagee entre Linux et WindowsXP, aussi bien a l'interieur que pour les noms de fichiers, le tout etant tres bien supporte des deux cotes.
De meme les noms de chanson dans Xmms et les messages dans la console.
A mon avis un systeme comme Linux ya pas mieux pour le support de plusieurs langues, je voulais juste dire que c tout a fait possible de tout faire marcher, et j'espere bien le faire d'ici peu sous Gentoo, si des gens se sont penche la dessus ca m'interesse.
PS : ct mon premier message ![Razz :P](images/smiles/icon_razz.gif) |
|
Back to top |
|
![](templates/gentoo/images/spacer.gif) |
|
|
You cannot post new topics in this forum You cannot reply to topics in this forum You cannot edit your posts in this forum You cannot delete your posts in this forum You cannot vote in polls in this forum
|
|