kernelsensei Bodhisattva
Joined: 22 Feb 2004 Posts: 5619 Location: Woustviller/Moselle/FRANCE (49.07°N;7.02°E)
|
Posted: Thu Jul 08, 2004 10:39 am Post subject: [Prog C] Detecter le charset d'une phrase donnee (Non reso) |
|
|
Voila, en ce moment je m'ammuse avec un plugin irssi, charconv et je l'ai deja bidouille pour qu'il fonctionne avec le japonais (iso-2022-jp), tout fonctionne correctement a partir du moment ou l'on specifie a la main le charset/server ou charset/channel ou encore charset/nickname!
Je voudrais l'ameliorer pour qui "detecte" l'encodage entrant, afin qu'il decide tout seul, comme un grand garcon quel charset utiliser pour le decodage
Existe-t -il des algos/fonctions C pour y arriver ? (pour l'instant je cherche surtout des infos sur la structure des differents encodages, afin de pouvoir les differencier, je ne demande pas un code tout fini )
Pour un debut, la detection de : iso-8859-15, iso-8859-1, iso-2022-jp et utf8 serait deja pas mal !
Merci .
[EDIT]Si quelqu'un a une idee de Titre plus clair, je suis preneur ![/EDIT] _________________ $ ruby -e'puts " .:@BFegiklnorst".unpack("x4ax7aaX6ax5aX15ax4aax6aaX7ax2aX5aX8 \
axaX3ax8aX4ax6aX3aX6ax3ax3aX9ax4ax2aX9axaX6ax3aX2ax4ax3aX4aXaX12ax10aaX7a").join' |
|