Gentoo Forums
Gentoo Forums
Gentoo Forums
Quick Search: in
[SCRIPT] nom de fichier à codage non valide (résolu)
View unanswered posts
View posts from last 24 hours

 
Reply to topic    Gentoo Forums Forum Index French
View previous topic :: View next topic  
Author Message
pti-rem
Guru
Guru


Joined: 14 Oct 2011
Posts: 490

PostPosted: Thu Nov 10, 2011 9:44 am    Post subject: [SCRIPT] nom de fichier à codage non valide (résolu) Reply with quote

Bonjour,

J'utilise Gnome et Nautilus ; Nautilus précise (codage non valide) pour certains de mes fichiers et je sais qu'il me suffit de les renommer un par un pour que je n'ai pas de problème avec si le problème de codage ne concerne que le nom de fichier et pas son contenu.

Je voudrais avoir une idée de comment repérer (chemin+nom) ces fichiers dont le nom est mal codé ... avec un find par exemple ?

Il aurait été trop simple de chercher "(codage non valide)" car même Nautilus ne sait pas trouver ce qu'il m'affiche ;-)

Merci aux bons amateurs de scripts car avec l'empreinte laissée sur moi par COMMAND.COM, je suis un peu nul du Bash ...


Last edited by pti-rem on Sat Nov 12, 2011 9:52 am; edited 1 time in total
Back to top
View user's profile Send private message
fb99
l33t
l33t


Joined: 09 Apr 2003
Posts: 998
Location: Le Locle (Suisse,Neuchâtel)

PostPosted: Thu Nov 10, 2011 2:15 pm    Post subject: Reply with quote

en principe ça doit être des fichier que tu as crée. Donc, en appliquant avec un petit boucle (for) l'utilitaire convmv ($man convmv && http://www.gentoo.org/doc/fr/utf-8.xml#doc_chap3_pre3), tu devrais t'en sortir.
$man convmv wrote:
convmv is able to detect if certain files are UTF-8 encoded and will skip them by default


Il n'est jamais trop tard pour apprendre. regarde sur un moteur de recherche "bash boucle for" + $man convmv, après tu nous poste ton essais de script ici ou tu le test déjà sur un petit répertoire (sans l'option --notest)

donc ton script doit comprendre un "for" et un truc du style "$convmv -f iso-8859-1 -t utf-8 -r $HOME "

bon courage, si tu bloque plus de 30 min revient et on te donnera la solution.
_________________
L'ami aime en tout temps, et dans le malheur il se montre un frère ( Prov. 17,17 )
L'insensé même, quand il se tait, passe pour sage ( Prov. 17;28a )
Back to top
View user's profile Send private message
pti-rem
Guru
Guru


Joined: 14 Oct 2011
Posts: 490

PostPosted: Thu Nov 10, 2011 3:30 pm    Post subject: Reply with quote

Bon, j'ai cherché d'après tes infos.

Je n'ai pas eu à utiliser de boucle FOR car convmv est récursif avec -r

J'ai utilisé la commande suivante sur un répertoire de test :

Code:
rem@jardin ~/Desktop/convmv $ convmv -f iso-8859-1 -t utf-8 -r .


Je préfère donner une copie d'écran du résultat qui me dit que tous les fichiers sont déja en UTF-8 ... Même ceux que Nautilus indique en codage non valide.

http://chezpoint.free.fr/gentoo/Desktop-convmv.png

J'ai aussi un problème de réunion de sauvegardes qui comporte le même répertoire/fichier bien codé ainsi qu'au moins un qui l'est - indiqué - mal.

Merci pour ton aide


Last edited by pti-rem on Thu Nov 10, 2011 4:39 pm; edited 1 time in total
Back to top
View user's profile Send private message
pti-rem
Guru
Guru


Joined: 14 Oct 2011
Posts: 490

PostPosted: Thu Nov 10, 2011 4:00 pm    Post subject: Reply with quote

J'ai passé tout mon répertoire Audio avec la commande précédente en dry-run et il (convmv) ne sait me dire que des "Skpiping, Already UTF-8" pour un ensemble de fichiers comprenant des bons ainsi que des mauvais - au sens de ma recherche ; remarque, à chaque chose, malheur a du bon car j'ai ainsi une liste de fichier presque bien formée que je pourrai renommer à la main si besoin.


http://chezpoint.free.fr/gentoo/convmv-audio-souk.png

Somme toute, j'aimerai bien comprendre ...
Back to top
View user's profile Send private message
sebB
l33t
l33t


Joined: 02 Mar 2011
Posts: 806
Location: S.O. France

PostPosted: Thu Nov 10, 2011 9:44 pm    Post subject: Reply with quote

Tu utilises quelle version de convmv?
Si tu es en stable essaye en demasquant la 1.14, ca résoud le probleme chez certains.

EDIT: Il est sympa le répertoire Pauline dans ton 2nd screen
Back to top
View user's profile Send private message
fb99
l33t
l33t


Joined: 09 Apr 2003
Posts: 998
Location: Le Locle (Suisse,Neuchâtel)

PostPosted: Fri Nov 11, 2011 12:36 am    Post subject: Reply with quote

ah oui que je suis beuf, même pas besoin de script, pff...

1ère chose apprendre ceci:

http://monidentite.net/index.php/Encodage#Reconnaissance_rapide_des_probl.C3.A8mes_d.27affichage_UTF-8_.2F_ISO wrote:
Voici une chaine de caractère accentuée, qui peut poser problème :

é - è - ê - à - â - î - ï



Si la page affiche des caractères de ce type :

é - è - ê - à - â - î - ï

Les données sont encodés en UTF-8 et affichées par le navigateur en ISO-8859-1 (Latin 1).




Si la page affiche des caractères de ce type :

� - � - � - � - � - � - �

Les données sont encodés en ISO-8859-1 et affichées par le navigateur en UTF-8.



Si la page affiche des caractères de ce type :

- - - - - -

Les données sont (normalement) en WINDOWS-1252 et affichées par le navigateur en UTF-8.


Après il peut y avoir à la place des carré des point d'interrogation noir, c'est idem.

Ensuite, il peut arriver que le problème soit que l'on convertit deux fois en UTF-8. donc l'option --fixdouble

$ man convmv wrote:
--fixdouble
using the "--fixdouble" option convmv does only convert files which
will still be UTF-8 encoded after conversion. That's useful for
fixing double-encoded UTF-8 files. All files which are not UTF-8 or
will not result in UTF-8 after conversion will not be touched. Also
see chapter "How to undo double UTF-8 ..." below.


man est ton ami, don't forget it, continu reading it. (il existe aussi en français, j'ai la flemme de le chercher, j'ai mon système en anglais, c'est une manière de s'améliorer).


Et de plus il peut arrivé que ton terminal ne soit pas compatible utf-8 donc affiche en iso de l'utf8. voilà.

bon courage.
_________________
L'ami aime en tout temps, et dans le malheur il se montre un frère ( Prov. 17,17 )
L'insensé même, quand il se tait, passe pour sage ( Prov. 17;28a )
Back to top
View user's profile Send private message
Grat
n00b
n00b


Joined: 23 Sep 2006
Posts: 18

PostPosted: Fri Nov 11, 2011 7:53 am    Post subject: Reply with quote

J'ai eu un problème similaire avec des windowseries, je n'ai pas testé les versions ~arch de convmv mais la 1.10 n'est pas vraiment "smart", donc ajouter l'option --nosmart pour forcer la conversion, toujours en dry-run au cas où...
D'autre part les windowseries en question ne se convertissaient pas bien depuis iso-8859-1, ça a marché avec cp850.

Bien lire le dry-run avant d'ajouter notest, la conversion forcée pourrait provoquer quelques surprises.
Mieux, copier les fichiers concernés dans un rep dédié.
Back to top
View user's profile Send private message
pti-rem
Guru
Guru


Joined: 14 Oct 2011
Posts: 490

PostPosted: Sat Nov 12, 2011 9:40 am    Post subject: Reply with quote

J'utilisais la version 1.10 ; j'ai emergé la 1.14 pour me renseigner sur l'option --fixdouble qui ne figure pas dans la 1.10

J'ai réussi des tests en renommant avec codage de cp850 à utf-8

Merci beaucoup.

Autrement, j'ai aussi des noms de fichiers qui ne sont pas signalés à codage non valide, mais qui contiennent des pavés clairs avec des petits numéros ou des petites lettres au lieu de caractères accentués que j'aimerai bien pouvoir retrouver.
Back to top
View user's profile Send private message
Display posts from previous:   
Reply to topic    Gentoo Forums Forum Index French All times are GMT
Page 1 of 1

 
Jump to:  
You cannot post new topics in this forum
You cannot reply to topics in this forum
You cannot edit your posts in this forum
You cannot delete your posts in this forum
You cannot vote in polls in this forum