2018年7月17日の日記の1番目の記事へのコメント
■gawk
知らなくてはまったのでメモ。gawkで、printfで文字型に変換して出力する際、LANGがja_JP.utf-8 とかになっていると、出力がマルチバイトになるんですな。
% echo | evn LANG=ja_JP.utf-8 gawk '{printf("%c", 0xcc);}' | hexdump -Cv 00000000 c3 8c |..| 00000002
C言語っぽく出すには、LANG=C とかにする必要あり。
% echo | env LANG=C gawk '{printf("%c", 0xcc);}' | hexdump -Cv 00000000 cc |.| 00000001
というか、LANG=ja_JP.eucJPでもこうなるのか。よく今まで踏まなかったな・・・。
2018年7月17日の日記の1番目の記事へのコメント
[コメントを書く]