iconv で変換できない不正な文字を除外するには -c オプションを使えばいい
- 2016 7/15
Linux 上でデータベースから出力した CSV ファイルの文字コードを UTF-8 から Shift JIS に変換しようとしたら、変換できない文字が含まれていたみたいで illegal input sequence at position というエラーが発生して処理途中で終了してしまいました。
Linux 上でデータベースから出力した CSV ファイルの文字コードを UTF-8 から Shift JIS に変換しようとしたら、変換できない文字が含まれていたみたいで illegal input sequence at position というエラーが発生して処理途中で終了してしまいました。
Linuxにて、文字コードの設定方法(UTF-8, EUC, SJIS)を調べたのでメモ。
■ 日本語EUC
$ LANG=ja_JP.eucJP |
■ 日本語UTF-8
$ LANG=ja_JP.UTF-8 |
■ SJIS
$ LANG=ja_JP.SJIS |