2022/06/14

音源ファイル名が文字化けしているときの対処法

アーカイブされたUTAU用音源を解凍したとき、「あ.wav」や「_ああいあうえあ.wav」などの音源ファイル名が、「偁.wav」とか「_偁偁偄偁偆偊偁.wav」のように、文字化けしているときがあります。特に中国語圏/韓国語圏の音源ライブラリに多く見られるようです。

色々ググってみたところ、圧縮解凍ソフトウェアを選べば文字化けしない旨、よく見かけるのですが、「上手くいく」と書かれていた圧縮解凍ソフトウェアをいくつか試しても上手くいきませんでした…。文字化けしたwavファイルの中身を聴いていくうちに、日本語のひらがなやカタカナが、中国語圏/韓国語圏で使われる文字に置き換わっているような気がして、試しに聴こえるままのひらがなでファイル名を置き換えると、同梱されていた「oto.ini」ファイルで、なんとなく歌えるようになりました。

…という訳で、結局のところ「ファイル名を文字化けしていない文字に書き換える」という作業をしているだけなんですが、以下に現在私がやってる対処法を簡単にメモします。ただし、すべての文字化けに対応しているわけではなくて、「こういう文字化けの仕方をした場合にはなんとか対処できる方法」と考えていただけると幸いです。

  1. ファイル名変更君」というソフトウェアを使います。
  2. 私は最新版(Version 3.63)をダウンロードしました。インストーラは無く、解凍するとexeファイルが出てきますので、適当な場所に保存して利用しています。今回の文字化け対処法では、スクリプトを指定してファイル名変換をする機能を利用します。起動するとこんな感じ。
  3. 「リネーム設定」の「リネーム方式」を「スクリプト」にして、スクリプト入力窓に変換用スクリプトをコピペします。
  4. このとき使う変換用スクリプトを作成しました。中国語用韓国語用を作成しています。ダウンロードして、どちらか適当な言語のほうをメモ帳等で開いて、コピペします。以下は中国語用の場合。
  5. 「取り込み設定」で該当音源ライブラリフォルダを指定して、必要なら「サブフォルダも含める」をチェックして、取り込みます。
  6. 実行設定はお好みで(私は「自動で重複回避」にチェックを入れてます)。「実行」で、ほとんどのファイルの文字化けが直ります(…そのハズです…)。

実は、中国語用の変換用スクリプトは、先日アップデートしたばかりです。先日ダウンロードした中国語圏の音源で、上記の方法で文字化け対処したところ、変換できない文字(「儞」→「ン」)がありましたので、その分を追加しています。

この備忘録メモが誰かのお役に立てれば幸いです(^^)。

[2023-01-28 追記]
中国語用の変換用スクリプトを更新しました。「僑」→「ゴ」、「媧」→「吸」、「揻」→「吐」、「庛」→「弱」を追加しました。

0 件のコメント:

コメントを投稿