文字エンコードの処理

Merge は ASCII、MBCS(マルチバイト文字セット)および Unicode フォーマット ファイルを含め、さままざな文字エンコード ファイルを比較することができます。Merge は、ファイルの編集に IME(東アジア言語で使用する Input Method Editor)もサポートしています。

Merge は開いたファイルのメモリ内表現には Unicode 形式を使用します。コードページは、ファイルの読み込みおよび保存時に、ディスク ベースのシングルバイトまたはマルチバイト文字セット表現を Unicode に変換する場合、またはその逆の処理を行う場合に使用されます。

Merge でファイルを開いた後、リボンの エンコード ボタンを使用して、ファイルを保存する際に使用されるコードページを変更することができます。このコマンドによって開くウィンドウの使用方法は、文字エンコードの選択トピックで説明しています。

ファイルを異なるエンコードで再度開く

間違った文字エンコードを使用してファイルを開いてしまった場合、文字の一部または全部が正しく表示されません。このような場合は、ファイル パネル上で右クリックして開くショートカット メニューのエンコード付きでファイルを再度開く…コマンドを使用して、正しいコードページでファイルを再度開きます。このコマンドを使用すると、別のコードページを選択することができるウィンドウが表示されます。ファイル比較ウィンドウ上の別のファイルは影響を受けず、最初に開かれたときのコードページを使用し続けます。

ASCII および MBCS

ASCII または MBCS 形式を使用するファイルは、通常どのエンコードを使用するかの情報を含んでいません。

Unicode 以外を使用するファイルを開いた場合、Merge はデフォルトで、お使いのコンピューターの現在の言語設定のデフォルト コードページ、または、オプション ダイアログのテキスト比較ページで選択したコードページを使用します。ファイルが別のコードページで保存されていることがわかっている場合は、そのコードページをファイル 開く ダイアログで指定することができます。

ファイルを保存するとき、Merge はデフォルトでそのファイルを読み込んだときのコードページを使用して保存します。ファイル 名前を付けて保存… ダイアログを使用すると、保存時に異なるコードページを選択することができます。

Unicode

Unicode は、通常 2 バイトの識別子(0xFFFE または 0xFEFF)で開始し、アプリケーションはこれを使用してそのファイルが Unicode を使用していることを判断します。識別子はテキスト エディターでは表示されません。Merge はファイルを開くときに、この識別子を調べます。この識別子がある場合、Merge はそのファイルを Unicode として開きます。識別子がない場合、Merge はそのファイルが Unicode で格納されていないと見なし、デフォルト コードページまたはファイル 開く ダイアログで指定されたコードページ/Unicode 形式のいずれかで開きます。

Merge は UTF-7、UTF-8、およびビッグエンディアンとリトルエンディアンの両方の Unicode フォーマットをサポートします。