文字エンコードの処理

Merge は ASCII、MBCS(マルチバイト文字セット)および Unicode フォーマット ファイルを含め、さままざな文字エンコード ファイルを比較することができます。Merge は、ファイルの編集に IME(東アジア言語で使用する Input Method Editor)もサポートしています。

Merge は開いたファイルのメモリ内表現には Unicode 形式を使用します。コードページは、ファイルの読み込みおよび保存時に、ディスク ベースのシングルバイトまたはマルチバイト文字セット表現を Unicode に変換する場合、またはその逆の処理を行う場合に使用されます。

Merge でファイルを開いた後、リボンまたはツールバーの エンコード [エンコード]ボタン ボタンを使用して、ファイルを保存する際に使用されるコードページを変更することができます。このコマンドによって開くウィンドウの使用方法は、文字エンコードの選択トピックで説明しています。

ファイルを異なるエンコードで再度開く

間違った文字エンコードを使用してファイルを開いてしまった場合、文字の一部または全部が正しく表示されません。このような場合は、ファイル パネル上で右クリックして開くショートカット メニューのエンコード付きで…を再度開くコマンドを使用して、正しいコードページでファイルを開き直します。このコマンドを使用すると、別のコードページを選択することができるウィンドウが表示されます。ファイル比較ウィンドウ上の別のファイルは影響を受けず、最初に開かれたときのコードページを使用し続けます。

ASCII および MBCS

ASCII または MBCS 形式を使用するファイルは、通常どのエンコードを使用するかの情報を含んでいません。

Unicode 以外を使用するファイルを開いた場合、Merge はデフォルトで、お使いのコンピューターの現在の言語設定のデフォルト コードページ、または、オプションダイアログのテキスト比較ページで選択したコードページを使用します。ファイルが別のコードページで保存されていることがわかっている場合は、そのコードページをファイルを開く…ダイアログで指定することができます。

ファイルを保存するとき、Merge はデフォルトでそのファイルを読み込んだときのコードページを使用して保存します。名前を付けて保存ダイアログを使用すると、保存時に異なるコードページを選択することができます。

文字エンコード ドロップダウン リスト

Unicode

Unicode ファイルは、通常 2 バイトの識別子(0xFFFE または 0xFEFF)で始まり、アプリケーションはこれによって、ファイルが Unicode を使用していることを判断できます。識別子はテキスト エディターでは表示されません。Merge はファイルを開くときに、この識別子を調べます。この識別子がある場合、Merge はそのファイルを Unicode として開きます。識別子がない場合、Merge はそのファイルが Unicode で格納されていないと見なし、デフォルト コードページまたはファイルを開くダイアログで指定されたコードページ/Unicode 形式のいずれかで開きます。

Merge はビッグエンディアン(big-endian)およびリトルエンディアン(little-endian) Unicode 形式の両方をサポートし、お使いのオペレーティング システムがサポートしている場合は、UTF-7 および UTF-8 もサポートします。