訳の正確性を保証するものではありませんので必要に応じて原文であるEcma InternationalのECMA-262にある ECMA-262.pdf ( ECMA-262 5.1 Edition )を参照下さい。
訳:2012年04月 webzoit.net
Unicodeの書式制御文字(参考例としてカテゴリ内の文字、LEFT-TO-RIGHT マークや RIGHT-TO-LEFT マークのようなUnicode文字データベースにある Cf )は、(マークアップ言語のように)これにおけるより高度なプロトコル(手順・規約)がない中でテキストの範囲における書式を制御する為に利用する制御コードです。 それは、編集や表示を促す為のソーステキスト内にある書式制御文字を受け入れるのに便利です。 全ての書式制御文字は、コメント内、文字列リテラル内、正規表現リテラル内で利用されます。 <ZWNJ> と <ZWJ> は、特定の言語の単語やフレーズの形式を区別するのに必要とされ、利用される書式制御文字です。 ECMAScriptのソーステキスト <ZWNJ> と <ZWJ> は、最初の文字の後、識別子の中で利用される場合もあります。 <BOM> は、Unicodeとして解釈される為にテキストの先頭に配置され、優先的にテキストのエンコード方式とバイトオーダーの検出を許可する為に使われる書式制御文字です。 この目的において意図された連結するファイルの結果としてといった例などにおいて <BOM> 文字は、テキストの先頭の後に現れることもあり得ます。 <BOM> 文字は、ホワイトスペース文字として扱われます。(7.2項参照) コメントや文字リテラルの外側にある特定の書式制御文字と正規表現リテラルの特別な処理は、Table 1.で要約されています。
Table 1. 書式制御文字のコードユニット値の利用方法 ---------------------------------------------------------------------------------------- コードユニット値 名称 正式名 使用方法 ---------------------------------------------------------------------------------------- \u200C Zero width non-joiner <ZWNJ> 識別子部分 \u200D Zero width joiner <ZWJ> 識別子部分 \uFEFF Byte Order Mark <BOM> ホワイトスペース ----------------------------------------------------------------------------------------