TextDecoder

TextDecoder インターフェイスは、特定のテキストエンコーディング、例えば UTF-8ISO-8859-2KOI8-RGBK などのデコーダーを表します。デコーダーは入力としてバイトストリームを受け取り、コードポイントのストリームを出力します。

注: この機能は Web Worker 内で利用可能です

コンストラクター

TextDecoder()

新たに生成した TextDecoder を返します。これは、引数で指定したデコード方式を使用して連続したコードポイントを生成します。

インスタンスプロパティ

TextDecoder インターフェイスは、何もプロパティを継承していません。

TextDecoder.encoding 読取専用

デコーダーの名称を持つ文字列であり、これは TextDecoder が使用する方式を表す文字列です。

TextDecoder.fatal 読取専用

エラーモードが fatal であるかを示す論理値です。

TextDecoder.ignoreBOM 読取専用

バイトオーダーマークを無視するかどうかを示す論理値です。

インスタンスメソッド

TextDecoder インターフェイスは、何もメソッドを継承していません。

TextDecoder.decode()

特定の TextDecoder オブジェクトの方式でデコードされたテキストを含む文字列を返します。

型付き配列でのテキスト表現

この例では、中国語/日本語の文字 「吉」を表す漢字 を、異なる 5 種類の型付き配列、 Uint8Array, Int8Array, Uint16Array, Int16Array, Int32Array で表します。

js
let utf8decoder = new TextDecoder(); // default 'utf-8' or 'utf8'

let u8arr = new Uint8Array([240, 160, 174, 183]);
let i8arr = new Int8Array([-16, -96, -82, -73]);
let u16arr = new Uint16Array([41200, 47022]);
let i16arr = new Int16Array([-24336, -18514]);
let i32arr = new Int32Array([-1213292304]);

console.log(utf8decoder.decode(u8arr));
console.log(utf8decoder.decode(i8arr));
console.log(utf8decoder.decode(u16arr));
console.log(utf8decoder.decode(i16arr));
console.log(utf8decoder.decode(i32arr));

UTF-8 ではないテキストの扱い

この例では、ロシア語の "Привет, мир!"、 "Hello, world." という意味のテキストをデコードします。 TextDecoder() コンストラクターでは、キリル語の文字に適した Windows-1251 文字エンコーディングを指定します。

js
const win1251decoder = new TextDecoder("windows-1251");
const bytes = new Uint8Array([
  207, 240, 232, 226, 229, 242, 44, 32, 236, 232, 240, 33,
]);
console.log(win1251decoder.decode(bytes)); // Привет, мир!

仕様書

Specification
Encoding Standard
# interface-textdecoder

ブラウザーの互換性

BCD tables only load in the browser

関連情報