Алгоритм обработки текста двусторонней направленности (Юникод)

Этот перевод не завершён. Пожалуйста, помогите перевести эту статью с английского

Черновик
Эта страница не завершена.

Алгоритм обработки текста двусторонней направленности (Unicode® Bidirectional Algorithm или BiDi Algorithm) — раздел стандарта текста Unicode, описывающий в каком порядке раскладываются символы во время обработки страницы агентом пользователя. Этот алгоритм полезен при создании локализированного веб-контента.

В руководстве рассказывается о том, как работает BiDi алгоритм и как его применить. Алгоритм непосредственно связан с HTML и CSS, при обработке которых определяется порядок и направление символов в тексте.

Основы

(Базовое направление, типы символов, и т.д.)

Алгоритм

Уровни направленности символов

Directional runs

(Что это, что такое базовое направление)

Символы нейтральной направленности

Overriding the algorithm

Content about using HTML and CSS to override the default behavior of the algorithm; include info about isolating ranges etc.

Overiding BiDi using Unicode control characters

Unicode provides a number of special control characters that make it possible to control directionality of ranges of text. There are two sets of control characters; one set opens the override, and another restores the original directionality. You must always follow each opening character with an appropriate closing character.

Initial Unicode BiDi algorithm control characters
Character Code point HTML entity Markup equivalent Description
Left-to-Right Isolate (LRI) U+2066 ⁦ dir="ltr" Sets the base direction to LTR, isolating the embedded content from the surrounding text
Right-to-Left Isolate (LRI) U+2067 ⁧ dir="rtl" Sets the base direction to RTL, isolating the embedded content from the surrounding text
First Strong Isolate (FSI) U+2068 ⁨ dir="auto" Isolates the content and sets the base direction according to the first strongly-typed directional character in the embedded content
Left-to-Right Embedding (LRE) U+202A ‪ dir="ltr" Sets the base direction to LTR but allows the embedded text to interact with the surrounding content; this risks the effect spilling over to the outer content
Right-to-Left Embedding (RLE) U+202B ‫ dir="rtl" Sets the base direction to RTL, but lets the embedded text interact with the surrounding content, risking spillover effects
Left-to-Right Override (LRO) U+202D &#x202D; <bdo dir="ltr"> Overrides the BiDi algorithm, displaying the characters in memory order, from left to right
Right-to-Left Override (RLO) U+202E &#x202E; <bdo dir="rtl"> Overrides the BiDi algorithm and displays the embedded characters in reverse memory order, from right to left
Closing Unicode BiDi algorithm control characters
Character Code point HTML entity Markup equivalent Description
Pop Directional Formatting (PDF) U+202C &#x202C; Closing whatever opening tag used the dir attribute Used for RLE or LRE
</bdo> Used for RLO or LRO
Pop Directional Isolate (PDI) U+2069 &#x2069; Closing whatever opening tag used the dir attribute Used for RLI, LRI, or FSI

См. также