Заменяющий символ | ||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|
� | ||||||||||||
| ||||||||||||
Характеристики | ||||||||||||
Название |
replacement character | |||||||||||
Юникод |
U+FFFD | |||||||||||
HTML-код |
| |||||||||||
UTF-16 |
0xFFFD | |||||||||||
URL-код |
%EF%BF%BD |
Заменяющий символ — символ, который используется, когда значение символа неизвестно или не может быть выражено в Юникоде.
Этот символ находится на позиции U+FFFD[1] в группе «Специальные символы». Он — самый последний символ базовой многоязычной плоскости.
Этот символ выглядит как чёрный ромб с вырезанным внутри вопросительным знаком[2].
Его можно встретить в тексте, при неправильно настроенной кодировке символов. Он появляется в случае отсутствия символов, которые имеются в исходной кодировке, в целевой кодировке.
Допустим, у нас есть текстовый файл, который содержит немецкое слово für
в кодировке ISO 8859-1. Этот текстовый файл был передан по Интернету пользователю, у которого кодировка по умолчанию UTF-8.
Первый байт (0x66
) в пределах 0x00-0x7F, UTF-8 отображает его корректно в виде «f». Второй байт (0xFC
) — неподходящее значение для начала любого символа в UTF-8. И на месте этого байта браузер отобразит заменяющий символ с целью предупредить пользователя о том, что что-то пошло не так. Третий байт (0x72
) также в пределах 0x00-0x7F, UTF-8 отображает его корректно в виде «r». И целое слово будет отображено как f�r
.
Текстовый редактор может отобразить заменяющий символ в UTF-8, и при отправке файла обратно, в ISO 8859-1 на месте этого символа получится бессвязное сочетание трёх символов: f�r
. Такое произойдёт потому, что UTF-8 заменяющего символа — 0xEF 0xBF 0xBD
. 0xEF — ï, 0xBF — ¿, 0xBD — ½, а вместе — �.
Данная страница на сайте WikiSort.ru содержит текст со страницы сайта "Википедия".
Если Вы хотите её отредактировать, то можете сделать это на странице редактирования в Википедии.
Если сделанные Вами правки не будут кем-нибудь удалены, то через несколько дней они появятся на сайте WikiSort.ru .