Блог

Кракозябры вместо текста

Сталкивались ли вы хоть раз с ситуацией, когда вам на электронную почту 📩 приходило письмо, состоящее из непонятных закорючек? 👾

А письмо важное: пришло от коллег, руководителей, друзей из-за границы.

Поговорим в этой статье, что делать с такими письмами и в чём тут дело. Долой закорючки, верните нам нормальный текст! 🔤

Почему вместо текста получаются кракозябры


Подобный текст с непонятными символами приходит нам на почту не потому, что в таком виде письмо было отправлено изначально. Такое случается, когда отправитель создавал письмо в какой-то кодировке, которую сервер вашего почтового клиента не распознает.

Кодировка - это способ записи информации


Вот простая аналогия. Есть слово "Спасибо". На русском это слово "Спасибо". На английском - "Thank you". На испанском - "Gracias". Язык - это способ записи одной и той же информации. Своего рода кодировка 🤖

А вот слово "Спасибо" в кодировке URL Encoded
%D0%A1%D0%BF%D0%B0%D1%81%D0%B8%D0%B1%D0%BE

В кодировке Base64
0KHQv9Cw0YHQuNCx0L4=

В "кодировке" Азбука Морзе
*** *--* *- *** ** -*** ---

В "кодировке" Английский язык
Thank you

В "кодировке" Испанский язык
Gracias

Кодировок много! Вот лишь небольшой список для примера:
  • ASCII
  • CP-855
  • CP-1251
  • MacCyrillic
  • Translit
  • UTF-8
  • Base64
  • Big5
  • CP-125x
  • EUC-JP
  • EUC-KR
  • и много-много других

Кодировки нужны для того, чтобы эффективно передавать информацию. Допустим, есть слово "Спасибо", оно преобразуется в "0" и "1" согласно соответствующей таблице кодировки (ниже таблица кодировки ANSII) и передаётся через интернет.


Сообщение расшифровывается получателем такой же таблицей, и он тоже видит слово "Спасибо".

А если программа получателя письма не смогла подобрать таблицу для декодировки, то вы увидите кракозябры 🧟‍♂️🐊☠️

Самой первой кодировкой стала ASCII (American Standard Code for Information Interchange) – американская кодировочная таблица. Она содержит все символы, но не поддерживает иероглифы. Поэтому стандарты сегодня движутся к более универсальным кодировкам, например, UTF-16 или UTF-32. Большинство технологий сегодня используют кодировку UTF-8. Чаще всего ее используют для разработок многих сайтов и программного обеспечения. Специальная кодировка создана и для кириллицы  – Windows 1251 или ср-1251.

Декодер Лебедева


Если вы столкнулись с непонятным текстом в вашем документе или письме, вы можете воспользоваться специальным инструментом для расшифровки непонятного текста - декодером Артемия Лебедева. Он бесплатный и не имеет ограничений по количеству вводимых символов и используемых попыток 💸💪

Вот как декодер помогает автоматически подобрать кодировку для любых кракозябр:


Ждем вас на уроках IT Faculty 🤗
Made on
Tilda