?

Log in

No account? Create an account

Юбилейное - Ваши рубидии уже у кобальта во ртути

Sep. 6th, 2012

05:35 pm - Юбилейное

Previous Entry Share Next Entry

Вчера исполнилось 20 лет тому, что пробивало себе путь медленно и трудно, но сейчас используется сотнями миллионов людей во всем мире: [а именно]
кодировке UTF-8

Она была изобретена, как это обычно бывает, на салфетке в столовой.

Comments:

From:ex_juan_gan
Date:September 7th, 2012 01:12 am (UTC)
(Link)
Одна из тяжелейших задач по жизни - впарить менеджменту, что не нужно никаких других кодировок. В Гугле хотя бы это поняли с самого начала, всё легче. А то в Борланде меня затрахали с японскими, китайскими, вордовыми... в Японии до сих пор ещё жива железнодорожная семибитная, какая-то EUC-7, что ли. Ну Япония, там же тормоза живут.
(Reply) (Thread)
[User Picture]
From:spamsink
Date:September 7th, 2012 03:00 am (UTC)
(Link)
До начала 2000-х с поддержкой в операционных системах было хреново. А доморощенные кодировки типа Shift-JIS, действительно, еще живы.
(Reply) (Parent) (Thread)
[User Picture]
From:ygam
Date:September 7th, 2012 01:42 am (UTC)
(Link)
Ура!
(Reply) (Thread)
[User Picture]
From:spamsink
Date:September 7th, 2012 02:52 am (UTC)
(Link)
Вольно!
(Reply) (Parent) (Thread)
[User Picture]
From:archaicos
Date:September 7th, 2012 01:59 am (UTC)
(Link)
И тем не менее народ периодически просит код для убирания диакритических знаков с буковок в тексте.
(Reply) (Thread)
[User Picture]
From:spamsink
Date:September 7th, 2012 02:51 am (UTC)
(Link)
В смысле? Я знаю, например, что имена файлов в файловых системах должны храниться в канонически декомпозированном виде, поэтому, скажем "файл.txt" и "файл.txt" - это одно и то же, но strcmp скажет, что они разные.

Edited at 2012-09-07 02:52 am (UTC)
(Reply) (Parent) (Thread)
[User Picture]
From:archaicos
Date:September 7th, 2012 03:08 am (UTC)
(Link)
В прямом смысле. Не желают видеть во входных данных José и año, а хотят Jose и ano. Некоторые ещё ну очень сильно не дружат с унифицированным кодом.
(Reply) (Parent) (Thread)
[User Picture]
From:spamsink
Date:September 7th, 2012 03:14 am (UTC)
(Link)
Это где ж такие ретрограды водятся?
(Reply) (Parent) (Thread)
[User Picture]
From:archaicos
Date:September 7th, 2012 03:38 am (UTC)
(Link)
В интернетах всплывают периодически, вот например:
http://stackoverflow.com/questions/1453171/n-n-n-or-remove-diacritical-marks-from-unicode-cha
(Reply) (Parent) (Thread)
[User Picture]
From:spamsink
Date:September 7th, 2012 03:45 am (UTC)
(Link)
В целях поиска это приемлемо.
(Reply) (Parent) (Thread)
[User Picture]
From:ramlamyammambam
Date:September 7th, 2012 03:17 am (UTC)
(Link)
А я буквально недавно осознал, откуда истоки. Компьютеры и байт ни при чем. Телеграфные аппараты с середины 19-го века работали в коде Морзе/Вэйла. Кто-то решил для русских букв использовать те же коды, что для "похожих" латинских. Получилась таблица КОИ-7. Только одна буква с тех пор изменилась: Q переползло с Щ на Я.
(Reply) (Thread)
[User Picture]
From:spamsink
Date:September 7th, 2012 03:25 am (UTC)
(Link)
Знаючи азбуку Морзе, это осознать несложно. Кстати, шутка: "Это ж-ж-ж-ж неспроста" должно переводиться на английский как "This v-v-v-v is for a reason". (радиограммам обычно предшествует настроечная последовательность)
(Reply) (Parent) (Thread)
[User Picture]
From:janatem
Date:September 7th, 2012 07:50 am (UTC)
(Link)
Глядя на ссылку, подумал, что юбилей у рекурсии. Что, очевидно, фактологически неверно.
(Reply) (Thread)
[User Picture]
From:spamsink
Date:September 11th, 2012 08:48 pm (UTC)
(Link)
Я попытался было найти, сколько сейчас лет рекурсии вообще как оформленному понятию, и не смог.
(Reply) (Parent) (Thread)
[User Picture]
From:fatoff
Date:September 11th, 2012 08:30 pm (UTC)
(Link)
А мне все эти экспириенсы с кодировками одну головную боль напоминают. Действительно, ещё в конце 90-х - начале 2000-х столько межколхозных перекодировщиков паслось на безбрежных просторах! В те времена подзастрял в одной прикладной конторке. Чудище было обло, зело огромно и лаяй. Нет чтобы UTF-8, который тогда вполне зрелый был, всем использовать. Козлы. Это был рантъ.
(Reply) (Thread)