?

Log in

No account? Create an account
Worte und Wörter
『今昔文字鏡 単漢字16万字版』: Some examples on Mojikyō ⇔ Unicode mapping 
18th-Jun-2009 03:11, Thu
Возвращаясь к теме выхода новой версии Mojikyō, хочу привести несколько занимательных примеров на маппинг между символами Mojikyō (ver. 4.52) и Юникода (ver. 5.1.0).



Пример модификации маппинга Mojikyō ⇔ Unicode в новой версии Mojikyō

Знаки @001314 (@526521, @526530) имели в версии 4.00 соответствие со знаком Юникода U+34A8:

@001314 @526521 @526530

В версии 4.52 это соответствие было изменено на U+20457:

@001314 @526521 @526530

Интересно, что оба знака (U+34A8 и U+20457) имеют абсолютно одинаковую форму в Юникоде (при этом первый располагается в Extension A, а второй в Extension B) и являются хорошо известным дублем в Юникоде. Вот их вид из официальных таблиц The Unicode Character Code Charts:

U+34A8U+20457

Думается, что модификация в маппинге Mojikyō вызвана именно этим обстоятельством.

Примечание: Словарь «Ханьюй да цзыдянь» (漢語大字典) определяет данный иероглиф как древнюю форму иероглифа 仙 — «бессмертный, небожитель; божество, гений; божественный, чудесный; гениальный, талантливый».



Ещё несколько примеров на дубли в Юникоде и реализацию маппинга с ними в Mojikyō.

Дубли в Юникоде, имеющие только одно соответствие в Mojikyō
Аналогично случаю, описанному выше

U+3DB7
U+3DB7
U+2420E
U+2420E
@079134
@079134

U+204F2
U+204F2
U+23515
U+23515
@015053
@015053

U+249BC
U+249BC
U+249E9
U+249E9
@021137
@021137

Дубли в Юникоде, имеющие соответствие для каждого из них в Mojikyō

U+8641
U+8641
U+27144
U+27144
@032601
@032601
@081476
@081476

При этом соответствие здесь не совсем точное. Отличие в данных иероглифах в Юникоде заключается в разном способе написания ключа «трава» 艸 (в три или четыре черты) и вариации 夂/夊, а в Mojikyō в разном способе написания элемента 巳 и вариации 八/儿.



Примеры ошибочного маппинга

Знаки @002016 и @059134 имеют в Mojikyō соответствие со знаком Юникода U+523E:

@002016
@002016
@059134
@059134

При этом в Юникоде есть оба знака:

U+34E8
U+34E8
U+523E
U+523E

Т. е. знак @002016 должен быть проассоциирован со знаком Юникода U+34E8 (который, кстати, отсутствует в маппинге), а не U+523E.
This page was loaded Nov 24th 2017, 7:31 am GMT.