kouprianov: (Default)
Век живи, век учись... Или о вреде отсутствия систематических познаний в программировании. Хорошо, опыт, сын ошибок трудных, спасает. Пришлось недавно матчить слова на латинице, в которых попадались отдельные символы unicode (ну, то есть, весь текст, конечно, в UTF-8, но пока остаешься в рамках базовой латиницы, разницы особой нет). И вот, например, есть буква Ü. Ее можно, конечно, заматчить как \xc3\x9c. Но, если лень, то можно попробовать матчить как «любой символ»: . Не матчилось. Долго тупил, пока не понял, что это, конечно же, не один «любой символ», а два «любых символа»: .. (т. е., Über = ..ber, а не .ber).

March 2025

S M T W T F S
      1
2345678
910 1112131415
16171819202122
23242526272829
3031     

Syndicate

RSS Atom

Style Credit

Expand Cut Tags

No cut tags
Page generated Sep. 22nd, 2025 06:14 pm
Powered by Dreamwidth Studios