Perl / regex / Век живи, век учись.
Век живи, век учись... Или о вреде отсутствия систематических познаний в программировании. Хорошо, опыт, сын ошибок трудных, спасает. Пришлось недавно матчить слова на латинице, в которых попадались отдельные символы unicode (ну, то есть, весь текст, конечно, в UTF-8, но пока остаешься в рамках базовой латиницы, разницы особой нет). И вот, например, есть буква Ü. Ее можно, конечно, заматчить как \xc3\x9c. Но, если лень, то можно попробовать матчить как «любой символ»: . Не матчилось. Долго тупил, пока не понял, что это, конечно же, не один «любой символ», а два «любых символа»: .. (т. е., Über = ..ber, а не .ber).