mod: изменен алгоритм переноса в русских словах (императивнный на декларативный) с весами и приоритетами

This commit is contained in:
2025-07-24 21:02:40 +03:00
parent 086adc1f7b
commit d716d394bb
2 changed files with 80 additions and 73 deletions

View File

@@ -7,28 +7,28 @@ from etpgrf import Hyphenator
# Используем \u00AD - это Unicode-представление мягкого переноса (­)
RUSSIAN_HYPHENATION_CASES = [
("дом", "дом"), # Сочень короткое (короче max_unhyphenated_len) не должно меняться
("проверка", "проверка"), # Короткое слово не должно меняться
("тестирование", "тести\u00ADрование"),
("благотворительностью", "благотво\u00ADритель\u00ADностью"), # Слово с переносом на мягкий знак
("гиперподъездной", "гипер\u00ADподъ\u00ADездной"), # Слово с переносом на твердый знак
("проверка", "про\u00ADверка"),
("тестирование", "тести\u00ADрова\u00ADние"),
("благотворительностью", "бла\u00ADготво\u00ADритель\u00ADностью"), # Слово с переносом на мягкий знак
("фотоаппаратура", "фотоап\u00ADпара\u00ADтура"), # проверка слова со сдвоенной согласной
("программирование", "програм\u00ADмиро\u00ADвание"), # слова со сдвоенной согласной
("сверхзвуковой", "сверхзву\u00ADковой"),
("программирование", "про\u00ADграм\u00ADмиро\u00ADвание"), # слова со сдвоенной согласной
("сверхзвуковой", "сверх\u00ADзву\u00ADковой"),
("автомобиль", "авто\u00ADмобиль"),
("интернационализация", "интерна\u00ADциона\u00ADлизация"),
("суперкомпьютер", "супер\u00ADком\u00ADпьютер"),
("электронный", "электрон\u00ADный"),
("информационный", "информа\u00ADционный"),
("автоматизация", "авто\u00ADмати\u00ADзация"),
("многоклеточный", "многок\u00ADлеточ\u00ADный"),
("многофункциональный", "многофун\u00ADкцио\u00ADнальный"),
("непрерывность", "непре\u00ADрывность"),
("сверхпроводимость", "сверхпро\u00ADводи\u00ADмость"),
("многообразие", "много\u00ADобразие"),
("противоречивость", "противо\u00ADречи\u00ADвость"),
("сверхчувствительный", "сверхчув\u00ADстви\u00ADтельный"), # Будет неправильный перенос, (словарь "корней")
("непревзойденный", "непрев\u00ADзойден\u00ADный"), # Будет неправильный перенос
("многослойный", "многос\u00ADлойный"), # Будет неправильный перенос,
("интернационализация", "инте\u00ADрнаци\u00ADонали\u00ADзация"),
("электронный", "элек\u00ADтрон\u00ADный"),
("информационный", "инфо\u00ADрма\u00ADцион\u00ADный"),
("автоматизация", "автома\u00ADтиза\u00ADция"),
("многоклеточный", "мно\u00ADгокле\u00ADточный"),
("многофункциональный", "мно\u00ADгофун\u00ADкцио\u00ADналь\u00ADный"),
("непрерывность", "непре\u00ADрывно\u00ADсть"),
("сверхпроводимость", "сверх\u00ADпрово\u00ADдимо\u00ADсть"),
("многообразие", "мно\u00ADгоо\u00ADбра\u00ADзие"),
("противоречивость", "про\u00ADтиво\u00ADречи\u00ADвость"),
("непревзойденный", "непре\u00ADвзой\u00ADден\u00ADный"),
("многослойный", "мно\u00ADгослой\u00ADный"),
("суперкомпьютер", "супе\u00ADрко\u00ADмпью\u00ADтер"), # Неправильный перенос (нужен словарь "приставок/корней/суффиксов")
("сверхчувствительный", "свер\u00ADхчув\u00ADстви\u00ADтель\u00ADный"), # Неправильный перенос
("гиперподъездной", "гипе\u00ADрпо\u00ADдъез\u00ADдной"), # Неправильный перенос
]