mod: исправлена ошибка с союзом "и" и "как"

This commit is contained in:
2025-10-05 18:07:08 +03:00
parent 38581221b4
commit fff9dda8a0
3 changed files with 8 additions and 4 deletions

View File

@@ -19,7 +19,7 @@ from etpgrf.defaults import etpgrf_settings
_RU_UNBREAKABLE_WORDS = frozenset([
# Предлоги (только короткие... длинные, типа `ввиду`, `ввиду` и т.п., могут быть "висячими")
'в', 'без', 'до', 'из', 'к', 'на', 'по', 'о', 'от', 'перед', 'при', 'через', 'с', 'у', 'за', 'над',
'об', 'под', 'про', 'для', 'ко', 'со', 'без', 'то', 'во', 'из-за', 'из-под', 'как'
'об', 'под', 'про', 'для', 'ко', 'со', 'без', 'то', 'во', 'из-за', 'из-под', 'как',
# Союзы (без сложных, тип `как будто`, `как если бы`, `за то` и т.п.)
'и', 'а', 'но', 'да', 'как',
# Частицы
@@ -32,7 +32,7 @@ _RU_UNBREAKABLE_WORDS = frozenset([
# Постпозитивные частицы, которые приклеиваются к ПРЕДЫДУЩЕМУ слову
_RU_POSTPOSITIVE_PARTICLES = frozenset([
'ли', 'ль', 'же', 'ж', 'бы', 'б'
'ли', 'ль', 'же', 'ж', 'бы', 'б',
])
# Для дореформенной орфографии можно добавить специфичные слова, если нужно

View File

@@ -32,7 +32,7 @@ TYPOGRAPHER_HTML_TEST_CASES = [
('mnemonic', '<p>Союз и <b>слово</b> и еще один союз а <span>текст</span>.</p>',
'<p>Союз и&nbsp;<b>слово</b> и&nbsp;еще один союз а&nbsp;<span>текст</span>.</p>'),
('mnemonic', '<p>Союз а <b>слово</b> а еще один союз а <span>текст</span>.</p>',
'<p>Союз а&nbsp;<b>слово</b> а&nbsp;еще один союз а&nbsp;<span>текст</span>.</p>'),
'<p>Союз а&nbsp;<b>слово</b> а&nbsp;еще один союз а&nbsp;<span>текст</span>.</p>'),

View File

@@ -8,7 +8,7 @@ from etpgrf.config import CHAR_NBSP, CHAR_THIN_SP
RUSSIAN_PREPOSITIONS_TO_TEST = [
# Предлоги (только короткие... длинные, типа `ввиду`, `ввиду` и т.п., могут быть "висячими")
'в', 'без', 'до', 'из', 'к', 'на', 'по', 'о', 'от', 'перед', 'при', 'через', 'с', 'у', 'за', 'над',
'об', 'под', 'про', 'для', 'ко', 'со', 'без', 'то', 'во', 'из-за', 'из-под', 'как'
'об', 'под', 'про', 'для', 'ко', 'со', 'без', 'то', 'во', 'из-за', 'из-под', 'как',
# Союзы (без сложных, тип `как будто`, `как если бы`, `за то` и т.п.)
'и', 'а', 'но', 'да', 'как',
# Частицы
@@ -94,6 +94,10 @@ def test_russian_postpositive_particle(word):
# Тесты для проверки особых случаев в Unbreakables
UNBREAKABLES_SPECIAL_TEST_CASES = [
('ru', "до н.э.", f"до{CHAR_NBSP}н.э."),
('ru', "слово и тогда", f"слово и{CHAR_NBSP}тогда"),
('ru', "слово а тогда", f"слово а{CHAR_NBSP}тогда"),
('ru', "Проверка и тестирование.", f"Проверка и{CHAR_NBSP}тестирование."),
]