mod: исправлена ошибка с союзом "и" и "как"

This commit is contained in:
2025-10-05 18:07:08 +03:00
parent 38581221b4
commit fff9dda8a0
3 changed files with 8 additions and 4 deletions

View File

@@ -19,7 +19,7 @@ from etpgrf.defaults import etpgrf_settings
_RU_UNBREAKABLE_WORDS = frozenset([ _RU_UNBREAKABLE_WORDS = frozenset([
# Предлоги (только короткие... длинные, типа `ввиду`, `ввиду` и т.п., могут быть "висячими") # Предлоги (только короткие... длинные, типа `ввиду`, `ввиду` и т.п., могут быть "висячими")
'в', 'без', 'до', 'из', 'к', 'на', 'по', 'о', 'от', 'перед', 'при', 'через', 'с', 'у', 'за', 'над', 'в', 'без', 'до', 'из', 'к', 'на', 'по', 'о', 'от', 'перед', 'при', 'через', 'с', 'у', 'за', 'над',
'об', 'под', 'про', 'для', 'ко', 'со', 'без', 'то', 'во', 'из-за', 'из-под', 'как' 'об', 'под', 'про', 'для', 'ко', 'со', 'без', 'то', 'во', 'из-за', 'из-под', 'как',
# Союзы (без сложных, тип `как будто`, `как если бы`, `за то` и т.п.) # Союзы (без сложных, тип `как будто`, `как если бы`, `за то` и т.п.)
'и', 'а', 'но', 'да', 'как', 'и', 'а', 'но', 'да', 'как',
# Частицы # Частицы
@@ -32,7 +32,7 @@ _RU_UNBREAKABLE_WORDS = frozenset([
# Постпозитивные частицы, которые приклеиваются к ПРЕДЫДУЩЕМУ слову # Постпозитивные частицы, которые приклеиваются к ПРЕДЫДУЩЕМУ слову
_RU_POSTPOSITIVE_PARTICLES = frozenset([ _RU_POSTPOSITIVE_PARTICLES = frozenset([
'ли', 'ль', 'же', 'ж', 'бы', 'б' 'ли', 'ль', 'же', 'ж', 'бы', 'б',
]) ])
# Для дореформенной орфографии можно добавить специфичные слова, если нужно # Для дореформенной орфографии можно добавить специфичные слова, если нужно

View File

@@ -8,7 +8,7 @@ from etpgrf.config import CHAR_NBSP, CHAR_THIN_SP
RUSSIAN_PREPOSITIONS_TO_TEST = [ RUSSIAN_PREPOSITIONS_TO_TEST = [
# Предлоги (только короткие... длинные, типа `ввиду`, `ввиду` и т.п., могут быть "висячими") # Предлоги (только короткие... длинные, типа `ввиду`, `ввиду` и т.п., могут быть "висячими")
'в', 'без', 'до', 'из', 'к', 'на', 'по', 'о', 'от', 'перед', 'при', 'через', 'с', 'у', 'за', 'над', 'в', 'без', 'до', 'из', 'к', 'на', 'по', 'о', 'от', 'перед', 'при', 'через', 'с', 'у', 'за', 'над',
'об', 'под', 'про', 'для', 'ко', 'со', 'без', 'то', 'во', 'из-за', 'из-под', 'как' 'об', 'под', 'про', 'для', 'ко', 'со', 'без', 'то', 'во', 'из-за', 'из-под', 'как',
# Союзы (без сложных, тип `как будто`, `как если бы`, `за то` и т.п.) # Союзы (без сложных, тип `как будто`, `как если бы`, `за то` и т.п.)
'и', 'а', 'но', 'да', 'как', 'и', 'а', 'но', 'да', 'как',
# Частицы # Частицы
@@ -94,6 +94,10 @@ def test_russian_postpositive_particle(word):
# Тесты для проверки особых случаев в Unbreakables # Тесты для проверки особых случаев в Unbreakables
UNBREAKABLES_SPECIAL_TEST_CASES = [ UNBREAKABLES_SPECIAL_TEST_CASES = [
('ru', "до н.э.", f"до{CHAR_NBSP}н.э."), ('ru', "до н.э.", f"до{CHAR_NBSP}н.э."),
('ru', "слово и тогда", f"слово и{CHAR_NBSP}тогда"),
('ru', "слово а тогда", f"слово а{CHAR_NBSP}тогда"),
('ru', "Проверка и тестирование.", f"Проверка и{CHAR_NBSP}тестирование."),
] ]