mod: исправлена ошибка с союзом "и" и "как"
This commit is contained in:
@@ -19,7 +19,7 @@ from etpgrf.defaults import etpgrf_settings
|
|||||||
_RU_UNBREAKABLE_WORDS = frozenset([
|
_RU_UNBREAKABLE_WORDS = frozenset([
|
||||||
# Предлоги (только короткие... длинные, типа `ввиду`, `ввиду` и т.п., могут быть "висячими")
|
# Предлоги (только короткие... длинные, типа `ввиду`, `ввиду` и т.п., могут быть "висячими")
|
||||||
'в', 'без', 'до', 'из', 'к', 'на', 'по', 'о', 'от', 'перед', 'при', 'через', 'с', 'у', 'за', 'над',
|
'в', 'без', 'до', 'из', 'к', 'на', 'по', 'о', 'от', 'перед', 'при', 'через', 'с', 'у', 'за', 'над',
|
||||||
'об', 'под', 'про', 'для', 'ко', 'со', 'без', 'то', 'во', 'из-за', 'из-под', 'как'
|
'об', 'под', 'про', 'для', 'ко', 'со', 'без', 'то', 'во', 'из-за', 'из-под', 'как',
|
||||||
# Союзы (без сложных, тип `как будто`, `как если бы`, `за то` и т.п.)
|
# Союзы (без сложных, тип `как будто`, `как если бы`, `за то` и т.п.)
|
||||||
'и', 'а', 'но', 'да', 'как',
|
'и', 'а', 'но', 'да', 'как',
|
||||||
# Частицы
|
# Частицы
|
||||||
@@ -32,7 +32,7 @@ _RU_UNBREAKABLE_WORDS = frozenset([
|
|||||||
|
|
||||||
# Постпозитивные частицы, которые приклеиваются к ПРЕДЫДУЩЕМУ слову
|
# Постпозитивные частицы, которые приклеиваются к ПРЕДЫДУЩЕМУ слову
|
||||||
_RU_POSTPOSITIVE_PARTICLES = frozenset([
|
_RU_POSTPOSITIVE_PARTICLES = frozenset([
|
||||||
'ли', 'ль', 'же', 'ж', 'бы', 'б'
|
'ли', 'ль', 'же', 'ж', 'бы', 'б',
|
||||||
])
|
])
|
||||||
|
|
||||||
# Для дореформенной орфографии можно добавить специфичные слова, если нужно
|
# Для дореформенной орфографии можно добавить специфичные слова, если нужно
|
||||||
|
@@ -8,7 +8,7 @@ from etpgrf.config import CHAR_NBSP, CHAR_THIN_SP
|
|||||||
RUSSIAN_PREPOSITIONS_TO_TEST = [
|
RUSSIAN_PREPOSITIONS_TO_TEST = [
|
||||||
# Предлоги (только короткие... длинные, типа `ввиду`, `ввиду` и т.п., могут быть "висячими")
|
# Предлоги (только короткие... длинные, типа `ввиду`, `ввиду` и т.п., могут быть "висячими")
|
||||||
'в', 'без', 'до', 'из', 'к', 'на', 'по', 'о', 'от', 'перед', 'при', 'через', 'с', 'у', 'за', 'над',
|
'в', 'без', 'до', 'из', 'к', 'на', 'по', 'о', 'от', 'перед', 'при', 'через', 'с', 'у', 'за', 'над',
|
||||||
'об', 'под', 'про', 'для', 'ко', 'со', 'без', 'то', 'во', 'из-за', 'из-под', 'как'
|
'об', 'под', 'про', 'для', 'ко', 'со', 'без', 'то', 'во', 'из-за', 'из-под', 'как',
|
||||||
# Союзы (без сложных, тип `как будто`, `как если бы`, `за то` и т.п.)
|
# Союзы (без сложных, тип `как будто`, `как если бы`, `за то` и т.п.)
|
||||||
'и', 'а', 'но', 'да', 'как',
|
'и', 'а', 'но', 'да', 'как',
|
||||||
# Частицы
|
# Частицы
|
||||||
@@ -94,6 +94,10 @@ def test_russian_postpositive_particle(word):
|
|||||||
# Тесты для проверки особых случаев в Unbreakables
|
# Тесты для проверки особых случаев в Unbreakables
|
||||||
UNBREAKABLES_SPECIAL_TEST_CASES = [
|
UNBREAKABLES_SPECIAL_TEST_CASES = [
|
||||||
('ru', "до н.э.", f"до{CHAR_NBSP}н.э."),
|
('ru', "до н.э.", f"до{CHAR_NBSP}н.э."),
|
||||||
|
('ru', "слово и тогда", f"слово и{CHAR_NBSP}тогда"),
|
||||||
|
('ru', "слово а тогда", f"слово а{CHAR_NBSP}тогда"),
|
||||||
|
('ru', "Проверка и тестирование.", f"Проверка и{CHAR_NBSP}тестирование."),
|
||||||
|
|
||||||
]
|
]
|
||||||
|
|
||||||
|
|
||||||
|
Reference in New Issue
Block a user