mod: закрывающая кавычка перед точкой

This commit is contained in:
2025-10-09 12:18:32 +03:00
parent 78604a83f5
commit d77f1db5c2
2 changed files with 4 additions and 4 deletions

View File

@@ -49,9 +49,9 @@ class QuotesProcessor:
# Паттерн для закрывающей кавычки: " после буквы/цифры,
# за которой следует пробел, пунктуация или конец строки.
# (?<=\p{L}|[?!…]) - "просмотр назад" на букву или ?!…
# (?<=\p{L}|[?!…\.]) - "просмотр назад" на букву или ?!… и точку.
# (?=\s|[.,;:!?\)\"»”’]|\Z) - "просмотр вперед" на пробел, пунктуацию или конец строки (\Z).
self._closing_quote_pattern = regex.compile(r'(?<=\p{L}|[?!…])\"(?=\s|[\.,;:!?\)\]»”’\"\']|\Z)')
self._closing_quote_pattern = regex.compile(r'(?<=\p{L}|[?!…\.])\"(?=\s|[\.,;:!?\)\]»”’\"\']|\Z)')
# self._closing_quote_pattern = regex.compile(r'(?<=\p{L}|\p{N})\"(?=\s|[\.,;:!?\)\"»”’]|\Z)')
# self._closing_quote_pattern = regex.compile(r'(?<=\p{L}|[?!…])\"(?=\s|[\p{Po}\p{Pf}"\']|\Z)')

View File

@@ -34,8 +34,8 @@ QUOTES_TEST_CASES = [
('ru', 'Текст "в кавычках".', 'Текст «в кавычках».'),
('en', '"Word".', '“Word”.'),
# Точка ВНУТРИ кавычек - неправильная пунктуация, закрывающая кавычка не обрабатывается (согласно README)
('ru', 'Текст "в кавычках."', 'Текст «в кавычках."'),
('en', '"Word."', '“Word."'),
('ru', 'Текст "в кавычках."', 'Текст «в кавычках.»'),
('en', '"Word."', '“Word.'),
# Знаки ?, !, … ВНУТРИ кавычек - правильная пунктуация, корректно обрабатывается
('ru', '"Слово?"', '«Слово?»'),
('en', '"Word?"', '“Word?”'),