mod: закрывающая кавычка перед точкой
This commit is contained in:
@@ -49,9 +49,9 @@ class QuotesProcessor:
|
|||||||
|
|
||||||
# Паттерн для закрывающей кавычки: " после буквы/цифры,
|
# Паттерн для закрывающей кавычки: " после буквы/цифры,
|
||||||
# за которой следует пробел, пунктуация или конец строки.
|
# за которой следует пробел, пунктуация или конец строки.
|
||||||
# (?<=\p{L}|[?!…]) - "просмотр назад" на букву или ?!…
|
# (?<=\p{L}|[?!…\.]) - "просмотр назад" на букву или ?!… и точку.
|
||||||
# (?=\s|[.,;:!?\)\"»”’]|\Z) - "просмотр вперед" на пробел, пунктуацию или конец строки (\Z).
|
# (?=\s|[.,;:!?\)\"»”’]|\Z) - "просмотр вперед" на пробел, пунктуацию или конец строки (\Z).
|
||||||
self._closing_quote_pattern = regex.compile(r'(?<=\p{L}|[?!…])\"(?=\s|[\.,;:!?\)\]»”’\"\']|\Z)')
|
self._closing_quote_pattern = regex.compile(r'(?<=\p{L}|[?!…\.])\"(?=\s|[\.,;:!?\)\]»”’\"\']|\Z)')
|
||||||
# self._closing_quote_pattern = regex.compile(r'(?<=\p{L}|\p{N})\"(?=\s|[\.,;:!?\)\"»”’]|\Z)')
|
# self._closing_quote_pattern = regex.compile(r'(?<=\p{L}|\p{N})\"(?=\s|[\.,;:!?\)\"»”’]|\Z)')
|
||||||
# self._closing_quote_pattern = regex.compile(r'(?<=\p{L}|[?!…])\"(?=\s|[\p{Po}\p{Pf}"\']|\Z)')
|
# self._closing_quote_pattern = regex.compile(r'(?<=\p{L}|[?!…])\"(?=\s|[\p{Po}\p{Pf}"\']|\Z)')
|
||||||
|
|
||||||
|
@@ -34,8 +34,8 @@ QUOTES_TEST_CASES = [
|
|||||||
('ru', 'Текст "в кавычках".', 'Текст «в кавычках».'),
|
('ru', 'Текст "в кавычках".', 'Текст «в кавычках».'),
|
||||||
('en', '"Word".', '“Word”.'),
|
('en', '"Word".', '“Word”.'),
|
||||||
# Точка ВНУТРИ кавычек - неправильная пунктуация, закрывающая кавычка не обрабатывается (согласно README)
|
# Точка ВНУТРИ кавычек - неправильная пунктуация, закрывающая кавычка не обрабатывается (согласно README)
|
||||||
('ru', 'Текст "в кавычках."', 'Текст «в кавычках."'),
|
('ru', 'Текст "в кавычках."', 'Текст «в кавычках.»'),
|
||||||
('en', '"Word."', '“Word."'),
|
('en', '"Word."', '“Word.”'),
|
||||||
# Знаки ?, !, … ВНУТРИ кавычек - правильная пунктуация, корректно обрабатывается
|
# Знаки ?, !, … ВНУТРИ кавычек - правильная пунктуация, корректно обрабатывается
|
||||||
('ru', '"Слово?"', '«Слово?»'),
|
('ru', '"Слово?"', '«Слово?»'),
|
||||||
('en', '"Word?"', '“Word?”'),
|
('en', '"Word?"', '“Word?”'),
|
||||||
|
Reference in New Issue
Block a user