add: неразрывные пробелы для предлогов, союзов, частиц и т.п. (с пре-позицией и пост-позицией)

This commit is contained in:
2025-07-18 00:31:02 +03:00
parent 96fa73e43d
commit 6b72da89c4
5 changed files with 180 additions and 18 deletions

View File

@@ -29,7 +29,11 @@ SHY_ENTITIES = {
# Пробелы и неразрывные пробелы
SPACE_ENTITIES = {
'NBSP': ('\u00A0', ' '), # Неразрывный пробел
'ZWSP': ('\u200B', '​'), # Пробел нулевой ширины (если нужен)
'THINSP': ('\u2009', ' '), # Тонкий пробел
'ENSP': ('\u2002', ' '), # Полуширокий пробел
'EMSP': ('\u2003', ' '), # Широкий пробел
'ZWNJ': ('\u200C', '‌'), # Разрывный пробел нулевой ширины (без пробела)
'ZWJ': ('\u200D', '‍'), # Неразрывный пробел нулевой ширины
}
# Тире и дефисы
@@ -41,12 +45,19 @@ DASH_ENTITIES = {
# Кавычки
QUOTE_ENTITIES = {
'LAQUO': ('\u00AB', '«'), # «
'RAQUO': ('\u00BB', '»'), # »
'LDQUO': ('\u201C', '“'), # “ (левая двойная)
'RDQUO': ('\u201D', '”'), # ” (правая двойная)
'LSQUO': ('\u2018', '‘'), # (левая одинарная)
'RSQUO': ('\u2019', '’'), # (правая одинарная)
'QUOT': ('\u0022', '"'), # Двойная кавычка (универсальная) -- "
'APOS': ('\u0027', '''), # Апостроф (одинарная кавычка) -- '
'LAQUO': ('\u00AB', '«'), # Открывающая (левая) кавычка «ёлочка» -- «
'RAQUO': ('\u00BB', '»'), # Закрывающая (правая) кавычка «ёлочка» -- »
'LDQUO': ('\u201C', '“'), # Oткрывающая (левая) двойная кавычка -- “
'RDQUO': ('\u201D', '”'), # Закрывающая (правая) двойная кавычка -- ”
'BDQUO': ('\u2039', '„'), # Нижняя двойная кавычка -- „
'LSQUO': ('\u2018', '‘'), # Открывающая (левая) одинарная кавычка --
'RSQUO': ('\u2019', '’'), # Закрывающая (правая) одинарная кавычка --
'SBQUO': ('\u201A', '‚'), # Нижняя одинарная кавычка --
'LSAQUO': ('\u2039', '‹'), # Открывающая французская угловая кавычка --
'RSAQUO': ('\u203A', '›'), # Закрывающая французская угловая кавычка --
}
# Другие символы (пример для расширения)