From 68ad5d78231339719efcff6a68c57c52ebbf71ed Mon Sep 17 00:00:00 2001 From: erjemin Date: Tue, 5 Aug 2025 22:43:24 +0300 Subject: [PATCH] =?UTF-8?q?mod:=20=D0=BC=D0=B8=D0=BD=D0=BE=D1=80=20(=D0=B8?= =?UTF-8?q?=D0=B7-=D0=B7=D0=B0=20=D0=B8=D0=B7=D0=BC=D0=B5=D0=BD=D0=B5?= =?UTF-8?q?=D0=BD=D0=B8=D0=B9=20=D0=B2=20config.py)?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit --- etpgrf/unbreakables.py | 7 ++++--- 1 file changed, 4 insertions(+), 3 deletions(-) diff --git a/etpgrf/unbreakables.py b/etpgrf/unbreakables.py index 97bf41d..78d254c 100644 --- a/etpgrf/unbreakables.py +++ b/etpgrf/unbreakables.py @@ -6,7 +6,8 @@ import regex import logging -from etpgrf.config import LANG_RU, LANG_RU_OLD, LANG_EN, KEY_NBSP, ALL_ENTITIES +import html +from etpgrf.config import LANG_RU, LANG_RU_OLD, LANG_EN # , KEY_NBSP, ALL_ENTITIES from etpgrf.comutil import parse_and_validate_langs from etpgrf.defaults import etpgrf_settings @@ -66,8 +67,8 @@ class Unbreakables: def __init__(self, langs: str | list[str] | tuple[str, ...] | frozenset[str] | None = None): self.langs = parse_and_validate_langs(langs) - # Так как внутри типографа кодировка html, то символ неразрывного пробела независим от режима - self._nbsp_char = ALL_ENTITIES[KEY_NBSP][0] + # Получаем символ неразрывного пробела напрямую из стандартной библиотеки + self._nbsp_char = chr(html.entities.name2codepoint['nbsp']) # <--- ИЗМЕНИТЬ # --- 1. Собираем наборы слов для обработки --- pre_words = set()