mod: +++++++приоритеты и тесты html-мнемоник для decode_to_unicode()
This commit is contained in:
@@ -34,6 +34,10 @@ EN_ALPHABET_UPPER = EN_VOWELS_UPPER | EN_CONSONANTS_UPPER
|
||||
EN_ALPHABET_LOWER = frozenset([char.lower() for char in EN_ALPHABET_UPPER])
|
||||
EN_ALPHABET_FULL = EN_ALPHABET_UPPER | EN_ALPHABET_LOWER
|
||||
|
||||
# --- Специальные символы ---
|
||||
NBSP_CHAR = '\u00A0' # Неразрывный пробел ( )
|
||||
SHY_CHAR = '\u00AD' # Мягкий перенос (­)
|
||||
|
||||
# === КОНСТАНТЫ ДЛЯ КОДИРОВАНИЯ HTML-МНЕМНОИКОВ ===
|
||||
# --- ЧЕРНЫЙ СПИСОК: Символы, которые НИКОГДА не нужно кодировать в мнемоники ---
|
||||
NEVER_ENCODE_CHARS = (frozenset(['!', '#', '%', '(', ')', '*', ',', '.', '/', ':', ';', '=', '?', '@',
|
||||
@@ -97,20 +101,19 @@ CUSTOM_ENCODE_MAP = {
|
||||
# '\u007b': '{', # { / { / {
|
||||
# '\u007d': '}', # } / } / }
|
||||
# '\u007c': '|', # | / | / | / |
|
||||
# '\u0026': '&', # & / & / &
|
||||
# '\u00A0': ' ', # / /  
|
||||
'\u0022': '"', # " / " / "
|
||||
# '\u0026': '&', # & / & / &
|
||||
# '\u00A0': ' ', # / /  
|
||||
'\u0022': '"', # " / " / "
|
||||
'\u0026': '&', # & / & / &
|
||||
'\u003e': '>', # > / > / >
|
||||
'\u003c': '<', # < / < / <
|
||||
'\u003c': '<', # < / < / <
|
||||
'\u00ae': '®', # ® / ® / ® / ®
|
||||
'\u00b7': '·', # · / · / · / ·
|
||||
'\u0060': '`', # ` / grave / DiacriticalGrave
|
||||
'\u00a8': '¨', # ¨ / ¨ / ¨ / ¨
|
||||
'\u00a8': '¨', # ¨ / ¨ / ¨ / ¨ / ¨
|
||||
'\u00b1': '±', # ± / ± / ±
|
||||
'\u00bd': '½', # ½ / ½ / ½
|
||||
'\u00af': '¯', # ¯ / ¯ / ¯
|
||||
'\u00a8': '¨', # ¨ / ¨ / ¨
|
||||
'\u00af': '¯', # ¯ / ¯ / ¯
|
||||
'\u201a': '‚', # ‚ / ‚ / ‚
|
||||
'\u223e': '∾', # ∾ / ∾ / ∾
|
||||
'\u2207': '∇', # ∇ / ∇ / ∇
|
||||
|
Reference in New Issue
Block a user