Title

Союз и{CHAR_NBSP}слово и{CHAR_NBSP}еще один союз а{CHAR_NBSP}текст.

Он сказал: "В 1941-1945 гг. -- было 100 тыс. руб. и т. д."

Он сказал: «В 1941–1945 гг. – было 100 тыс. руб.' ' и т. д.»

Он сказал: "В 1941-1945 гг. -- было 100 тыс. руб. и т. д."

Он сказал: «В 1941–1945 гг. – было 100 тыс. руб.' ' и т. д.»

Он сказал: "В 1941-1945 гг. -- было 100 тыс. руб. и т. д."

Он{CHAR_NBSP}сказал: «В{CHAR_NBSP}1941{CHAR_NDASH}1945{CHAR_NBSP}гг.{CHAR_NBSP}{CHAR_NDASH} было' f' 100{CHAR_NBSP}тыс.{CHAR_THIN_SP}руб. и{CHAR_NBSP}т.{CHAR_THIN_SP}д.»

"Почему", "зачем" и "кому это выгодно" -- вопросы требующие ответа.

«Почему», «зачем» и «кому это выгодно' '» – вопросы требующие ответа.

"Почему", "зачем" и "кому это выгодно" -- вопросы требующие ответа.

«Почему», «зачем» и «кому это выгодно» – вопросы требующие ответа.

"Почему", "зачем" и "кому это выгодно" -- вопросы требующие ответа.

«Почему», «зачем» и{CHAR_NBSP}«кому это выгодно»{CHAR_NBSP}{CHAR_NDASH} вопросы требующие ответа.

, , ) ('Текст без тегов', 'Текст без тегов'), # Исправлено: ожидаем nbsp ('Текст с тегом внутри', 'Текст с тегом внутри'), # 3. Полноценный html-документ -> должен сохранить структуру ('

Текст', '

Текст

'), ('

Текст', '

Текст

'), ('Текст жирный курсив', 'Текст жирный курсив'), # 5. Тест на защищенные теги с "битым" HTML внутри (BS их закроет) ('
Исправлена проблема с появлением лишних тегов <html> и <body> при обработке фрагментов HTML.
Заголовок
', '
Исправлена проблема с появлением лишних тегов <html> и <body> при обработке фрагментов HTML.
Заголовок
'), # 6/ Исправленный тест на защищенные теги с немаскированными HTML внутри # (все незакрытые теги будут закрыты через BS, а тег удалены) ('
Исправлена проблема\n с появлением лишних тегов ++ и при обработке фрагментов HTML.
Заголовок
', '
Исправлена проблема\n с появлением лишних тегов ++ и при обработке фрагментов HTML.
Заголовок
'), # 7. Тест на маскированные мнемоники и де-экранирование & ('
Текст с < и > и & внутри.
', '
Текст с < и > и & внутри.
'), ('
Текст с < и > и & внутри.
', '
Текст с < и > и & внутри.
'), ('
Мнемоника   превратится в неразрывный пробел
', '
Мнемоника   превратится в неразрывный пробел
'), ] @pytest.mark.parametrize("input_html, expected_html", HTML_STRUCTURE_TEST_CASES) def test_typographer_html_structure_preservation(input_html, expected_html): """ Проверяет, что Typographer не добавляет лишние теги (html, body, p) вокруг фрагментов и текста, но сохраняет их, если они были. """ # Отключаем все "украшательства" (кавычки, неразрывные пробелы), # чтобы проверять только структуру тегов. typo = Typographer( langs='ru', process_html=True, mode='mixed', hyphenation=False, quotes=False, unbreakables=True, # Оставим unbreakables, чтобы проверить, что добавляются, но теги не ломаются layout=False, symbols=False ) actual_html = typo.process(input_html) # Для теста с doctype может быть нюанс с форматированием (переносы строк), # поэтому нормализуем пробелы перед сравнением if '' in actual_html assert '' in actual_html assert '
Текст
' in actual_html else: assert actual_html == expected_html