mod: Документация+ (+предлоги/частицы, +компоновка)

This commit is contained in:
2025-09-24 00:42:00 +03:00
parent 5e533d75f5
commit cc367482aa

View File

@@ -191,15 +191,15 @@ result = typo_no_quotes.process(text='Этот "текст" будет обра
специальные пробелы:
* Неразрывный пробел (` `) ставится между фамилией и инициалом/инициалами (`А. Пушкин``А. Пушкин`).
Неважно стоят ли инициалы перед фамилией или после нее. Важно наличие точки и буквы (инициала), написанного
Неважно стоят ли инициалы перед фамилией или после неё. Важно наличие точки и буквы (инициала), написанного
с заглавной буквы.
* Тонкая шпация ( ) ставится между самими инициалами, если они написаны слитно, для улучшения внешнего вида
(`А.С.Пушкин``А. С.Пушкин`). Число инициалов не ограничено (`J.R.R. Tolkien` `J. R. R.
Tolkien`), наличие или отсутствие пробелов между инициалами в исходном тексте неважно.
(`Пушкин А. С. ``Пушкин А. С.`). Число инициалов не ограничено (`J.R.R. Tolkien`
`J. R. R. Tolkien`), наличие или отсутствие пробелов между инициалами в исходном тексте неважно.
* Акронимы, написанные через точку (не слитно, например, **Н.Л.О.**), разделяются так же, как инициалы, через тонкую шпацию
(`Н.Л.О.``Н. Л. О.`). Наличие или отсутствие пробелов между буквами в исходном тексте неважно.
Это правило может давать побочные эффекты (в частности, тонкая шпация не явлеятся неразрывным пробелом, и в длинных
Это правило может давать побочные эффекты (в частности, тонкая шпация не является неразрывным пробелом, и в длинных
акронимах может привести к разрыву строки). Поэтому его обработку можно отключить с помощью параметра
`process_initials_and_acronyms`:
```python
@@ -214,13 +214,14 @@ result = typo.process("А. С. Пушкин") # Останется без изм
* **Простых единиц:** `100 км``100 км`, `-5 °C``-5 °C`'
* **Составных единиц:** `120 кв. м.``120 кв. м.`, `50 тыс. руб.``50 тыс. руб.`
* **Единиц с предлогом:** `№ 5``№ 5`
* **Чисел, записанных и арабскими, и римскими цифрами:** `V век``V век`
* **Единиц с предлогом:** `№ 5``№ 5`, `§ 7``§ 7`, `$ 100``$ 100`
* **Чисел, записанных и арабскими, и римскими цифрами:** `V в.н.э.``V в. н. э.`
* Если единицами изменений есть математические символы (например, умножение или деление): `10 км / ч``10 км/ч`
(не важно есть пробелы вокруг `/` или нет).
(неважно есть пробелы вокруг `/` или нет). Распознаются и другие символы: `·`, `*`, `×`, `÷`.
Библиотека "знает" множество стандартных единиц для русского и английского языков. Но не все. Вы можете расширить этот
список, передав свои кастомные единицы через параметр `process_units`:
```python
# Передаем список
typo = etpgrf.Typographer(process_units=['бочек', 'вёдер'])
@@ -230,6 +231,7 @@ result = typo.process("Нужно 10 бочек.") # -> "Нужно 10 б
```
Если нужно отключить распознавание обработку единиц измерения:
```python
typo = etpgrf.Typographer(process_units=False)
result = typo.process("100 км/ч") # Останется без изменений