mod: Документация+ (+предлоги/частицы, +компоновка)
This commit is contained in:
16
README.md
16
README.md
@@ -191,15 +191,15 @@ result = typo_no_quotes.process(text='Этот "текст" будет обра
|
||||
специальные пробелы:
|
||||
|
||||
* Неразрывный пробел (` `) ставится между фамилией и инициалом/инициалами (`А. Пушкин` → `А. Пушкин`).
|
||||
Неважно стоят ли инициалы перед фамилией или после нее. Важно наличие точки и буквы (инициала), написанного
|
||||
Неважно стоят ли инициалы перед фамилией или после неё. Важно наличие точки и буквы (инициала), написанного
|
||||
с заглавной буквы.
|
||||
* Тонкая шпация ( ) ставится между самими инициалами, если они написаны слитно, для улучшения внешнего вида
|
||||
(`А.С.Пушкин` → `А. С.Пушкин`). Число инициалов не ограничено (`J.R.R. Tolkien` → `J. R. R.
|
||||
Tolkien`), наличие или отсутствие пробелов между инициалами в исходном тексте неважно.
|
||||
(`Пушкин А. С. ` → `Пушкин А. С.`). Число инициалов не ограничено (`J.R.R. Tolkien` →
|
||||
`J. R. R. Tolkien`), наличие или отсутствие пробелов между инициалами в исходном тексте неважно.
|
||||
* Акронимы, написанные через точку (не слитно, например, **Н.Л.О.**), разделяются так же, как инициалы, через тонкую шпацию
|
||||
(`Н.Л.О.` → `Н. Л. О.`). Наличие или отсутствие пробелов между буквами в исходном тексте неважно.
|
||||
|
||||
Это правило может давать побочные эффекты (в частности, тонкая шпация не явлеятся неразрывным пробелом, и в длинных
|
||||
Это правило может давать побочные эффекты (в частности, тонкая шпация не является неразрывным пробелом, и в длинных
|
||||
акронимах может привести к разрыву строки). Поэтому его обработку можно отключить с помощью параметра
|
||||
`process_initials_and_acronyms`:
|
||||
```python
|
||||
@@ -214,13 +214,14 @@ result = typo.process("А. С. Пушкин") # Останется без изм
|
||||
|
||||
* **Простых единиц:** `100 км` → `100 км`, `-5 °C` → `-5 °C`'
|
||||
* **Составных единиц:** `120 кв. м.` → `120 кв. м.`, `50 тыс. руб.` → `50 тыс. руб.`
|
||||
* **Единиц с предлогом:** `№ 5` → `№ 5`
|
||||
* **Чисел, записанных и арабскими, и римскими цифрами:** `V век` → `V век`
|
||||
* **Единиц с предлогом:** `№ 5` → `№ 5`, `§ 7` → `§ 7`, `$ 100` → `$ 100`
|
||||
* **Чисел, записанных и арабскими, и римскими цифрами:** `V в.н.э.` → `V в. н. э.`
|
||||
* Если единицами изменений есть математические символы (например, умножение или деление): `10 км / ч` → `10 км/ч`
|
||||
(не важно есть пробелы вокруг `/` или нет).
|
||||
(неважно есть пробелы вокруг `/` или нет). Распознаются и другие символы: `·`, `*`, `×`, `÷`.
|
||||
|
||||
Библиотека "знает" множество стандартных единиц для русского и английского языков. Но не все. Вы можете расширить этот
|
||||
список, передав свои кастомные единицы через параметр `process_units`:
|
||||
|
||||
```python
|
||||
# Передаем список
|
||||
typo = etpgrf.Typographer(process_units=['бочек', 'вёдер'])
|
||||
@@ -230,6 +231,7 @@ result = typo.process("Нужно 10 бочек.") # -> "Нужно 10 б
|
||||
```
|
||||
|
||||
Если нужно отключить распознавание обработку единиц измерения:
|
||||
|
||||
```python
|
||||
typo = etpgrf.Typographer(process_units=False)
|
||||
result = typo.process("100 км/ч") # Останется без изменений
|
||||
|
Reference in New Issue
Block a user