mod: Документация+ (+предлоги/частицы, +компоновка)
This commit is contained in:
16
README.md
16
README.md
@@ -191,15 +191,15 @@ result = typo_no_quotes.process(text='Этот "текст" будет обра
|
|||||||
специальные пробелы:
|
специальные пробелы:
|
||||||
|
|
||||||
* Неразрывный пробел (` `) ставится между фамилией и инициалом/инициалами (`А. Пушкин` → `А. Пушкин`).
|
* Неразрывный пробел (` `) ставится между фамилией и инициалом/инициалами (`А. Пушкин` → `А. Пушкин`).
|
||||||
Неважно стоят ли инициалы перед фамилией или после нее. Важно наличие точки и буквы (инициала), написанного
|
Неважно стоят ли инициалы перед фамилией или после неё. Важно наличие точки и буквы (инициала), написанного
|
||||||
с заглавной буквы.
|
с заглавной буквы.
|
||||||
* Тонкая шпация ( ) ставится между самими инициалами, если они написаны слитно, для улучшения внешнего вида
|
* Тонкая шпация ( ) ставится между самими инициалами, если они написаны слитно, для улучшения внешнего вида
|
||||||
(`А.С.Пушкин` → `А. С.Пушкин`). Число инициалов не ограничено (`J.R.R. Tolkien` → `J. R. R.
|
(`Пушкин А. С. ` → `Пушкин А. С.`). Число инициалов не ограничено (`J.R.R. Tolkien` →
|
||||||
Tolkien`), наличие или отсутствие пробелов между инициалами в исходном тексте неважно.
|
`J. R. R. Tolkien`), наличие или отсутствие пробелов между инициалами в исходном тексте неважно.
|
||||||
* Акронимы, написанные через точку (не слитно, например, **Н.Л.О.**), разделяются так же, как инициалы, через тонкую шпацию
|
* Акронимы, написанные через точку (не слитно, например, **Н.Л.О.**), разделяются так же, как инициалы, через тонкую шпацию
|
||||||
(`Н.Л.О.` → `Н. Л. О.`). Наличие или отсутствие пробелов между буквами в исходном тексте неважно.
|
(`Н.Л.О.` → `Н. Л. О.`). Наличие или отсутствие пробелов между буквами в исходном тексте неважно.
|
||||||
|
|
||||||
Это правило может давать побочные эффекты (в частности, тонкая шпация не явлеятся неразрывным пробелом, и в длинных
|
Это правило может давать побочные эффекты (в частности, тонкая шпация не является неразрывным пробелом, и в длинных
|
||||||
акронимах может привести к разрыву строки). Поэтому его обработку можно отключить с помощью параметра
|
акронимах может привести к разрыву строки). Поэтому его обработку можно отключить с помощью параметра
|
||||||
`process_initials_and_acronyms`:
|
`process_initials_and_acronyms`:
|
||||||
```python
|
```python
|
||||||
@@ -214,13 +214,14 @@ result = typo.process("А. С. Пушкин") # Останется без изм
|
|||||||
|
|
||||||
* **Простых единиц:** `100 км` → `100 км`, `-5 °C` → `-5 °C`'
|
* **Простых единиц:** `100 км` → `100 км`, `-5 °C` → `-5 °C`'
|
||||||
* **Составных единиц:** `120 кв. м.` → `120 кв. м.`, `50 тыс. руб.` → `50 тыс. руб.`
|
* **Составных единиц:** `120 кв. м.` → `120 кв. м.`, `50 тыс. руб.` → `50 тыс. руб.`
|
||||||
* **Единиц с предлогом:** `№ 5` → `№ 5`
|
* **Единиц с предлогом:** `№ 5` → `№ 5`, `§ 7` → `§ 7`, `$ 100` → `$ 100`
|
||||||
* **Чисел, записанных и арабскими, и римскими цифрами:** `V век` → `V век`
|
* **Чисел, записанных и арабскими, и римскими цифрами:** `V в.н.э.` → `V в. н. э.`
|
||||||
* Если единицами изменений есть математические символы (например, умножение или деление): `10 км / ч` → `10 км/ч`
|
* Если единицами изменений есть математические символы (например, умножение или деление): `10 км / ч` → `10 км/ч`
|
||||||
(не важно есть пробелы вокруг `/` или нет).
|
(неважно есть пробелы вокруг `/` или нет). Распознаются и другие символы: `·`, `*`, `×`, `÷`.
|
||||||
|
|
||||||
Библиотека "знает" множество стандартных единиц для русского и английского языков. Но не все. Вы можете расширить этот
|
Библиотека "знает" множество стандартных единиц для русского и английского языков. Но не все. Вы можете расширить этот
|
||||||
список, передав свои кастомные единицы через параметр `process_units`:
|
список, передав свои кастомные единицы через параметр `process_units`:
|
||||||
|
|
||||||
```python
|
```python
|
||||||
# Передаем список
|
# Передаем список
|
||||||
typo = etpgrf.Typographer(process_units=['бочек', 'вёдер'])
|
typo = etpgrf.Typographer(process_units=['бочек', 'вёдер'])
|
||||||
@@ -230,6 +231,7 @@ result = typo.process("Нужно 10 бочек.") # -> "Нужно 10 б
|
|||||||
```
|
```
|
||||||
|
|
||||||
Если нужно отключить распознавание обработку единиц измерения:
|
Если нужно отключить распознавание обработку единиц измерения:
|
||||||
|
|
||||||
```python
|
```python
|
||||||
typo = etpgrf.Typographer(process_units=False)
|
typo = etpgrf.Typographer(process_units=False)
|
||||||
result = typo.process("100 км/ч") # Останется без изменений
|
result = typo.process("100 км/ч") # Останется без изменений
|
||||||
|
Reference in New Issue
Block a user