This website requires JavaScript.
aa2112669f
mod: правки для версии 0.1.3
main
v0.1.3
erjemin
2026-01-11 19:04:04 +03:00
d94815d7ee
mod: избавляемся от паразитного "обертывания" в <html> и <body>...
erjemin
2026-01-11 18:41:42 +03:00
cb31c5a3b7
add: добавлены тесты, для проверки обёртывания в <html> и <body>
erjemin
2026-01-11 17:08:41 +03:00
97777a7d0a
mod: minor
erjemin
2025-12-27 23:16:02 +03:00
28b74f0d7e
mod: 0.1.2 description
v0.1.2
erjemin
2025-12-27 21:39:04 +03:00
f35a48a0ae
version to 0.1.2
erjemin
2025-12-27 21:30:36 +03:00
7a7f9dc4cc
Fix: Add missing 'regex' dependency, bump version to 0.1.1
erjemin
2025-12-27 21:27:49 +03:00
8f01b1961e
add: Add library architecture specs (for LLM)
erjemin
2025-12-25 13:04:50 +03:00
a77cd3fa46
mov: examples
erjemin
2025-12-24 15:27:40 +03:00
9d8b5ec55e
mod: minor
erjemin
2025-12-24 15:23:15 +03:00
75a78118ba
mod: ver 0.1.1
v0.1.1
erjemin
2025-12-23 23:24:38 +03:00
6b07fd472b
mod: minor
erjemin
2025-12-23 22:32:12 +03:00
00efdde999
mod: add repo & mirror
erjemin
2025-12-23 22:28:44 +03:00
2a3f55fb49
mod: install and quick start
v0.1.0
erjemin
2025-12-23 22:06:14 +03:00
761f37375f
add: pyproject.toml
erjemin
2025-12-23 22:03:57 +03:00
6d2f3fffa7
mod: credits
erjemin
2025-12-23 18:43:40 +03:00
80dde55f42
mod: Висячая пунктуация в конвейре
erjemin
2025-12-23 17:19:42 +03:00
22ddf6ef11
add: Висячая пунктуация работает (кроме редких случаев когда пробел, или его отуствие, попадает на следующий bs-узел)
erjemin
2025-12-23 17:10:56 +03:00
d4aa437558
mod: Санитайзер оптимизирован и должен работать быстрее.
erjemin
2025-12-19 14:48:55 +03:00
cd1be6bf27
mod: Санитайзер добавлен в конвейер типографа
erjemin
2025-12-19 14:33:46 +03:00
48c90409b8
mod: Санитайзер для очистки от HTML (несколько режимов)
erjemin
2025-10-28 23:46:38 +03:00
57fb4914d8
mod: немного описания в тесте самозакрывающихся тегов
erjemin
2025-10-28 23:45:14 +03:00
65a04e6c44
mod: описание модуля висячей типографики +
erjemin
2025-10-28 23:43:37 +03:00
41f4090439
mod: описание модуля висячей типографики
erjemin
2025-10-23 20:07:08 +03:00
579903cc6d
mod: двухпроходный конвейер типографа (теперь проблеы перед предлогами и кавычками не ломаются из-за html-тегов)
erjemin
2025-10-12 20:16:02 +03:00
4e26952c8b
mod: закрывающая кавычка перед точкой +
erjemin
2025-10-09 12:27:58 +03:00
d77f1db5c2
mod: закрывающая кавычка перед точкой
erjemin
2025-10-09 12:18:32 +03:00
78604a83f5
mod: тесты конвейера +
erjemin
2025-10-05 18:12:34 +03:00
ab82f2ffd8
mod: исправлена ошибка с союзом "и" и "как" +
erjemin
2025-10-05 18:10:06 +03:00
fff9dda8a0
mod: исправлена ошибка с союзом "и" и "как"
erjemin
2025-10-05 18:07:08 +03:00
38581221b4
mod: Порядок правил
erjemin
2025-10-05 16:53:51 +03:00
5adad34fa2
mod: Конвейер типографа с рекурсивным обходом DOM
erjemin
2025-10-05 14:12:09 +03:00
b814504d1e
add: Препозиционные сокращения ('AO', 'ЗАО', 'НКО', и прочее-прочее)
erjemin
2025-10-03 01:14:28 +03:00
79cc4e03cf
add: Препозиционные сокращения ('и.о.', 'т.о.', 'т.к.', 'т.е.' и прочее-прочее)
erjemin
2025-10-03 01:00:03 +03:00
ccab350cb3
add: QR-код для сбора средств (на самом деле чтоб не забыть, какие пластинки заказываю)
erjemin
2025-10-02 20:00:56 +03:00
38e8e3229b
add: Финальные сокращения ('т.д.', 'т.п.', 'др.' и 'пр.')
erjemin
2025-10-01 13:10:11 +03:00
f090988b66
mod: Документация+ (+предлоги/частицы, +компоновка) +
erjemin
2025-10-01 13:03:57 +03:00
cc367482aa
mod: Документация+ (+предлоги/частицы, +компоновка)
erjemin
2025-09-24 00:42:00 +03:00
5e533d75f5
mod: Документация (+предлоги/частицы, +компоновка)
erjemin
2025-09-23 21:06:19 +03:00
ddeb7c6d99
add: LayoutProcessor - обработка едениц измерения (кажется все++ и реализована безопасность от CHAR_UNIT_SEPARATOR)
erjemin
2025-09-22 10:27:59 +03:00
fb9d7f9072
add: LayoutProcessor - обработка едениц измерения (кажется все++ и реализована безопасность от CHAR_UNIT_SEPARATOR)
erjemin
2025-09-22 10:26:25 +03:00
f1b59332f1
add: LayoutProcessor - обработка едениц измерения (кажется все++)
erjemin
2025-09-22 01:35:50 +03:00
d096fb6ec8
add: LayoutProcessor - обработка едениц измерения (кажется все+)
erjemin
2025-09-22 01:32:57 +03:00
21d85c984d
add: LayoutProcessor - обработка едениц измерения (кажется все)
erjemin
2025-09-22 01:27:45 +03:00
67c5bd805a
add: LayoutProcessor - обработка едениц измерения (кажется все)
erjemin
2025-09-22 01:04:38 +03:00
c3e65700b1
add: LayoutProcessor - обработка едениц измерения (draft)
erjemin
2025-09-21 20:23:04 +03:00
a26c9107f2
add: LayoutProcessor - обработка тонких пробелов в инициалах и акронимах
erjemin
2025-08-31 15:41:44 +03:00
4918645496
add: LayoutProcessor - обработка неразрывных пробелов вокруг тире и инициалов
erjemin
2025-08-25 18:15:10 +03:00
9a37467bfc
add: SymbolsProcessor - обработка тире и псевдографики
erjemin
2025-08-22 15:45:38 +03:00
39ef02884e
mod: переименование переменных для символов
erjemin
2025-08-22 15:37:02 +03:00
8e18c7802e
mod: минор
erjemin
2025-08-17 01:13:04 +03:00
66cd6e41d2
mod: минор
erjemin
2025-08-17 01:12:34 +03:00
b4248db063
add: обработка кавычек
erjemin
2025-08-17 01:12:09 +03:00
73fa57e47e
mod: +приоритет языков и кавычки
erjemin
2025-08-17 01:11:23 +03:00
1deae2fa16
mod: +приоритет языков (ru+en -- кто первый, у того и приоритет)
erjemin
2025-08-17 01:07:30 +03:00
32e4b852a1
add: ++кодировки и мнемоники
erjemin
2025-08-12 15:35:22 +03:00
ca88f2da3c
add: +кодировки и мнемоники
erjemin
2025-08-12 00:07:45 +03:00
02035cff40
add: кодировки и мнемоники
erjemin
2025-08-11 23:59:57 +03:00
78b78bf949
mod: спецсимволы ( и ­) берутся из config.py
erjemin
2025-08-11 22:19:40 +03:00
40fd4b5891
mod: +++++++приоритеты и тесты html-мнемоник для decode_to_unicode()
erjemin
2025-08-11 22:18:06 +03:00
c4df3ba9c1
mod: +++++++приоритеты и тесты html-мнемоник для decode_to_unicode()
erjemin
2025-08-11 21:38:49 +03:00
960ec97093
mod: ++++++приоритеты и тесты html-мнемоник для decode_to_unicode()
erjemin
2025-08-09 11:31:30 +03:00
f052ec5eb1
mod: +++++приоритеты и тесты html-мнемоник для decode_to_unicode()
erjemin
2025-08-09 00:48:34 +03:00
a16d4f7416
mod: ++++приоритеты и тесты html-мнемоник для decode_to_unicode()
erjemin
2025-08-08 18:16:35 +03:00
679c9770f0
mod: +++приоритеты и тесты html-мнемоник для decode_to_unicode()
erjemin
2025-08-05 23:32:28 +03:00
34bd07bac0
mod: ++тесты html-мнемоник для decode_to_unicode()
erjemin
2025-08-05 23:18:08 +03:00
68ad5d7823
mod: минор (из-за изменений в config.py)
erjemin
2025-08-05 22:43:24 +03:00
2b53f8b83c
add: делаем строки для теста кодирования utf в мнемоники
erjemin
2025-08-05 22:41:26 +03:00
3684088fd0
mod: +тесты html-мнемоник для decode_to_unicode() ..
erjemin
2025-08-05 22:38:28 +03:00
65970f3170
mod: тесты всех html-мнемоник для decode_to_unicode() .
erjemin
2025-08-05 12:40:31 +03:00
1684649607
mod: тесты всех html-мнемоник для decode_to_unicode()
erjemin
2025-08-05 12:29:32 +03:00
134f3807b2
add: config.py как единый источник правды (на базе html.entities)
erjemin
2025-08-03 20:00:59 +03:00
cf047a2552
mod: исправления utf <-> менемоники и тесты
erjemin
2025-08-02 18:17:45 +03:00
27c950f28d
mad: тест кодека, ещё больше html-мнемоник..
erjemin
2025-08-02 11:46:35 +03:00
6ad0da6097
add: тест кодека html-мнемоник.
erjemin
2025-08-02 11:01:32 +03:00
6c29d3e5fb
add: тест кодека html-мнемоник
erjemin
2025-08-01 20:18:31 +03:00
0b0847843b
mod: изменен поиск суфиксов в английских словах
erjemin
2025-07-30 19:28:34 +03:00
19dab28ecb
mod: тесты переносов в английских словах
erjemin
2025-07-30 19:27:21 +03:00
3a61294d70
mod: еще больше html-мнемокода (стрелки2)
erjemin
2025-07-30 16:06:16 +03:00
863ae131bc
mod: еще больше html-мнемокода (стрелки)
erjemin
2025-07-29 23:45:39 +03:00
6977b6ef88
mod: еще больше html-мнемокода (умляуты)
erjemin
2025-07-28 15:26:51 +03:00
762edf671e
mod: еще больше html-мнемокода (греческие)
erjemin
2025-07-28 09:04:21 +03:00
359f766115
mod: еще больше html-мнемокода
erjemin
2025-07-25 23:43:46 +03:00
d716d394bb
mod: изменен алгоритм переноса в русских словах (императивнный на декларативный) с весами и приоритетами
erjemin
2025-07-24 21:02:40 +03:00
086adc1f7b
mod: изменен алгоритм переноса в русских словах
erjemin
2025-07-24 13:16:18 +03:00
aa3939d1c6
add: тест на переносы в словах (рус)
erjemin
2025-07-23 18:58:46 +03:00
c3a19f02fc
---: minor
erjemin
2025-07-22 14:01:26 +03:00
acc592426f
add: тесты для unbreakables.py
erjemin
2025-07-22 13:12:07 +03:00
7ff18dc2e8
add: codec (внутренний utf-8 и мнемокод для in/out
erjemin
2025-07-21 14:46:13 +03:00
1c5fe77706
add: обработка html (теги исклчены из типографа).
erjemin
2025-07-19 23:00:41 +03:00
6b72da89c4
add: неразрывные пробелы для предлогов, союзов, частиц и т.п. (с пре-позицией и пост-позицией)
erjemin
2025-07-18 00:31:02 +03:00
96fa73e43d
add: проверки на диграммы/триграммы,квадрограммы в английских словах
erjemin
2025-05-19 20:42:49 +03:00
b27c643496
add: переносы в английских словах .
erjemin
2025-05-19 15:02:55 +03:00
42da503411
add: переносы в английских словах
erjemin
2025-05-19 14:07:15 +03:00
cf78766a6b
mod: minor
erjemin
2025-05-14 00:21:20 +03:00
f7ec259a7e
mod: minor
erjemin
2025-05-14 00:18:28 +03:00
1d20f4e5e6
add: логгер ..
erjemin
2025-05-14 00:13:30 +03:00
fcb21bdd9f
add: логгер .
erjemin
2025-05-14 00:06:39 +03:00
70ddf17c9f
add: логгер
erjemin
2025-05-13 23:52:50 +03:00
b593c0148b
add: русская дореволюционная орфография для переносов
erjemin
2025-05-13 16:04:26 +03:00