Commit Graph

  • aa2112669f mod: правки для версии 0.1.3 main v0.1.3 erjemin 2026-01-11 19:04:04 +03:00
  • d94815d7ee mod: избавляемся от паразитного "обертывания" в <html> и <body>... erjemin 2026-01-11 18:41:42 +03:00
  • cb31c5a3b7 add: добавлены тесты, для проверки обёртывания в <html> и <body> erjemin 2026-01-11 17:08:41 +03:00
  • 97777a7d0a mod: minor erjemin 2025-12-27 23:16:02 +03:00
  • 28b74f0d7e mod: 0.1.2 description v0.1.2 erjemin 2025-12-27 21:39:04 +03:00
  • f35a48a0ae version to 0.1.2 erjemin 2025-12-27 21:30:36 +03:00
  • 7a7f9dc4cc Fix: Add missing 'regex' dependency, bump version to 0.1.1 erjemin 2025-12-27 21:27:49 +03:00
  • 8f01b1961e add: Add library architecture specs (for LLM) erjemin 2025-12-25 13:04:50 +03:00
  • a77cd3fa46 mov: examples erjemin 2025-12-24 15:27:40 +03:00
  • 9d8b5ec55e mod: minor erjemin 2025-12-24 15:23:15 +03:00
  • 75a78118ba mod: ver 0.1.1 v0.1.1 erjemin 2025-12-23 23:24:38 +03:00
  • 6b07fd472b mod: minor erjemin 2025-12-23 22:32:12 +03:00
  • 00efdde999 mod: add repo & mirror erjemin 2025-12-23 22:28:44 +03:00
  • 2a3f55fb49 mod: install and quick start v0.1.0 erjemin 2025-12-23 22:06:14 +03:00
  • 761f37375f add: pyproject.toml erjemin 2025-12-23 22:03:57 +03:00
  • 6d2f3fffa7 mod: credits erjemin 2025-12-23 18:43:40 +03:00
  • 80dde55f42 mod: Висячая пунктуация в конвейре erjemin 2025-12-23 17:19:42 +03:00
  • 22ddf6ef11 add: Висячая пунктуация работает (кроме редких случаев когда пробел, или его отуствие, попадает на следующий bs-узел) erjemin 2025-12-23 17:10:56 +03:00
  • d4aa437558 mod: Санитайзер оптимизирован и должен работать быстрее. erjemin 2025-12-19 14:48:55 +03:00
  • cd1be6bf27 mod: Санитайзер добавлен в конвейер типографа erjemin 2025-12-19 14:33:46 +03:00
  • 48c90409b8 mod: Санитайзер для очистки от HTML (несколько режимов) erjemin 2025-10-28 23:46:38 +03:00
  • 57fb4914d8 mod: немного описания в тесте самозакрывающихся тегов erjemin 2025-10-28 23:45:14 +03:00
  • 65a04e6c44 mod: описание модуля висячей типографики + erjemin 2025-10-28 23:43:37 +03:00
  • 41f4090439 mod: описание модуля висячей типографики erjemin 2025-10-23 20:07:08 +03:00
  • 579903cc6d mod: двухпроходный конвейер типографа (теперь проблеы перед предлогами и кавычками не ломаются из-за html-тегов) erjemin 2025-10-12 20:16:02 +03:00
  • 4e26952c8b mod: закрывающая кавычка перед точкой + erjemin 2025-10-09 12:27:58 +03:00
  • d77f1db5c2 mod: закрывающая кавычка перед точкой erjemin 2025-10-09 12:18:32 +03:00
  • 78604a83f5 mod: тесты конвейера + erjemin 2025-10-05 18:12:34 +03:00
  • ab82f2ffd8 mod: исправлена ошибка с союзом "и" и "как" + erjemin 2025-10-05 18:10:06 +03:00
  • fff9dda8a0 mod: исправлена ошибка с союзом "и" и "как" erjemin 2025-10-05 18:07:08 +03:00
  • 38581221b4 mod: Порядок правил erjemin 2025-10-05 16:53:51 +03:00
  • 5adad34fa2 mod: Конвейер типографа с рекурсивным обходом DOM erjemin 2025-10-05 14:12:09 +03:00
  • b814504d1e add: Препозиционные сокращения ('AO', 'ЗАО', 'НКО', и прочее-прочее) erjemin 2025-10-03 01:14:28 +03:00
  • 79cc4e03cf add: Препозиционные сокращения ('и.о.', 'т.о.', 'т.к.', 'т.е.' и прочее-прочее) erjemin 2025-10-03 01:00:03 +03:00
  • ccab350cb3 add: QR-код для сбора средств (на самом деле чтоб не забыть, какие пластинки заказываю) erjemin 2025-10-02 20:00:56 +03:00
  • 38e8e3229b add: Финальные сокращения ('т.д.', 'т.п.', 'др.' и 'пр.') erjemin 2025-10-01 13:10:11 +03:00
  • f090988b66 mod: Документация+ (+предлоги/частицы, +компоновка) + erjemin 2025-10-01 13:03:57 +03:00
  • cc367482aa mod: Документация+ (+предлоги/частицы, +компоновка) erjemin 2025-09-24 00:42:00 +03:00
  • 5e533d75f5 mod: Документация (+предлоги/частицы, +компоновка) erjemin 2025-09-23 21:06:19 +03:00
  • ddeb7c6d99 add: LayoutProcessor - обработка едениц измерения (кажется все++ и реализована безопасность от CHAR_UNIT_SEPARATOR) erjemin 2025-09-22 10:27:59 +03:00
  • fb9d7f9072 add: LayoutProcessor - обработка едениц измерения (кажется все++ и реализована безопасность от CHAR_UNIT_SEPARATOR) erjemin 2025-09-22 10:26:25 +03:00
  • f1b59332f1 add: LayoutProcessor - обработка едениц измерения (кажется все++) erjemin 2025-09-22 01:35:50 +03:00
  • d096fb6ec8 add: LayoutProcessor - обработка едениц измерения (кажется все+) erjemin 2025-09-22 01:32:57 +03:00
  • 21d85c984d add: LayoutProcessor - обработка едениц измерения (кажется все) erjemin 2025-09-22 01:27:45 +03:00
  • 67c5bd805a add: LayoutProcessor - обработка едениц измерения (кажется все) erjemin 2025-09-22 01:04:38 +03:00
  • c3e65700b1 add: LayoutProcessor - обработка едениц измерения (draft) erjemin 2025-09-21 20:23:04 +03:00
  • a26c9107f2 add: LayoutProcessor - обработка тонких пробелов в инициалах и акронимах erjemin 2025-08-31 15:41:44 +03:00
  • 4918645496 add: LayoutProcessor - обработка неразрывных пробелов вокруг тире и инициалов erjemin 2025-08-25 18:15:10 +03:00
  • 9a37467bfc add: SymbolsProcessor - обработка тире и псевдографики erjemin 2025-08-22 15:45:38 +03:00
  • 39ef02884e mod: переименование переменных для символов erjemin 2025-08-22 15:37:02 +03:00
  • 8e18c7802e mod: минор erjemin 2025-08-17 01:13:04 +03:00
  • 66cd6e41d2 mod: минор erjemin 2025-08-17 01:12:34 +03:00
  • b4248db063 add: обработка кавычек erjemin 2025-08-17 01:12:09 +03:00
  • 73fa57e47e mod: +приоритет языков и кавычки erjemin 2025-08-17 01:11:23 +03:00
  • 1deae2fa16 mod: +приоритет языков (ru+en -- кто первый, у того и приоритет) erjemin 2025-08-17 01:07:30 +03:00
  • 32e4b852a1 add: ++кодировки и мнемоники erjemin 2025-08-12 15:35:22 +03:00
  • ca88f2da3c add: +кодировки и мнемоники erjemin 2025-08-12 00:07:45 +03:00
  • 02035cff40 add: кодировки и мнемоники erjemin 2025-08-11 23:59:57 +03:00
  • 78b78bf949 mod: спецсимволы (&nbsp; и &shy;) берутся из config.py erjemin 2025-08-11 22:19:40 +03:00
  • 40fd4b5891 mod: +++++++приоритеты и тесты html-мнемоник для decode_to_unicode() erjemin 2025-08-11 22:18:06 +03:00
  • c4df3ba9c1 mod: +++++++приоритеты и тесты html-мнемоник для decode_to_unicode() erjemin 2025-08-11 21:38:49 +03:00
  • 960ec97093 mod: ++++++приоритеты и тесты html-мнемоник для decode_to_unicode() erjemin 2025-08-09 11:31:30 +03:00
  • f052ec5eb1 mod: +++++приоритеты и тесты html-мнемоник для decode_to_unicode() erjemin 2025-08-09 00:48:34 +03:00
  • a16d4f7416 mod: ++++приоритеты и тесты html-мнемоник для decode_to_unicode() erjemin 2025-08-08 18:16:35 +03:00
  • 679c9770f0 mod: +++приоритеты и тесты html-мнемоник для decode_to_unicode() erjemin 2025-08-05 23:32:28 +03:00
  • 34bd07bac0 mod: ++тесты html-мнемоник для decode_to_unicode() erjemin 2025-08-05 23:18:08 +03:00
  • 68ad5d7823 mod: минор (из-за изменений в config.py) erjemin 2025-08-05 22:43:24 +03:00
  • 2b53f8b83c add: делаем строки для теста кодирования utf в мнемоники erjemin 2025-08-05 22:41:26 +03:00
  • 3684088fd0 mod: +тесты html-мнемоник для decode_to_unicode() .. erjemin 2025-08-05 22:38:28 +03:00
  • 65970f3170 mod: тесты всех html-мнемоник для decode_to_unicode() . erjemin 2025-08-05 12:40:31 +03:00
  • 1684649607 mod: тесты всех html-мнемоник для decode_to_unicode() erjemin 2025-08-05 12:29:32 +03:00
  • 134f3807b2 add: config.py как единый источник правды (на базе html.entities) erjemin 2025-08-03 20:00:59 +03:00
  • cf047a2552 mod: исправления utf <-> менемоники и тесты erjemin 2025-08-02 18:17:45 +03:00
  • 27c950f28d mad: тест кодека, ещё больше html-мнемоник.. erjemin 2025-08-02 11:46:35 +03:00
  • 6ad0da6097 add: тест кодека html-мнемоник. erjemin 2025-08-02 11:01:32 +03:00
  • 6c29d3e5fb add: тест кодека html-мнемоник erjemin 2025-08-01 20:18:31 +03:00
  • 0b0847843b mod: изменен поиск суфиксов в английских словах erjemin 2025-07-30 19:28:34 +03:00
  • 19dab28ecb mod: тесты переносов в английских словах erjemin 2025-07-30 19:27:21 +03:00
  • 3a61294d70 mod: еще больше html-мнемокода (стрелки2) erjemin 2025-07-30 16:06:16 +03:00
  • 863ae131bc mod: еще больше html-мнемокода (стрелки) erjemin 2025-07-29 23:45:39 +03:00
  • 6977b6ef88 mod: еще больше html-мнемокода (умляуты) erjemin 2025-07-28 15:26:51 +03:00
  • 762edf671e mod: еще больше html-мнемокода (греческие) erjemin 2025-07-28 09:04:21 +03:00
  • 359f766115 mod: еще больше html-мнемокода erjemin 2025-07-25 23:43:46 +03:00
  • d716d394bb mod: изменен алгоритм переноса в русских словах (императивнный на декларативный) с весами и приоритетами erjemin 2025-07-24 21:02:40 +03:00
  • 086adc1f7b mod: изменен алгоритм переноса в русских словах erjemin 2025-07-24 13:16:18 +03:00
  • aa3939d1c6 add: тест на переносы в словах (рус) erjemin 2025-07-23 18:58:46 +03:00
  • c3a19f02fc ---: minor erjemin 2025-07-22 14:01:26 +03:00
  • acc592426f add: тесты для unbreakables.py erjemin 2025-07-22 13:12:07 +03:00
  • 7ff18dc2e8 add: codec (внутренний utf-8 и мнемокод для in/out erjemin 2025-07-21 14:46:13 +03:00
  • 1c5fe77706 add: обработка html (теги исклчены из типографа). erjemin 2025-07-19 23:00:41 +03:00
  • 6b72da89c4 add: неразрывные пробелы для предлогов, союзов, частиц и т.п. (с пре-позицией и пост-позицией) erjemin 2025-07-18 00:31:02 +03:00
  • 96fa73e43d add: проверки на диграммы/триграммы,квадрограммы в английских словах erjemin 2025-05-19 20:42:49 +03:00
  • b27c643496 add: переносы в английских словах . erjemin 2025-05-19 15:02:55 +03:00
  • 42da503411 add: переносы в английских словах erjemin 2025-05-19 14:07:15 +03:00
  • cf78766a6b mod: minor erjemin 2025-05-14 00:21:20 +03:00
  • f7ec259a7e mod: minor erjemin 2025-05-14 00:18:28 +03:00
  • 1d20f4e5e6 add: логгер .. erjemin 2025-05-14 00:13:30 +03:00
  • fcb21bdd9f add: логгер . erjemin 2025-05-14 00:06:39 +03:00
  • 70ddf17c9f add: логгер erjemin 2025-05-13 23:52:50 +03:00
  • b593c0148b add: русская дореволюционная орфография для переносов erjemin 2025-05-13 16:04:26 +03:00