Восстановление буквы «ё» в русских текстах
Особенности
- проверка и восстановление буквы «ё» в русских текстах, вместо написанной «е»;
- замена «е» на «ё» только в бесспорных случаях;
- исправление в словах нескольких букв «е», «ё»;
- корректная обработка сокращений («мед. училище», но не «мёд. училище»);
- аббревиатуры не обрабатываются.
Установка
npm install eyo-kernel
Зависимости
Отсутствуют.
Использование
const Eyo = ;const text = 'Мой текст...'; // Работа с безопасным встроенным словарём.const safeEyo = ;safeEyodictionary; // ./dict/safe.txt.gzconsole;console; // Работа с небезопасным встроенным словарём.const notSafeEyo = ;notSafeEyodictionary; // ./dict/not_safe.txt.gzconsole;console; // Загрузка собственного словаря.const eyo = ;// Также поддерживаются словари, сжатые с помощью gzip, *.txt.gzeyodictionary;console;console; // Создание собственного словаря.const eyo = ;// Добавить слово в свой словарь.eyodictionary;// Удалить слово из словаря.eyodictionary;// Очистить словарь.eyodictionaryclear;
Словарь
Первоначально словарь взят из проекта php-yoficator. По доработкам словаря см. CHANGELOG.md.
Формат словаря
Это текстовый файл с кодировкой UTF-8, каждое слово на отдельной строке.
Слова в словаре чувствительны к регистру букв. Слова, начинающиеся со строчной буквы, заменят в тексте слова со строчной и заглавной букв (Еж → Ёж и еж → ёж).
А слова, начинающиеся с заглавной буквы, заменят в тексте слова только с заглавной буквы (Еж → Ёж).
Для комментариев используйте символ #
.
Консольная утилита
Eyo в Yaspeller
В yaspeller добавлена поддержка eyo.
Используйте опцию --check-yo
в командной строке yaspeller -l ru --check-yo my_file.txt
или параметр checkYo: true
в конфигурационном файле.
Ссылки
- Веб-интерфейс для восстановления буквы «ё»
- Консольная утилита
- http://ru.wikipedia.org/wiki/Ёфикатор
- Про букву ё
- Поиск опечаток в тексте
Лицензия
MIT License