skladchik.com Python Скрипт чистки текста от skladchik.com

Эри

Тестит темы
3 Апр 2014
111
94
11
39
Скрипт написанный на Python 3, который обрабатывает текст, собранный парсером и сохраняет только качественные предложения, устраняя в них различные ошибки.
Скрипт работает аккуратно, сохраняя максимальное количество предложений. В очищенных текстах вы не найдете китайских иероглифов, знаков, изображающих кеды, смайликов и прочих ненужных символов, вы увидите только нормальный текст, знаки пунктуации и необходимые символы.
По окончании работы скрипт выводит сообщения о времени работы, первоначальном и конечном размерах всех обрабатываемых файлов.

Может получиться так, что после обработки своих текстов вы обнаружите какие-то "дефекты", что-то вам не понравится. Я готов буду рассмотреть такие тексты и внести изменения в код в ходе обсуждения после закрытия складчины. Длительную поддержку не обещаю, но если будут пожелания со стороны складчиков, внесу изменения в код.
Поздно увидел складчину. Судя по описанию и отзывам, классный скрипт.

Источник слива темы:
Скрытое содержимое для зарегистрированных пользователей!