вторник, 21 мая 2013 г.

Чистка HTML от всякой гадости

Часто бывает необходимо получить «чистый» HTML-код из документа Word или Excel. Проблема в том, что сохраняя документ как web-страницу в коде мы находим много мусора: ненужные стили и прочую хрень. До недавнего времени я чистил такие файлы с помощью старенькой программы HomeSite, потом перешел на использование регулярных выражений в программе Notepad++. Давно думал написать какую-нибудь свою программу по чистке, да всё руки не доходили.

Но вот сегодня наткнулся на сайт: http://www.weare.ru/cgi-bin/clearhtml.cgi

Проверил, и приятно удивился — из загаженного документа на выходе появился чистенький HTML-код.

Комментариев нет:

Отправить комментарий