Часто бывает необходимо получить «чистый» HTML-код из документа Word или Excel. Проблема в том, что сохраняя документ как web-страницу в коде мы находим много мусора: ненужные стили и прочую хрень. До недавнего времени я чистил такие файлы с помощью старенькой программы HomeSite, потом перешел на использование регулярных выражений в программе Notepad++. Давно думал написать какую-нибудь свою программу по чистке, да всё руки не доходили.
Но вот сегодня наткнулся на сайт: http://www.weare.ru/cgi-bin/clearhtml.cgi
Проверил, и приятно удивился — из загаженного документа на выходе появился чистенький HTML-код.
Комментариев нет:
Отправить комментарий