Будучи админом уже уйму лет, до сих пор как-то
обходилась без парсеров. Нет я, само собой,
употребляю фильтры, но полноценного инструмента
для разбора текста в хозяйстве не держала. А
повыпускав пару месяцев эту рассылку, поняла, что
мне срочно нужно автоматизировать монотонную часть
работы, необходимую при отборе рассылок для
ворчалок. Другими словами нужно срочно найти
приличную библиотеку html-парсинга. Порыскав через
поисковики по всяким обсуждалкам, наткнулась на
великолепную рекомендацию бумажного учебника, а
найдя его в электронном виде, с удивлением для
себя обнаружила, что все мои проблемы изящно
решаются Perl-oм.
А значит, я тут же стала проверять, на что
о Перле я уже подписана, и не пропустила ли
какой-нибудь жемчуг. Обнаружила, что собственно
о Перле у ГорKота только 4! рассылки - три весьма
древние, и на них подписаны практически все, кого
они могли бы заинтересовать. Просмотрев их архивы
у себя на диске и сравнив с действительно
чрезвычайно захватывающим учебником, который я уже
закачала, поняла что читать их буду не раньше чем
проглочу учебник.
А вот совсем молодая рассылка - вышло всего
два выпуска - меня заинтересовала. Каждый выпуск
- не более 2-х экранов с исходником маленькой
конкретной програмки, решающей малюсенький, но
жизненную проблемку. Один выпуск посвящен обходу
подкаталогов, а второй группировке файлов по дням,
месяцам или датам. IMHO замечательное дополнение
практики к учебнику, который я сейчас читаю.
html-версия формируется ГорКотом, т.е. фактически
это текст. В принципе внешний вид текста меня
устраивает, за исключением того, что концы
несколько строк в выпуске могут быть не видны на
стнадартном экране в 80 символов.
Кроме того, мне, как читателю, хотелось бы,
чтобы каждый выпуск содержал название рассылки в
тексте (дабы хранить выпуски отдельно от почтовой
базы, номер выпуска (дабы отслеживать номера, не
досланные ГорКотом) и мыло автора (дабы иметь
возможность написать оному, не обращаясь к описанию
рассылки).