Вопрос № 72736: Добрый день!
Имеется следующая проблема - необходим текстологический анализ (синтаксис, грамматика, первичная классификация объектов) некоторых HTML-страниц в Интернете. Вопрос в следующем, подходит ли для этой цели Perl, и если да, то какую...
Вопрос № 72.736
Добрый день!
Имеется следующая проблема - необходим текстологический анализ (синтаксис, грамматика, первичная классификация объектов) некоторых HTML-страниц в Интернете. Вопрос в следующем, подходит ли для этой цели Perl, и если да, то какую литературу по решению данной проблемы на этом языке вы можете посоветовать.
Заранее благодарен!
Отправлен: 26.01.2007, 13:09
Вопрос задал: Zaec (статус: Посетитель)
Всего ответов: 3 Мини-форум вопроса >>> (сообщений: 2)
Отвечает: Duke
Здравствуйте, Zaec!
PERL - Practical Extraction and Report Language, идеально подходит для обработки текстовой информации(в частности для HTML, не даром это один из самых популярных языков написания CGI сценариев). Одна из самых сильных сторон языка - регулярные выражения. Если нет проблем с английским, то самое лучшее - это хелп, поставляемый с дистрибутивом. На русском, к сожалению, посоветовать ничего не могу, хотя видел толстые книжки в магазинах.
Ответ отправил: Duke (статус: 3-ий класс)
Ответ отправлен: 26.01.2007, 13:45
Отвечает: -OC-
Здравствуйте, Zaec!
вполне подходит.
литература:
1.Programming Perl, Third Edition
By Larry Wall, Tom Christiansen, Jon Orwant
2.Perl Cookbook, Second Edition
By Tom Christiansen, Nathan Torkington
3.Mastering Regular Expressions, Second Edition
By Jeffrey E. F. Friedl
названия на англ, но существуют переведенные.
Ответ отправил: -OC- (статус: Студент)
Ответ отправлен: 26.01.2007, 13:52
Отвечает: ramok
Здравствуйте, Zaec!
ccылка на книги что перечислил -OC-
http://unix.org.ua/orelly/perl/
Ответ отправил: ramok (статус: Студент)
Ответ отправлен: 26.01.2007, 15:15