Рассылка закрыта
При закрытии подписчики были переданы в рассылку "Раскрутка сайта: полезные штуки :)" на которую и рекомендуем вам подписаться.
Вы можете найти рассылки сходной тематики в Каталоге рассылок.
← Август 2009 → | ||||||
1
|
2
|
|||||
---|---|---|---|---|---|---|
3
|
4
|
5
|
6
|
7
|
9
|
|
10
|
11
|
12
|
13
|
14
|
15
|
16
|
17
|
18
|
19
|
20
|
21
|
22
|
23
|
24
|
25
|
26
|
27
|
28
|
29
|
30
|
31
|
Статистика
0 за неделю
Секреты программирования
Уважаемые подписчики!Сегодняшняя тема - использование простой программы в Java для сбора базовой информации о структуре сайта.Если у Вас имеется свой веб-сайт, то желательно, чтобы на его страницах не было ссылок на несуществующие или устаревшие ресурсы. Это улучшит впечатление пользователя, попавшего на ваш сайт, а также повысит позиции сайта в поисковиках. Известно, что специальные поисковые роботы постоянно сканируют интернет. Собранная информация используется для ранжирования сайтов в поисковых запросах. Обычно роботам доступно меньше страниц, чем пользователю сайта в связи с тем, что робот испытывает затруднения при вводе данных в поля форм и при анализе javascript-кодов. "Не очень продвинутый" робот собирает только прямые ссылки на страницы сайта (A HREF=). Можно купить или найти бесплатную программу анализа структуры сайта. А можно написать самому, если есть желание и немного времени. Так как последний подход имеет вдобавок обучающую ценность, то его и рассмотрим. Мною была написана небольшая программа на Java для формирования отчета о структуре сайтов. Ниже приведен ее код (zip исходного spider.java).
Код программы в Java
/** * 'Spider' - делает отчет о структуре сайтов * @author Andrei Borziak */ import java.awt.*; import java.awt.event.*; import java.io.*; import java.util.*; import java.net.*; public class spider implements ActionListener, WindowListener { //класс для информации о ссылках КомментарииПрограмма запускается командной строкой видаjava spider task_file bWindow bOverride bTraceGet bLogAppend Все параметры являются дополнительными:
Файл для компиляции программы compile.bat имеет вид "C:\Program Files\Java\jdk1.6.0_12\bin\javac.exe" -Xlint:unchecked spider.java
pause
Файл для выполнения программы run.bat имеет вид
"C:\Program Files\Java\jdk1.6.0_12\bin\java.exe" spider
pause
Файл задания task1.tsk имеет вид
weblinks http://www.pvobr.ru/ pvolinks.htm
где 1-ый параметр - команда, 2-й - путь к сайту, 3 - файл отчета.
В данных примерах C:\Program Files\Java\jdk1.6.0_12\bin - путь к директории с java-компилятором; Анализ результатов. Многие функции написаны в расчете на правильный html-код. Если ваши ссылки не видны в отчете - это повод переписать исходный код. Сидит хакер со своей девчонкой в комнате, хакер за компом, девчонка на кресле. Хакер что-то делает, а девочка хочет привлечь его внимание: - А у нас вчера под окнами НЛО завис... Хакер (сердито, не отрываясь от компа): - Надо было UNIX ставить, под "окнами" все виснет... |
В избранное | ||