Говоря о сборе семантического ядра для сайта, мы используем термины «парсинг», «парсить». Что это значит? Попробую объяснить простыми словами, что это такое.
Парсинг – это один из способов автоматического сбора и обработки информации из Всемирной сети.
При парсинге проводится лексический анализ собранной информации путем сравнения найденных текстов с определенными образцами, то есть по некоторому шаблону или, как еще говорят, по маске.
Обработанная таким образом информация структурируется по заданным правилам. Аналогией парсинга можно считать работу со словарем. Мы парсим словарь, сравнивая его текст с нужным нам словом, а найдя его, узнаем перевод.
Активнее всего «парсят» всемирную паутину поисковые сервис ы. Их программы парсеры, которые называют поисковыми роботами или пауками, непрерывно просматривают и анализируют сайты, пополняя и обновляя свои базы данных.
Парсинг используется для наполнения сайтов контентом. Активно парсингом занимаются владельцы интернет-магазинов для заполнения описаний товаров, их характеристик, цен. Парсинг необходим для быстрого обновления новостных сайтов и других сайтов, содержащих информацию, которая быстро и постоянно изменяется.
Подробнее о парсинге в статье на блоге >>>
Это интересно
0
|
|||

Последние откомментированные темы:
-
Как раскрутить канал в Telegram
(1)
YaBlogo
,
28.01.2021
-
Криптовалюта — что это такое простыми словами, какие из крипто-валют самые популярные и как можно на них зара
(1)
VadimLesnikov
,
18.06.2018
-
ESET Online Scanner для проверки компьютера на вирусы онлайн
(1)
КОЛЯН
,
30.09.2016
-
Программа полиглот
(1)
Krechet51
,
15.08.2016
-
Как сделать gif анимацию (гиф картинку) из видео за 1 минуту?
(1)
lubovzubareva.ru
,
28.06.2016
-
Как осуществлять контроль сотовых телефонов на Android
(3)
ar_kolosova
,
17.02.2016
-
ПРОГРАММА – ВЫКОРЧЁВЫВАТЕЛЬ ПНЕЙ!
(2)
YanZbarik
,
03.11.2015
-
Как передать файл через uTorrent без использования торрент трекера
(1)
КОЛЯН
,
16.02.2015
-
Плохие комментарии. Всё гораздо хуже, чем можно себе представить
(1)
Петрозаводчанка
,
07.12.2014
20251120194959