Последние новости

Просмотр и удаление картинок в таблицах CSV
2014-09-10 11:44 admin

Слияние (объединение) двух CSV файлов (двух таблиц товаров) по ключевым столбцам
2014-09-08 07:42 admin

Парсинг HTML-таблиц в CSV
2014-08-10 13:57 admin
Макросы [HORIZTABLE] и [VERTTABLE] преобразуют код HTML-таблиц сайта в формат данных для макроса [DYNAMICVALUES] (и сами запускают макрос [DYNAMICVALUES]). Поэтому, для вывода названий столбцов в результирующий CSV (при использовании [HORIZTABLE] и [VERTTABLE]) в строку заголовка (верхняя строка в редакторе шаблона вывода) нужно прописать [DYNAMICVALUES]. Макросом шаблона вывода [HORIZTABLE]HTML-код таблицы[/HORIZTABLE] парсятся такие таблицы (“горизонтальные таблицы”, наименования [...]

Автоматический парсинг сразу всех характеристик товаров с автоматическим созданием соответствующих колонок CSV (макрос [DYNAMICVALUES])
2014-08-05 03:31 admin
Подробное описание нового макроса (клик)

Поиск конца обычных границ парсинга в обратном направлении (параметр инверсия)
2014-07-10 17:35 admin
Допустим, имеем следующий HTML-код: … <img src=”URL” class=”BIG”> … И нам нужно спарсить URL только той картинки, которой присвоен class BIG (что стоит после нужного нам URL), зацепившись за " class="BIG". То есть, пойти от начала WEB-документа до " class="BIG" и потом обратно (к началу документа) до src=" и взять код между этими границами – [...]

Распознавание капчи, отправка текста капчи и получение ответных cookies (с использованием WBApp) при парсинге контента
2014-07-04 20:02 admin
Если парсить контент через библиотеку Internet Explorer (DOM) (ctrl+h), то для автоввода капч достаточно лишь прописать в проект WBApp группу макросов [CAPCHA] (смотрите видео распознавание текста капчи с помощью сервиса Antigate на этой странице http://sbfactory.ru/cd/?p=1515). В этом случае, группа макросов [CAPCHA] сама проверяет наличие капчи на странице и устанавливает в Internet Explorer нужные cookies. Но [...]

Использование PHP-скриптов с локального сервера (localhost) для обработки контента при парсинге
2014-06-29 11:39 admin
Техника обработки данных при парсинге контента (во вкладке “контент”) функциями языка PHP: 1) Качаем, устанавливаем и запускаем локальный сервер Denwer 2) Копируем ваши PHP-скрипты для обработки контента при парсинге в папку Z:\denwer\www\denwer (где Z – имя виртуального диска с Denwer) 3) Отправляем POST-данные PHP-скриптам на Денвере из шаблона вывода программы Content Downloader макросом PHP_SCRIPT и [...]

Новый макрос шаблона вывода [CHECKENTRY]
2014-06-28 09:03 admin
Проверка на наличие слов (вхождений) в тексте и совершение определенных действий ([CHECKENTRY(вхождение 1||вхождение 2)]текст[/CHECKENTRY]). Например, у вас есть текст, в котором нужно проверить наличие определенных слов. Если слова в тексте найдены, то макрос выведет этот текст или удалит его, или вообще выведет третий текст. Примеры использования этого замечательного макроса: [CHECKENTRY(55)]55555[/CHECKENTRY] -> выведет текст “55555″, так [...]

Купить проект парсинга телефонных номеров в виде текста с Avito (500 рублей)
2014-06-26 16:40 admin
Требования: – Самая новая версия Content Downloader – Тип лицензии: Content Downloader ULTIMATE http://sbfactory.ru/?p=2713 – Наличие Internet Explorer 11 в вашей системе – 500 рублей и желание парсить номера с Авито =) Специфика проекта: Так как Авито тратит не мало денег на защиту от парсинга номеров телефонов своих клиентов, нам приходится использовать браузер Internet Explorer [...]

External Links Detector (программа для поиска исходящих/внешних ссылок)
2014-06-20 08:35 admin
Скачать/обновить External Links Detector v1.14 от 23.06.2014 (логин и пароль для загрузки вы получаете при покупке) Данная программа предназначена для поиска исходящих (внешних) ссылок с сайта. Думаю, вы знаете, чем они “вредны” и как они могут появляться на страницах ваших любимых сайтов. URL-адреса страниц (для поиска на них исходящих ссылок) вы можете добавлять в программу [...]

Значительно ускоряем процесс парсинга через WBApp и исключаем возможный пропуск данных (ожидание появления определенных элементов на WEB-страницах)
2014-06-20 08:34 admin
[REPEAT] [CLICK][classname][N]0[/N][FULL]:pd_price [IFNOTCLICKED] [WAIT]:200 [/REPEAT] [/IFNOTCLICKED]