Отправляет email-рассылки с помощью сервиса Sendsay
  Все выпуски  

Сбор данных с интернета : Теория и Решения. Human Emulator и объекты для работы с окнами.


В этой статье я рассмотрю последнюю категорию объектов Human Emulator'a, а затем перейду к созданию сборщиков использующих Хуман Эмулятор для сбора ключевых слов с различных веб источников. Итак категория PHP объектов WINDOW :

скриншот справки по категории Window для PHP объектов Human Emulator

Как видим здесь собраны объекты для управления окнами как HumanEmulator'a так и всей системы в целом. Условно можно их разбить на несколько подкатегорий:

Управление окнами и работой Human Emulator'a :

  • app– управление работой приложения. Этот объект позволяет управлять внешним видом самого приложения и содержит следующие возможности :
    • вызов различных диалогов-вопросов для ввода исходных данных в скрипт
    • диалоги ручного распознавания каптчи для ввода капчи в скрипт без использования сервисов распознания каптч
    • управление видимыми параметрами эмулятора (размер окна хумана, позиция, полноэкранный режим, управление треем и т.п)
    • управление ходом выполнения (команды паузы,выгрузки и рестарта )
    • получение внутренней информации (текущий порт, код инсталяции, версия, путь к скрипты и программе и т.п)
    • получение внешней информации (например получить файл с компьютера на котором работает хуман )
    • запуск и останов внешних программ (запуск bat файла,другого PHP скрипта, внешней программы, остановка процесса)
    • управление прогрессом в статус баре (для того чтобы видеть ход выполнения скрипта)
  • debug– управление отладкой скриптов. Объект для работы с панелью отладки и различными отладочными парметрами, содержит:
    • работу с отладочной панелью (работа с закладками их содержимым на отладочной панели)
    • текстовые нотификации (диалоговое окно и всплывающее уведомление - для сообщений о работе скрипта)
    • информация о памяти и ресурсах, занимаемых программой, а также функцию оптимизации памяти
    • вспомогательные функции (информация о путях к текущему скрипту и отладочные хуки)
Получение и установка информации системы :
  • windows– управление оболочкой Windows. Содержит функции получения и задания системной информации.
    • получение информации о Windows (имя, версия, билд, сервис пак, платформа)
    • получение информации о железе и компе (название процессора, имя пользователя и название компьютера)
    • получение параметров разрешения экрана
    • установку параметров разрешения экрана
Управление любыми внешними программами :
  • window– работа с окнами других приложений. Этот объект позволяет выполнять операции с другими программами, запущенными на том компе что и хуман:
    • получает информацию по всем открытым окнам в системе
    • получает информацию по всем дочерним окнам к данному окну
    • выполняет различные стандартные диалоги встроенного браузера (загрузка,выгрузка,ввод данных)
    • получает прямые интерфейсы к окнам с заданными параметрами
    • получает объект-список прямых к интерфейсов к окнам с заданными параметрами
  • windowinterface– прямой интерфейс к окну Windows. Данный объект по сути связь между пхп и реальным окнам в системе в которой запущен хуман эмулятор:
    • управление окном (задание текста,видимости, позиции, размеров и т.д)
    • получение других окон (получает интерфейсы и списки интерфейсов дочерних, родительских, следующих и предыдущих и т.д окон )
    • получение свойств окна (текст,номер, стиль, класс,процесс ID и т.д)
    • получение расположения и размеров окна
    • проверка состояния окна (существует, видимо, дочернее,с фокусом и т.д)
    • эмуляция мыши в окне (движение, щелчки, нажатия и отжатия и т.п.)
    • эмуляция клавиатуры в окне (ввод строк, нажатие и отжатие клавиш,смена языка ввода и т.п)
  • windowinterfaces– список прямых интерфейсов к окнамWindows. Позволяет выполнять операции сразу с несколькими окнами.
    • функции получения отдельных окон и работа с ним как с отдельным окном
    • позволяет вызвать весь функционал что есть для каждого окна за один раз, получив результат выполнения в массив
Выводы:

Таким образом на основании пяти предыдущих статей, опубликованных на x-datas.com мы видим что Human Emulator - идеально подходит для задач сбора данных с интернета и позволяет в режиме эмуляции браузера ходить по страницам сайта и получать то что нам нужно с них. Широкие возможности во всех смыслах позволяют нам сделать сборщики данных (и не только ) практически с любых интернет ресурсов. Чем мы и займемся в следующих статьях. Будем все также колупать тему сбора ключевых слов. Пока я писал эти статьи мне удалось отладить сборщик подсказок ключевых слов с Yandex.Wordstat. В следующей статье я опубликую его с описанием и теми данными что успел собрать.


В избранное