Отправляет email-рассылки с помощью сервиса Sendsay

Технологии анализа данных

  Все выпуски  

Технологии анализа данных


Технологии анализа данных Facebook ВКонтакте Twitter Youtube Slideshare

Технологии анализа данных

27

июня

IV конференция преподавателей вузов
Блоги
Практика использования Deductor в РГАУ-МСХА

Продолжение цикла интервью с наиболее активными участниками академической программы BaseGroup Labs.

basegroup.learn
25 апреля 2017
Блоги
Быстродействие Deductor: файлы данных (часть 2)

Этот пост является продолжением предыдущего материала "Быстродействие Deductor: файлы данных (часть 1)". Он содержит все материалы, полученные в результате тестирования, а также самое интересное - итоговые выводы и рекомендации.

basegroup.support
13 апреля 2017
Блоги
Конференция для преподавателей в 2017 году

BaseGroup Labs приглашает на традиционную летнюю конференцию преподавателей вузов. Что мы планируем показать и рассказать вам в этом году?

basegroup.learn
12 апреля 2017
Пресс-релизы
Новый вуз-партнер: МГУ имени М. В. Ломоносова

В рамках академической программы Факультет государственного управления Московского Государственного Университета имени М. В. Ломоносова будет использовать аналитическую платформу Deductor Academic в учебном курсе "Информационные технологии"...

28 марта 2017
Блоги
Быстродействие Deductor: файлы данных (часть 1)

В аналитической платформе Deductor реализовано множество механизмов извлечения данных из файловых источников. Если ограничений по формату хранения данных на предприятии нет, возникают вопрос: «Есть ли разница между ними?». Этим материалом мы постарались ответить на поставленный и некоторые другие вопросы.

basegroup.support
21 марта 2017
Пресс-релизы
«Яшма Золото»: оптимизация запасов в ювелирных салонах

Решение на базе аналитической платформы Deductor помогло компании формализовать существующие алгоритмы анализа данных, добавив возможность формировать рекомендации по перераспределению на 9 уровнях агрегации товаров, а также значительно расширить перечень учитываемых ограничений.

13 марта 2017
Последние вопросы на форуме
Практика анализа, Предобработка данных, Нечеткая логика
Как определить, количество вхождений различных дат в диапазон дат

Здравствуйте! Подскажите, пожалуйста, как решить следующую задачу: Есть начальная и конечная даты. Есть справочник нерабочих дней. Необходимо определить, сколько нерабочих дней пришлось на период.

Дарья Корчикова

21 апреля 2017

3 комментария
Практика анализа
Ассоциативные правила

Подскажите, пожалуйста, где можно взять исходные наборы данных для тренировки поиска ассоциативных правил, НЕ СВЯЗАННЫХ С ТОРГОВЛЕЙ. Или хотя бы где взять примеры поиска правил, не связанных с торговлей.

nidef

17 апреля 2017

1 комментарий
Нечеткая логика, Практика анализа
рекуррентная НС для распознавания речи

Доброго времени суток. Стоит задача написать классификатор для кластеризации языка голоса. Языка всего 2. Английский и русский. Хотел спросить правильно ли я понял проблему и правильно ли двигаюсь в реализации. В качестве признаков использую 13 MFCC + 13 deriv MFCC + 13 deriv deriv MFCC. В качестве...

Дмитрий Бегунов

17 апреля 2017

0 комментариев
Практика анализа, Предобработка данных
Объединение событий по пересечению времени на примере лога звонков

Если есть набор записей ID , по сути событий или вызовов для каждого ID есть Номер Абонента1 есть Номер Абонента2 время начала вызова и время окончания вызова нужно объединить все связанные вызовы (переключения, параллельные вызовы) т.к. идентификатора нет. то есть нужно по всему массиву ID найти...

Dudin.Sergey

14 апреля 2017

0 комментариев
Предобработка данных, Практика анализа, Визуализация, Data Warehouse, Интеграция
Не могу работать с базой данных

Не подключается база данных созданная в IBExpert, с добавлением метаданных Deductor. С чем это связано?

khaich

11 апреля 2017

2 комментария
Практика анализа, Предобработка данных, Методология, OLAP, Визуализация
после нажатия на "создать новый проект нечего не происходит"

помогите! проблема с deductor_5_0... после нажатия на "создать новый проект нечего не происходит" в чем проблема? кто подскажет

Алек

10 апреля 2017

4 комментария
Практика анализа, Data Mining
Нейронные сети

Необходимо построить нейронную сеть в Statistica для прогноза. Предполагается нелинейная зависимость. Сеть планируется записать в виде алгоритма (уравнения) в ПО. Прочитал кучу статей, понял, что нужно умножить вес нейрона на вход+вес смещенного нейрона и потом вычислить функцию активации, и так...

Student

9 апреля 2017

0 комментариев
Data Mining
Модель поведенческого скоринга

Нет ли у вас для примера модели поведенческого скоринга для микрофинансовых органзсаций

Abrukovs

6 апреля 2017

1 комментарий
Методология, Интеграция
Экспорт узлов и правил из Deductor

Добрый день! Возможно вопрос глупый, но очень надо. Возможно ли каким то образом экспортировать все ветви проверки из дедактора с правилами?

rogozian

30 марта 2017

4 комментария
Интеграция
Viewer не видит ключ

Добрый день, установил Dedactor 5.3 но при запуске показывает что сервер не запущен. Я могу зайти в админку сервера и видеть ключ и количество лицензий на нём, в файле gnclient.ini на вэбинтерфейсе IP_NAME - сервер на котором установлен ключ. В логах при попытке запустить Viewer пишет Connection...

Николай Стародубцев

22 марта 2017

2 комментария
Big Data, Предобработка данных, Text Mining
Классификация текстов. Может ли Ваш продукт такое...

Добрый день! У нас стоит такая задача: Классифицировать тексты с сайтов. Список категорий заранее неизвестен и может постоянно увеличиваться. Есть такие данные по каждому сайту: 1. URL, где возможно уже содержится подсказка к какой категории лучше отнести этот ресурс, например, rentcars.com можно...

Андрей Тарасов

14 марта 2017

0 комментариев
Практика анализа, Data Mining
Вопрос по валидации модели на новых данных

У меня следующий вопрос, возможно идиотский: 1) Есть обученная модель (логистическая регрессия, если что), в ее составе есть поле "target", которое собственно и есть метка класса 2) Есть валидационная выборка где данное поле ("target") отсутствует - и которое нам необходимо предсказать Вопрос: как...

komockye

1 марта 2017

2 комментария
Data Mining, Big Data, Нечеткая логика, Практика анализа
Анализ 2х исторических данных (временных рядов) и определение зависимости

Доброго дня. Подскажите есть ли в Дедукторе возможность проанализировать две исторические величины (два временных ряда) и найти зависимость одного от другого. Например история индекса ВВП и фондового индекса. Оба имеют тренд (тенденцию). Какие методы лучше использовать для выявления зависимости...

alexstox

26 февраля 2017

1 комментарий
Практика анализа, Data Warehouse
Ошибка: Column unknown

Здравствуйте. Есть идеи, почему это могло возникнуть? СООБЩЕНИЕ: Загрузка данных Измерения в Хранилище данных Ошибка: Ошибка подготовки (prepare) SQL-оператора: Dynamic SQL Error SQL error code = -206 Column unknown a0 At line 2, column 1 Text SQL: SELECT ID, "a0" FROM "GR_ID" WHERE "GR_ID" = :...

kkdamrcu

23 февраля 2017

1 комментарий
Интеграция
Экспорт в базу в пакетной обработке

Добрый день! При ручном запуске в базу экспортируется без проблем. При пакетной обработке экспорт не выполняется. В чем может быть причина?

Elena Belyaevskih

9 февраля 2017

2 комментария

Последние обсуждения на сайте

Как определить, количество вхождений различных дат в диапазон дат

Дарья, пришлите пожалуйста набор данных на help@basegroup.ru

Юрий Ясько

21 апреля 2017

Не могу работать с базой данных

Если к БД подключен Deductor без использования Firebird Server, то этот файл БД заблокирован на монопольный доступ. Без текста ошибки сказать что-то конкретное очень сложно.

maxsv

19 апреля 2017

после нажатия на "создать новый проект нечего не происходит"

В Deductor 5.0 возможен только импорт файла с расширением .xls. Кроме этого рекомендуется выбирать имя нужного листа для импорта из выпадающего списка, а не писать его вручную.

Василий Майоров

19 апреля 2017

Ассоциативные правила

Добрый день! Открытые наборы данных Вы можете найти по ссылке: https://basegroup.ru/community/knowledge/open-data-sets

Василий Майоров

19 апреля 2017

EМ — масштабируемый алгоритм кластеризации

Спасибо за комментарии. 1. Совершенно верно. Ковариационная матрица строится для каждого класса. Внесли соответствующие правки, а также небольшие исправления в псевдокод. 2. Это может быть связано с тем, что в некоторых случаях ковариационная матрица оказывается вырожденной. Как правило,...

Andrey.Muntanion

17 апреля 2017

Модель поведенческого скоринга

Здравствуйте. По данному вопросу (а также вопросам схожего характера) просим обращаться по адресу sale@basegroup.ru .

Никита Докукин

6 апреля 2017

Viewer не видит ключ

Наличие сетевых лицензий можно посмотреть в web-интерфейсе сервера ключей Guardant Server https://basegroup.ru/community/knowledge/where-license-number последний раздел "Из web-интерфейса Guardant Net", на картинке: DStudioProf -2 лицензии, DViewerProf -1 лицензия.

smaximov

24 марта 2017

Переменные: применение при импорте из базы данных

Если в переменную требуется ввод только значения года, то можно использовать следующий запрос: SELECT * FROM "VAR1" V WHERE year(V."COL1")>=:DATE_VAR

Никита Докукин

13 марта 2017

Поиск последовательных шаблонов. Часть 1.

Подскажите, есть ли алгоритм для поиска по таким база непрерывной последовательности фиксированной длины? К примеру мне нужно найти самые популярные непрерывные правила длинной 3 чека. Из каждого чека в правиле может участвовать только один товар.

Andrey Dudin

2 марта 2017

Вопрос по валидации модели на новых данных

Здравствуйте! Для решения данной проблемы необходимо в валидационную выборку обработчиком "Калькулятор" добавить пустое поле "target". После этого обработчк "Скрипт" перестанет "ругаться".

Никита Докукин

1 марта 2017

Анализ 2х исторических данных (временных рядов) и определение зависимости

Добрый день. Кроме упомянутой Вами "Нейросети" в Deductor нет стандартных средств для решения Ваших задач.

Василий Майоров

27 февраля 2017

Ошибка: Column unknown

Добрый день. Попробуйте убрать галочку "Обрамлять имена таблиц". Если есть возможность, пришлите своё хранилище данных на адрес: support@basegroup.ru

Василий Майоров

27 февраля 2017

Деревья решений — C4.5 математический аппарат. Часть 1

Это известная проблема переобучения - http://www.machinelearning.ru/wiki/index.php?title=%D0%9F%D0%B5%D1%80%D0... .

Алексей Арустамов

14 февраля 2017

Это интересно

26 апреля 2017

Медиа будущего по-китайски

Toutiao угадывает интересы аудитории и стоит $11 млрд. У сервиса с аудиторией 700 млн человек нет редакции, его штат — 1000 программистов.

24 апреля 2017

Аудит машинного обучения в эпоху больших данных

Как компании могут быть уверены, что используемые ими алгоритмы обеспечивают предоставление подразумеваемого сервиса, а не реализуют не соответствующие их намерениям политики?

20 апреля 2017

21 апреля стартует Machine Learning Boot Camp IV

Cостязание по машинному обучению и анализу данных от Mail.Ru Group проходит онлайн в течение одного месяца, и необходимо решить всего лишь одну задачу. На портале чемпионата вы можете прочитать обучающую статью для новичков, а также потренироваться в решении предыдущих конкурсов — все они открыты в режиме песочницы.

19 апреля 2017

Нахождение связей в документах на разных языках

Вы бы хотели иметь возможность находить близкие вашим интересам научные работы независимо от предметной области или языка и с большей эффективностью, чем можно было вообразить? Тогда вам поможет поисковая система Omnity, использующая смесь разных техник.

18 апреля 2017

Разработчики ПО готовы отказаться от программирования?

Разработчики считают, что инструменты написания приложений почти без программирования значительно повышают производительность труда. Если инструменты быстрой разработки приложений (RAD) существуют уже на протяжении десятилетий, появление решений, позволяющих почти или вовсе не использовать программирование, представляет потенциально многообещающую новую фазу в развитии RAD.

11 апреля 2017

Gartner: для «Индустрии 4.0» остро не хватает алгоритмов

Разработчики аналитических пакетов уже начали создавать торговые площадки программных компонентов — в том числе, алгоритмов анализа. К 2020 году доля алгоритмов, приобретенных у независимых поставщиков, вырастет до 30%.

10 апреля 2017

Открыт набор в Школу анализа данных 2017

В Школе, основанной Яндексом в сентябре 2007 года, преподают машинное обучение, компьютерное зрение, анализ текстов на естественном языке и другие направления современных компьютерных наук. Два года студенты изучают предметы, которые обычно не входят в университетские программы, хотя пользуются огромным спросом в науке и разных отраслях, где уже применяются наукоёмкие информационные технологии.

7 апреля 2017

Машинное обучение придает импульс развитию предсказательной аналитики

Предсказательная аналитика становится все более важным инструментом для компаний, стремящихся лучше использовать все данные, которые они собирают. Машинное обучение может придать дополнительный импульс развитию аналитики, предоставив в распоряжение предприятий еще более мощный ресурс данных.

6 апреля 2017

LinkedIn: машинное обучение — наш кислород, но без человека не обойтись

Каким образом алгоритмы на основе обработки данных и машинного обучения используются для контроля содержания новостных лент и распространения информации? Насколько этот процесс автоматизирован, какую его часть мы способны понять и проконтролировать и в каком направлении идет его развитие?

3 апреля 2017

Российские операторы займутся регулированием Big Data в обход государства

Крупнейшие российские операторы связи и интернет-компании, такие как «Ростелеком», «МегаФон», МТС, «ВымпелКом», Mail.Ru Group и «Яндекс», намерены создать саморегулируемую организацию по Big Data. Компании считают, что контроль над этой отраслью нельзя отдавать государству

30 марта 2017

Роджер Шанк — об IBM Watson

На Geektimes опубликован перевод статьи Роджера Шанка о «когнитивных вычислениях» в IBM. «Скажу прямо: Watson – это обман. Я не утверждаю, что программа не может обрабатывать слова, и кому-то это даже может приносить пользу. Но её реклама обманывает вас.»

28 марта 2017

«Математика — моя жизнь, и от нее никуда не деться»

Математик Владимир Протасов на втором курсе бросил учебу в университете. Правда, через некоторое время восстановился и с тех пор занимается наукой. В прошлом году Протасов в 46 лет стал членом-корреспондентом РАН. Он рассказал новостной службе ВШЭ о бесконечной красоте математики и о том, как она делает реальностью то, что раньше считалось фантастикой.

27 марта 2017

Искусственный интеллект в нашей жизни: пять направлений

Менеджер по работе с сообществом проекта OpenSource.com Рикки Эндсли перечисляет в опубликованной на одноимённом сайте статье несколько направлений развития искусственного интеллекта, которые так или иначе уже влияют на жизнь всех пользователей. По её мнению, это само по себе свидетельствует о зрелости соответствующих технологий.

23 марта 2017

Большие Данные с позиции научного скептицизма

Являются ли Большие Данные панацеей, а если да – то от чего? Сколько в них моды, а сколько – науки? И почему они не работают в реальном секторе? Действительно ли будущее за «персонализацией» сервисов?

22 марта 2017

Абелевскую премию получил французский математик Ив Мейер за теорию вейвлетов

В целом, вклад французского ученого очень велик. На сайте Абелевской премии говорится, что премия присуждена человеку, который долгое время занимает лидирующие позиции в разработке теории вейвлетов, которая находится на стыке математики и информационных технологий. Ему удалось создать теорию анализа сложных сигналов, которая имеет важнейшее значение для ИТ.

19 марта 2017

Взаимопонимание специалистов — ключевая проблема искусственного интеллекта

Дефицит предметных знаний у дата-сайнтистов приводит к тому, что технологии нейросетей все больше проскакивают мимо реальных задач и заворачивают в сферу развлечений. Появляются огромное количество аттракционов типа „Маскарада“ или „Призмы“.

18 марта 2017

Расходы на большие данные и бизнес-аналитику будут ежегодно расти на 11,9%

Коммерческие закупки аппаратного и программного обеспечения и услуг, связанных с BDA, будут поддерживать совокупный среднегодовой темп роста на уровне 11,9% до 2020 года, когда выручка отрасли составит более 210 млрд долларов, пишет IDC.

17 марта 2017

Машинное обучение, как кибероружие

«Есть опасения, что в системах обработки больших данных злоумышленник сможет взять под контроль достаточно большой объем этих данных, чтобы ввести в заблуждение пользователей системы», — говорит доктор Дебора Фринке, глава Исследовательской дирекции Управления национальной безопасности США и Центральной службы безопасности (NSA/CSS).

13 марта 2017

Facebook знает про ваши отношения за 100 дней до их старта

По статистике Facebook можно отследить начало романтических отношений еще до того, как они официально начнутся. В 2014 году команда дата-сайентистов Facebook опубликовала результаты своего исследования на эту тему.

10 марта 2017

Как банки решают, что вам не надо давать кредит

Банки часто оправдывают отказы по кредитам скоринговой системой. По каким критериям банки оценивают скоринговые системы, способные разрушить ваши планы на жизнь? Можно ли обмануть «кредитный детектор»? Корреспондент Банки.ру попыталась проникнуть в некоторые тайны скоринга.

 
Мы в социальных сетях и сервисах:
Facebook ВКонтакте Twitter Youtube Slideshare
© 2017 BaseGroup Labs, ООО «Аналитические технологии»
basegroup.ru

В избранное