Популярные группы

← Предыдущая статья Следующая статья →

Что такое сильный искусственный интеллект

Публикации российских ученых составляют, по самым оптимистичным оценкам, менее 5% от всех работ по изучению ИИ, сообщил «Газете.Ru» руководитель исследовательской группы «ИИ в промышленности» Института искусственного интеллекта AIRI Илья Макаров, с которым удалось побеседовать в рамках Летней школы AIRI на федеральной территории «Сириус. По его словам, в России можно наблюдать технологическое отставание в области ИИ. О том, как его преодолевают, о таких фундаментальных проблемах искусственного интеллекта, как «забывание» и «обобщаемость», а также о малом количестве русскоязычных обучающих датасетов и проблемах подготовки кадров — в материале «Газеты.Ru». — Есть такое понятие, как сильный и слабый ИИ. Чем они отличаются друг от друга?

— Сильного ИИ сейчас не существует, но на уровне концепции подразумевается, что он способен к самообучению, определению для себя целей и выбору средств для их достижения. Подразумевается, что сильный ИИ должен по когнитивным способностям быть на уровне человека, а с учетом технологических и вычислительных возможностей, даже превосходить его.

Текущий ИИ в основном решает конкретные задачи, все разноплановые. У вас есть в телефоне «умный» поиск, который по картинке с телефона может найти предмет, похожий на сумку, которую вы видите на экране смартфона своей подруги. Или у вас есть голосовой ассистент. Это тоже пример слабого ИИ.

— В чем сложность создания сильного ИИ?

— Многие говорят, что занимаются созданием сильного ИИ, но фундаментальные проблемы остаются нерешенными. Большинство моделей искусственного интеллекта основаны на нейронных сетях, у которых есть целый набор проблем.

Например, так называемое «катастрофическое забывание». ИИ забывают примеры, на которых учатся, не могут в точности выдать тот же самый результат. Есть еще проблема плохой обобщающей способности — нейросеть, обученная на одном датасете картинок, не может хорошо адаптироваться к другому датасету картинок, снятому в других условиях.

Представьте, у вас есть две функции, которые нужно оптимизировать. Вы хотите, например, чтобы объекты хорошо классифицировались, и еще чтобы они хорошо локализовались на картинке. Как обучать такую модель? Выбирая из двух зол, вы выбираете: «Я хочу, чтобы в среднем в сумме они давали минимальную ошибку». Но идеального баланса не существует, приходится выбирать и пока это делает человек.

Кроме того, существующие архитектуры и методы решения не позволяют научить ИИ ставить себе новые цели, достигать их и оценивать качество результата. Пока то, что мы реально можем делать — это самый слабый ИИ, который будет имитировать человека, может быть, даже что-то делать лучше, например, играть в шахматы.

Еще один момент – ограниченный доступ к высокопроизводительным вычислительным ресурсам, отсутствие квантового компьютера и ограничения по принципам работы суперкомпьютеров. Для понимания, стоимость обучения полноценной модели, которая может обыграть человека в StarCraft, где-то $30 млн. Как вы понимаете, обычный исследователь не в состоянии получить доступ к обучению такой модели, а в случае больших языковых моделей, то даже и к запуску обученной модели из открытых источников.

— Из чего складывается такая стоимость обучения?

— Это ресурсы на облачные вычисления. Не только железо, но и необходимость построить кластер, дополнительное программное обеспечение, которое позволяет распараллелить вычисления, сделать их эффективными.

Последняя модель, которую сейчас китайцы хотят выложить, насколько я помню, с более чем 100 трлн параметров — это астрономическая сумма для обучения нейронных сетей на 90 тыс. видеокарт, и писалось отдельное программное обеспечение, чтобы просто наладить весь этот комплекс кластеров. Это требует огромных вложений ресурсов, требует возможности производить процессоры, которые адаптируются под обучение нейронных сетей, и иметь еще навыки для того, чтобы это все связывать в единое программное обеспечение, которое интегрируется современными моделями.

— Сколько примерно гигабайт данных нужно, чтобы обучить самую простую нейросеть?

— Обычно измеряются данные не в гигабайтах, а в количествах тех же изображений или сэмплов для обучения. Например, чтобы распознавать десять цифр рукописных, нужно очень мало данных. В целом 10 рукописных цифр можно распознать на 1000 изображений.

В большинстве случаев подразумевается, что для того, чтобы нейросеть работала нормально, вам нужно иметь сбалансированную выборку данных, и чем они вариативнее, тем лучше.

Например, мы хотим, чтобы нейросеть определяла по губам, что я говорю и как. Тогда нам нужно большое количество данных с условиями освещения. А если я буду в очках, что произойдет? Если нейросеть никогда меня в очках не видела, она эмоции, которые я передаю, не распознает — ей неоткуда взять эту информацию, соответственно, мы не можем гарантировать, что она будет правильно работать.

— Много ли существует русскоязычных датасетов?

— Их гораздо меньше, чем на английском.

Все же основные публикации сейчас делаются в англоязычных странах. Работы российских ученых составляют, по самым оптимистичным оценкам, меньше 5% от мирового числа публикаций в ведущих конференциях и журналах по искусственному интеллекту.

На практике я бы сказал, что количество русскоязычных датасетов тоже менее 5%.

— В связи с недостатком русскоязычных датасетов, возникают ли проблемы с обучением нейросетей в России?

— Это не проблема, это называется технологическое отставание. Недавно исследовательские группы внутри Сбера и «Яндекса» выложили русскоязычные языковые модели, и это существенный шаг вперед, потому что до этого у нас были только большие англоязычные модели, приходилось их дообучать на русский язык.

— Вы работали над моделью, которая предсказала развитие персонажей в серии книг о «Звездных войнах». Можете о ней рассказать?

— Да, была такая статья. Мы даже не предсказывали, а больше анализировали книги. Мне нравятся «Звездные войны», поэтому я, кажется, прочитал все книжки, которые переводились на русский. Что меня в свое время поразило — все сценарии написаны более или менее под копирку.

Мы научились извлекать граф персонажей — самих персонажей из книги, то как они встречаются в книге, как друг с другом взаимодействуют, насколько часто. Дальше то же самое делалось относительно локаций — привязывали действия персонажей к локации.

Построив такой мультимодальный граф, можно извлекать статистику и кластеризовывать книги. В целом, это некоторый задел на то, что нейросеть может целиком создать сценарий для фильма или книгу, не без помощи человека, конечно.

Генерация сюжетов, произведений для фильмов — за этим тоже будущее. Я не разделяю мнение общественности, что развитие ИИ не приведет к изменению ситуации на рынке труда. Творческие профессии в каком-то смысле будут вынуждены трансформироваться.

Например, уже есть нейросеть, которая может в стиле Ван Гога раскрасить вашу собачку. То же самое будет происходить с литературой. Ее и так слишком много, люди перестают все читать, очень большая конкуренция в этой области. Когда туда придет компьютер, люди должны будут учиться работать с ним и пользоваться им как инструментом.

Недавно группа исследователей AGI NLP из SberDevices под руководством Татьяны Шавриной приняла участие в создании книги, в которой половина рассказов написана человеком, а половина - нейросетью. При этом люди, читая книгу, путают человека и машину, не могут отличить, кто писал тот или иной рассказ. Грубо говоря, нейросеть проходит тест Тьюринга — неотличимость от человека. Это прекрасно для разработчиков, и потенциально – вызов для авторов.

— Мы сейчас говорим о слабом интеллекте? Сильный искусственный интеллект тогда сможет заменить Стивена Кинга?

— В целом да. Слабый тоже может заменить Стивена Кинга. Что он не сможет сделать, это создать какую-то личность, но он сможет сымитировать его стиль изложения. Создать бренд для цифрового аватара – то, чем сейчас активно занимаются специалисты в цифровом маркетинге.

— Какими исследованиями вы еще занимаетесь?

— У нас есть несколько проектов, которые посвящены различным аспектам использования ИИ в промышленности. Наверное, самый интересный проект с точки зрения промышленности, это цифровые двойники. Я расскажу про два конкретных кейса, на которых мы сфокусированы.

Первый из них — поиск и предсказание разладок в химических процессах на заводе по переработке сырья. Есть огромное количество сенсоров, которые описывают процессы производства. Это датчики температуры, давления и им подобные. Имея представление о нормальном производственном процессе, можно предсказывать аномальные состояния, размечать эти аномальные состояния, предсказывать их чисто по сенсорным данным.

В некоторых случаях это можно делать даже предиктивно — ты можешь предсказывать, что через столько-то тактов измерений у тебя произойдет отклонение в сторону. Вот это и делает наш ИИ.

Второй кейс — «светофор», или индикатор здоровья оборудования. У оборудования есть износ, и подразумевается, что оборудование какое-то время должно работать нормально, а потом может начать барахлить или отклоняться от плановых показателей работы. Формулируется задача — оценивать состояние этого оборудования, его «здоровье».

Зеленая зона — все хорошо, прибор работает в штатном режиме. Желтая — есть некоторые тренды в сторону аномального поведения, возможно, прибор нужно остановить, разобрать, смазать маслом, провести техническое обслуживание, и дальше он вернется в зеленую зону. Красная зона, когда есть явное предсказание того, что произойдет поломка или явное отклонение в производительности, например, снижение на 20% скорости относительно номинальной или заданной. Все эти показатели можно предсказывать по данным оборудования, которые собираются с различных сенсоров.

Если вы видели пульты управления сложными технологическими стеками, вы понимаете, что там огромное количество индикаторов, кнопок. Я могу только восхищаться людьми, которые работают в таких центрах управления, но нужно понимать, что если вы им позволите фокусировать внимание на реальных проблемах, будете объяснять, что происходит, они будут принимать решения более эффективно. От этого выиграет и компания, и разработчики ИИ порадуются тому, что наконец искусственный интеллект служит во благо промышленности.

— Эти две модели можно адаптировать под любой вид производства, или они нацелены только на какой-то конкретный?

— Да, под любое производство, где есть сенсоры, которые описывают состояние процесса и которых достаточно для моделирования. Если будет только датчик температуры, то мы мало что сможем сделать. Но в целом этот подход универсальный. Он требует донастройки в каждом конкретном кейсе, когда мы говорим о внедрении, но все-таки это универсальные методы.

— Сколько примерно будет стоить внедрение такого ИИ на производство?

— Мы как институт являемся некоммерческой организацией, занимаемся в большей степени исследованиями и некоммерческим консалтингом внедрения. Если говорить о внешнем опыте, обычно проекты по внедрению и тестированию систем могут стоить от нескольких десятков миллионов рублей до существенно больших сумм, когда рассматривается полный цикл интеграции.

— Что вы скажете о наличии квалифицированных кадров в России? Много ли дата-сайентистов?

— В целом, университетское образование даже в большинстве ведущих вузов отстает от темпов, которыми нужно обучать студентов, чтобы они могли работать хотя бы не на начальных позициях. Студент на выпуске не только не готов и не умеет писать код в продакшене, но еще по многим программам отстает от бурного развития науки.

Сейчас время, когда по машинному обучению невозможно привести учебник, прочитав который, как в школе, выучив какой-то материал, ты можешь считаться специалистом. Тебе нужно постоянно читать статьи, постоянно совершенствоваться, чтобы быть в тренде. Если ты год ничего не делал, ты морально устарел, и твои навыки и умения не котируются на рынке.

В этом плане индустриальные академии, которые запускают крупные компании, готовят специалистов, которые могут работать сразу после выпуска, у которых есть практические и теоретические навыки. На базе вуза с фиксированной программой, редкой аккредитации и медленным процессом внесения изменений в образовательную программу, это сделать практически нереально. В основном все делается на личном энтузиазме отдельных руководителей и преподавателей.

— Я правильно понимаю, что мало того, что у нас в принципе программ, которые готовят таких специалистов, мало, так еще выпускников из вузов нужно доучивать?

— Компании хотят брать готовых к работе людей, и часто они просто делают выбор в пользу тех, у кого есть опыт, кто самостоятельно изучал, больше делал.

Человек, который отлично отучился в вузе, скорее всего, без стажировки, без начального опыта не сможет попасть на хорошую позицию. Я бы не говорил, что совсем все плохо, но недостатки есть, каждому специалисту нужно с чего-то начинать.

На Летнюю школу по ИИ, которую мы проводим для студентов и аспирантов, подало заявки более 900 человек со всей страны. Молодежь стремится к развитию своих умений и хочет быть конкурентной как можно скорее. Этому и должны способствовать ведущие образовательные и научные центры.

Версия для печати

Из выпуска от 25-07-2022 рассылки Газета.Ru - Первая полоса

Автор:

Газета.Ru

Комментарии

Subscribe. Авто и компьютеры Подписаться | В избранное

Комментарии временно отключены

Ранее в разделе

Самое популярное в разделе

{#template MAIN} <div id="loginForm" style="display:none;" class="subscriberu_popup"> <div class="popup_register"> {#include js_tmpl_auth_reg_tab} {#if $P.login_register_tab == 1} <form class="authentication-form" method="post" action="/MEMBERLOGIN_authen_cred"> <dl class="rg_block_options"> <dt id="js_tap_panel_auth"> <h1>Войти на сайт</h1> {* {#include js_tmpl_auth_reg_button} *} {#include js_tmpl_auth_reg_action} <hr class="logreg_line noPhones"> <div class="logreg_descr noPhones"><p>{#include js_tmpl_auth_reg_descr} </p></div> <div class="logreg_advice noPhones"> Если вы еще не с нами, то начните с <a href="#" onclick="rgNav('js_tab_reg');return false;" class="dashed" data-func="registr">регистрации</a> </div> <br><br> <a class="dashed auth-enter" href="/manage/author/"><b>Вход для авторов</b></a> </dt> </dl> </form> {#/if} {#if $P.login_register_tab == 2} <div class="rg_block_options"> <div id="js_tap_panel_auth"> <h1>Регистрация</h1> <div class="social_reg"> {* <div class="rg_description">{#include js_tmpl_soc_auth_reg_descr}</div> *} {#include js_tmpl_auth_reg_soc} <div class="rg_soc_auth_agree">{#include js_tmpl_auth_reg_agree}</div> </div> <div class="subscribe_reg"> {* <div class="rg_description"> #include js_tmpl_auth_reg_descr </div> *} {#include js_tmpl_auth_reg_action} </div> {* {#include js_tmpl_auth_reg_button} *} <div class="clr"> </div> <hr class="logreg_line noPhones"> <div class="logreg_descr noPhones">{#include js_tmpl_auth_reg_descr} {#include js_tmpl_soc_auth_reg_descr} </div> </div> </div> {#/if} </div> {* <div class="gray_bg register_shadow"></div> *} </div> {#/template MAIN} {#template js_tmpl_auth_reg_tab} <ul class="rg_nav"> <li id="js_tab_auth" class="{#if $P.login_register_tab == 1} rg_active_nav {#/if} rg_first_nav"><a onclick="rgNav('js_tab_auth');return false;" href="">Вход на сайт</a></li> <li id="js_tab_reg" class="{#if $P.login_register_tab == 2} rg_active_nav {#/if}"><a onclick="rgNav('js_tab_reg');return false;" href="">Регистрация </a></li> </ul> <span onclick="hidebo();" class="rg_closed"> </span> {#/template js_tmpl_auth_reg_tab} {#template js_tmpl_auth_reg_action} {#if $P.login_register_tab == 1} {#include js_tmpl_auth_reg_soc} {#/if} <div class="rg_forms"> <input type="hidden" id="login_register_destination" value="{$P.login_register_destination}"/> {#if $P.login_register_tab == 1} <div class="rg_for_input"> <span class="rg_text_inner">E-mail или код подписчика</span> <input id="credential_0" class="js_keydown_selector rg_input_text" data-js_submit="no" data-js_next_input_name="credential_1" name="" type="text" /> </div> <div class="rg_for_input"> <span class="rg_text_inner">Пароль</span> <input id="credential_1" class="js_keydown_selector rg_input_text" data-js_submit="yes" data-js_action="js_loginFormBut" name="" type="password" onkeyup="showAttention(this,!!window.event.shiftKey)" /> <span class="pswd_attention" id="attention_pswd"> <span class="icon_attention"></span> <span class="pswd_attention-text" id="attention-text_pswd1">Русская раскладка клавиатуры!</span> <span class="pswd_attention-text" id="attention-text_pswd2">У вас включен Caps Lock!</span> <span class="pswd_attention-text" id="attention-text_pswd3">У вас включен Caps Lock и русская раскладка клавиатуры!</span> </span> </div> <div class="rg_for_input input-alien"> <span class="chk noPhones"><input id="chk_alien" name="" type="checkbox" /></span><label for="chk_alien" class="noPhones"> Чужой компьютер</label> <a class="forgot_pass" href="/member/totalrecall">Забыли пароль?</a> </div> <div class="rg_for_input"> <em id="auth_msg" class="reg_error"></em> <input id="lf_typeauthid" value="email" type="hidden"> <input type="submit" class="button button-red logreg_submit" id="js_loginFormBut" value="Войти">  <div class="loading loading-cover" style="display: none;"><div class="loader"></div></div> </div> {#/if} {#if $P.login_register_tab == 2} <div class="rg_for_input"> <span class="rg_text_inner">E-mail</span> <input id="arfemail" class="js_keydown_selector rg_input_text" name="" type="text" data-js_submit="yes" data-js_action="js_regFormBut"/> </div> <div class="rg_for_input rg_set_lineh rg_for_input_wide"> <label class="js_tap_panel_checkbox"> <span class="chk"><input name="" id='js_tap_panel_checkbox_terms' type="checkbox" data-js_submit="yes" /></span> Я ознакомился и согласен с <a class="link_txd logreg_accLink" href="/faq/vereinbarung.html">условиями сервиса Subscribe.ru</a> </label> <br /> <label class="js_tap_panel_checkbox"> <span class="chk"><input name="" id='js_tap_panel_checkbox_personal' type="checkbox" data-js_submit="yes" /></span> Нажимая на кнопку "Готово!", я даю <a class="link_txd logreg_accLink" href="/faq/persverordnung.html">согласие на обработку персональных данных</a> </label> </div> {* <div style="float: left;position: absolute;left: 11em;"> <img src="http://www.kupivip.ru/images/vip/logo.png?1604" style="width: 86px; vertical-align: middle;display: block;"> </div> <div class="rg_for_input rg_set_lineh"> <label class="js_tap_panel_checkbox"><input name="" id="js_tap_panel_checkbox_kupivip" type="checkbox" data-js_submit="yes"> Я хочу получать новости о скидках на одежду</label> </div> *} <div class="rg_for_input"> <em id="reg_msg" class="reg_error rg_for_input_wide"></em> <em id="reg_msg2" class="reg_error rg_for_input_wide"></em> <input id="rf_typeauthid" value="email" type="hidden"> <a class="button button-red logreg_submit" id="js_regFormBut" href="#">Готово!</a> <div class="loading loading-cover" style="display: none;"><div class="loader"></div></div> </div> {#/if} </div> {#/template js_tmpl_auth_reg_action} {#template js_tmpl_auth_reg_agree} <div class="rg_for_input rg_set_lineh rg_for_input_wide"> <label class="js_tap_panel_checkbox"> <span class="chk"><input name="" id='js_tap_panel_checkbox_terms_reg' type="checkbox" data-js_submit="yes" /></span> Я ознакомился и согласен с <a class="link_txd logreg_accLink" href="/faq/vereinbarung.html">условиями сервиса Subscribe.ru</a></label> <em id="reg_msg_soc" class="reg_error rg_for_input_wide"></em> </div> {#/template js_tmpl_auth_reg_agree} {#template js_tmpl_auth_reg_button} <div class="rg_butons_socials"> {#if $P.login_register_tab == 1} <a class="rg_btn_soc rg_bs_01 js_tap_panel_selector" action="auth_email" href="#"><span><i></i>Email</span></a> <a class="rg_btn_soc rg_bs_01 js_tap_panel_selector" action="auth_openid" href="#"><span><i></i>OpenID</span></a> <a class="rg_btn_soc rg_bs_02 js_tap_panel_selector" action="auth_vkontakte" href="#"><span><i></i>Вконтакте</span></a> <a class="rg_btn_soc rg_bs_02 js_tap_panel_selector" action="auth_mailru" href="#"><span><i></i>Mail.Ru</span></a> {#/if} {#if $P.login_register_tab == 2} <a class="rg_btn_soc rg_bs_01 js_tap_panel_selector" action="reg_email" href="#"><span><i></i>Email</span></a> <a class="rg_btn_soc rg_bs_01 js_tap_panel_selector" action="reg_openid" href="#"><span><i></i>OpenID</span></a> <a class="rg_btn_soc rg_bs_02 js_tap_panel_selector" action="reg_vkontakte" href="#"><span><i></i>Вконтакте</span></a> <a class="rg_btn_soc rg_bs_02 js_tap_panel_selector" action="reg_mailru" href="#"><span><i></i>Mail.Ru</span></a> {#/if} </div> {#/template js_tmpl_auth_reg_button} {#template js_tmpl_auth_reg_descr} {#if $P.login_register_tab == 1} Для оформления подписки на выбранную рассылку, работы с интересующей вас группой или доступа в нужный вам раздел, просим авторизоваться на Subscribe.ru {#/if} {#if $P.login_register_tab == 2} Для регистрации укажите ваш e-mail адрес. Адрес должен быть действующим, на него сразу после регистрации будет отправлено письмо с инструкциями и кодом подтверждения. {#/if} {#/template js_tmpl_auth_reg_descr} {#template js_tmpl_soc_auth_reg_descr} Или зарегистрируйтесь через социальную сеть. {#/template js_tmpl_soc_auth_reg_descr} {#template js_tmpl_auth_reg_soc} <div class="rg_soc"> {#if $P.login_register_tab == 1} <a onclick="return _checkSocConfirm(event)" href="https://oauth.vk.com/authorize?client_id=3954260&scope=wall,offline,photos,groups,video,audio,email&redirect_uri={location.protocol+'//'+location.host}/member/login/vk/&response_type=code&v=5.15" class="login_register_vk_button"> <span class="login_register_vk_icon"></span> </a> {#/if} {#if $P.login_register_tab == 2} <a onclick="return _checkSocConfirm(event)" href="https://oauth.vk.com/authorize?client_id=3954260&scope=wall,offline,photos,groups,video,audio,email&redirect_uri={location.protocol+'//'+location.host}/member/join/vk&response_type=code&v=5.15" class="login_register_vk_button"> <span class="login_register_vk_icon"></span> </a> {#/if} </div> {#/template js_tmpl_auth_reg_soc}

{#template MAIN} <div id="loginForm" style="display:none;" class="subscriberu_popup"> <div class="popup_register"> {#include js_tmpl_auth_reg_tab} <dl class="rg_block_options"> <dt id="js_tap_panel_auth"> <p class="rg_description">{#include js_tmpl_auth_reg_descr}</p> <div class="clr"> </div> {#include js_tmpl_auth_reg_action} <div class="clr"> </div> </dt> </dl> </div>  </div> {#/template MAIN} {#template js_tmpl_auth_reg_tab} <ul class="rg_nav"> <li id="js_tab_reg" class="rg_active_nav rg_first_nav"><a href="" onclick="return false;" >Регистрация</a></li> </ul> <span onclick="hidebo();" class="rg_closed"> </span> {#/template js_tmpl_auth_reg_tab} {#template js_tmpl_auth_reg_descr} <strong>Пожалуйста, подтвердите ваш адрес.</strong><br><br>Вам отправлено письмо для подтверждения вашего адреса {$P.register_confirm_mail}.<br>Для подтверждения адреса перейдите по ссылке из этого письма. {#/template js_tmpl_auth_reg_descr} {#template js_tmpl_auth_reg_action} <div class="rg_forms confirm_code_from_letter"> <div class="rg_for_input"> <span class="rg_inp_descr" style="width:15em;">Или введите код из письма:</span> <input type="text" value="" id="confirm_code" name="" data-js_submit="yes" data-js_action="js_confirmFormBut" class="js_keydown_selector rg_input_text_conf" > </div> <div class="rg_for_input"><label>Не пришло письмо? <b>Пожалуйста, проверьте папку Спам</b><br /> (папку для нежелательной почты).</label><br /> <a href="" onclick="ajax_recall_code();return false" >Вышлите мне письмо еще раз!</a></div> <div class="rg_for_input"> <em class="reg_error" id="confirm_msg"></em> <a href="#" class="button button-red" id="js_confirmFormBut">Готово</a> <div class="loading loading-cover" style="display: none;"><div class="loader"></div></div> <br> </div> </div> {#/template js_tmpl_auth_reg_action}