Итоги 2020 года: самые интересные AI-решения и проекты
В последние годы на рынке IT наблюдается настоящий бум в области решений на базе искусственного интеллекта. И в этом нет ничего удивительного: современные вычислительные и нейросетевые технологии достигли уровня, позволяющего AI-системам решать весьма сложные для человека практические задачи, а разработчикам — создавать инновационные приложения и сервисы, демонстрирующие безграничный потенциал электронного разума.
Чувство обоняния
Одним из ярчайших примеров интенсивного развития технологий искусственного интеллекта стал созданный специалистами Intel Labs и Корнелльского университета AI-комплекс, способный различать запахи и имитировать работу обонятельной нервной системы человека. В основу разработки легли нейроморфные процессоры Intel Loihi, сочетающие процессы обучения, тренировки и принятия решений в одном чипе и позволяющие системе быть автономной и «сообразительной» без подключения к облаку (к базе данных). В ходе экспериментов спроектированный и оснащённый химическими датчиками комплекс продемонстрировал высокую эффективность при распознавании в воздухе запахов опасных веществ даже в условиях сильных помех. Подобного рода решения, уверены в Intel, помогут в развитии робототехники, когда роботы смогут сами сортировать продукты, ориентируясь на запах, подтолкнут развитие систем слежения за состоянием окружающей среды, приведут к повышению безопасности труда на производстве и в целом дадут толчок к развитию когнитивных способностей кремниевых процессоров.
Болезни отступят
Значительного прогресса в 2020 году разработчики AI-систем добились в области медицины. Так, компанией DeepMind, принадлежащей холдингу Alphabet (Google), было объявлено о существенном прорыве в предсказании фолдинга (сворачивания) белков. Проблема предсказания сворачивания белка считается одной из 125 важнейших для решения задач современности, а также одной из величайших проблем биологии за последние 50 лет. Дело в том, что белки собираются из линейных последовательностей аминокислот, которые после синтеза принимают уникальную пространственную форму, и таких форм огромное множество. В настоящий момент из сотен миллионов белков (комбинаций аминокислот) изучено только 0,1 % соединений, чья пространственная структура также хорошо известна. Неизвестные белки, а также соединения, свойства которых ещё не были подтверждены экспериментальным путём, учёные пытаются предсказать с помощью компьютеров. Но до сих пор никто не мог с достаточной степенью точности вычислить, какую 3D-форму примет белок из заданных набора и последовательностей аминокислот. В DeepMind утверждают, что нашли ключ к решению этой задачи. Если это действительно так, то нас может ждать прорыв в открытии новых лекарств и вакцин, а также в понимании возникновения и течения многих болезней.
По мнению экспертов, повсеместное внедрение технологий искусственного интеллекта в медицину сулит огромные перспективы, позволяя значительно улучшить качество лечения и принципиально изменить подход к ранней диагностике опасных заболеваний. Аналогичной позиции придерживается небезызвестный Билл Гейтс (Bill Gates), считающий, что использование нейронных сетей в сложных биологических системах способно кардинально изменить жизнь людей в будущем. Потенциал AI только сейчас начинает раскрываться, считает основатель Microsoft, — вычислительные мощности в этой области удваиваются каждые 3,5 месяца. Господин Гейтс указал, что, наряду с улучшениями в обработке данных, это даёт возможность синтезировать, анализировать, выявлять закономерности и делать прогнозы по гораздо большему количеству направлений, чем может осознать человек.
Сила мысли
Чтение мыслей пока что остаётся уделом фантастических фильмов и книг. Однако наука и техника не стоят на месте, и есть все основания считать, что в будущем подобного рода технологии станут реальностью. На шаг вперёд в этом направлении удалось продвинуться группе учёных из Калифорнийского университета в Сан-Франциско, экспериментально доказавшим возможность распознавания нервных сигналов в головном мозге человека и их трансляции в понятные слова с помощью рекурентной нейросети и вживлённых в мозг электродов. В эксперименте приняли участие пациенты с эпилепсией, электроды которым были вживлены для борьбы с неврологическим заболеванием и отслеживания приступов. Так получилось, что часть электродов оказались в зонах мозга, в которых происходит подбор слов, составление выражений и осуществляется обратная связь с участками мозга, воспринимающими собственную речь человека. Испытуемым было предложено мысленно, а затем вслух произнести несколько предложений с ограниченным набором слов. Одновременно снимались сигналы с имплантированных в мозг датчиков. Полученные данные были переданы в нейронную сеть для обучения, а промежуточный результат был отдан для анализа другой AI-сети. Вероятность ошибочного определения слов составила всего 3 процента. Впечатляющий показатель!
От классики до рока
Интересное применение искусственному интеллекту нашли программисты компании OpenAI, разработавшие Jukebox — искусственный интеллект, сочиняющий музыку с осмысленными текстами и вокалом. Для обучения нейронной сети системы было использовано множество отрывков из песен самых разных жанров, от рока, джаза и блюза до хип-хопа с кантри и классическими произведениями. Такой подход позволил команде OpenAI расширить возможности проекта и добиться эффекта имитации музыкальных композиций исполнителей, на треках которых он обучался. Например, Jukebox может сочинить музыку в стиле кантри-певца Джонни Кэша, рэпера Drake и даже российской поп-группы «Тату». На создание одной минуты музыкального трека с вокальными партиями искусственному интеллекту требуется около 9 часов и огромный объём вычислительных ресурсов. Именно по этой причине компания не может предоставить открытый доступ к своей AI-системе. Зато разработчики опубликовали результаты работы Jukebox. Послушать их можно на сайте jukebox.openai.com.
Уроки рисования
Электронный разум нашёл применениеи в изобразительном искусстве. Аккурат в середине 2020 года стало известно о создании специалистами Лаборатории искусственного интеллекта Массачусетского технологического института системы машинного обучения Timecraft, позволяющей воссоздать процесс написания картин и нанесения мазков для произведений живописи известных художников, будь то Моне, Винсент Ван Гог или Сальвадор Дали. Сообщается, что нейросеть вначале была обучена на двух сотнях видеороликов с ускоренной съёмкой техники написания реальных цифровых и акварельных картин. После этого исследователи создали свёрточную нейронную сеть, которая призвана «деконструировать» художественные работы на основе своих знаний о процессе создания картин. В результате система Timecraft сумела показать более высокую эффективность, чем существующие подобные проекты, более чем в 90 % случаев. Неплохой результат. Помимо уроков виртуальной истории, AI-система Timecraft может быть полезна для иллюстрации общих приёмов и техники рисования новичкам.
Успела отметиться в творческом AI-сегменте и компания «Яндекс», открывшая виртуальную галерею нейросетевого искусства, в которой представлено четыре тысячи уникальных картин, созданных искусственным интеллектом. Галерея размещена по адресу yandex.ru/lab/ganart и разделена на четыре тематических зала: «Люди», «Природа», «Город» и «Настроение». Для обучения нейросети специалистами «Яндекса» были использованы произведения, принадлежащие к разным направлениям живописи: от фовизма и кубизма до минимализма и стрит-арта. В процессе обучения AI-система изучила 40 тысяч картин, после чего взялась за создание собственных произведений. Для отбора картин по разным категориям использовалась другая нейросеть, которая применяется в сервисе «Яндекс.Картинки» для поиска изображений по запросам. Именно она смогла увидеть на картинах людей, природу, город и разные настроения, отсортировав имеющиеся в наличии работы по категориям.
Игры разума
Немало применений искусственный интеллект нашёл и в других сферах человеческой деятельности. К примеру, NVIDIA задействовала AI для воссоздания игрового процесса знаменитой аркадной видеоигры Pac-Man с помощью нейросети GameGAN. Для решения этой задачи искусственному интеллекту потребовалось всего 4 дня. Компания обучила нейросеть с помощью 50 тысяч игровых сессий в Pac-Man. Затем перед ней поставили задачу — воссоздать увиденную игру целиком, начиная от статичных стен и точек и заканчивая двигающимися призраками и самим Пакманом. Обучение и воссоздание игры проводилось с использованием квартета графических ускорителей NVIDIA Quadro GP100. Самое интересное заключается в том, что GameGAN не предоставили доступ к оригинальному коду игры или её движку. Всё обучение сводилось к тому, что одна нейросеть наблюдала за тем, как в Pac-Man играла другая нейросеть. «Для создания игры, подобной Pac-Man, программисту требуется придумать и прописать правила поведения и взаимодействия всех имеющихся агентов внутри игры. Это очень кропотливая работа. GameGAN может упростить эту задачу. Нейросеть способна обучаться новым правилам через наблюдение. В идеале алгоритмы, подобные GameGAN, можно будет обучить процедурной генерации правил для той игры, которую вы хотите создать», — поясняют исследователи NVIDIA, подчёркивающие, что в перспективе их разработка может быть задействована не только в игровой индустрии, но и в других областях.
Вкалывают роботы
Любопытной разработкой в области искусственного интеллекта отметилась Mail.ru Group, представившая в 2020 году платформу dictor.mail.ru, которая позволяет в несколько кликов создавать новостные и репортажные видео студийного качества. Чтобы создать видео, достаточно загрузить в систему текст новости — и виртуальный ведущий его зачитает. Дикторы выглядят и разговаривают, как живые люди: при чтении новостей они реалистично воспроизводят мимику, эмоционально реагируют и расставляют смысловые акценты. Внешность диктора выбирает пользователь: в компании создали несколько моделей цифровых ведущих, прототипами для которых послужили реальные люди. В Mail.ru Group подчёркивают, что при создании виртуальных ведущих использовались методы машинного обучения. Синтез речи построен на основе наработок голосового ассистента Маруси. А видеоизображение синхронизируется с речью в режиме реального времени с помощью системы компьютерного зрения Vision от той же Mail.ru Group, обученной на реальных прототипах и видеозаписях.
Взгляд в будущее
Прошедший 2020-й можно смело назвать годом самых ярких достижений искусственного разума, который продолжит интенсивное развитие, несмотря на пандемию коронавируса и непростую экономическую обстановку в мире. Согласно оценкам аналитиков International Data Corporation (IDC), в прошедшем году глобальные затраты в этой сфере составили примерно 156,5 млрд долларов США. К 2024-му объём рынка вырастет в два раза и превысит $300 млрд. При этом самым крупным сегментом в отрасли останется программное обеспечение. На втором месте по размеру расходов окажутся различные AI-сервисы. Оставшаяся часть придётся на аппаратные решения. В отдалённом будущем искусственный интеллект затронет практически все сферы человеческой деятельности. У рынка AI большой задел на будущее и хорошие перспективы для развития, а поэтому есть все основания полагать, что динамика его роста окажется выше ожиданий и прогнозов экспертов.