
Национальная технолøгическая инициатива
Центр формирует отечественную экосистему разработки и внедрения когнитивных технологий и машинного обучения. Он ориентирован на создание систем усиленного интеллекта, способных помогать человеку принимать решения в сложных ситуациях, при этом самообучаясь и развиваясь вместе с ним.
Когнитивные технологии универсальны: они применимы абсолютно на всех рынках НТИ, т.к являются драйвером развития современной информатики. Они предназначены для решения интеллектуальных и творческих задач, имеющих прикладное значение в различных областях науки, промышленности, бизнеса и социальной сферы.
НЦКР является оператором комплексных проектов в части цифровой трансформации различных отраслей бизнеса, государственного управления и социальной сферы на основе системного применения интеллектуальных технологий.
Стратегические цели и задачи НЦКР:
Для достижения этих задач Центр использует следующие технологии:
Генеративное машинное обучение (GAN), AutoML, Big Data, AR/VR
Значимые результаты научно-исследовательской деятельности
В период 2019-2021 гг. НЦКР сформировал экосистему собственных цифровых решений для систем усиленного интеллекта.
FEDOT
Популярным решением от НЦКР является open-source фреймворк генеративного машинного обучения FEDOT. Он позволяет автоматически создавать и оптимизировать цепочки задач (пайплайны) машинного обучения или отдельные их элементы. FEDOT не ограничивается одним классом задач, а претендует на универсальность и расширяемость. Технология позволяет более гибко управлять сложностью моделей и за счет этого достигать лучших результатов. Например, для задачи кредитного скоринга FEDOT достиг значения метрики качества ROC AUC равного 0.859 и успешно превзошел как baseline (0.822), так и варианты конфигураций моделей, найденных конкурентами (TPOT - 0.846, H2O - 0.856, MLBox - 0.83) за то же время. С результатами бенчмарков можно ознакомиться тут.
Базовая версия фреймворка была опубликована в открытом доступе на платформе GitHub в 2019 году. За последние 3 года было выпущено несколько релизов и обновлений FEDOT. Каждая версия вела к расширению функциональности фреймворка, а также исправлению возможных ошибок. Так, была реализована базовая поддержка обработки текстовых данных, добавлен удобный пользовательский API, а также доработана визуализация композитных моделей. Была усовершенствована основная логика фреймворка и обеспечено повышение качества моделирования: операции с данными стали полностью поддерживаться как отдельные узлы, что позволило расширить пространство поиска подходящего пайплайна ML и вывести качество моделирования на новый уровень. Было обеспечено эффективное автоматическое создание пайплайнов для прогнозирования временных рядов. Были улучшены алгоритмы оптимизации гиперпараметров моделей, добавлены многокритериальный вариант оптимизации структуры моделей и прототип создания мульти-модального пайплайна, решающего задачи классификации для изображений, текстов и таблиц.
Платформа экосистемы цифровой личности
Учеными центра был создан прототип платформы экосистемы цифровой личности, которая предназначена для создания и поддержки персональных виртуальных ассистентов (аватаров). Аватары способны обучаться на больших массивах данных и должны действовать в личных и профессиональных интересах владельца путем имитации социально-демографических, поведенческих, эмоциональных и когнитивных качеств человека. На ее основе создана и внедрена система учебных цифровых ассистентов «Аватар ИТМО».
DataMall
В НЦКР была разработана платформа для создания интеллектуальных объектов на основе больших данных – DataMall. Платформа позволяет решать широкий спектр задач: от генерации (майнинга) новых знаний на основе больших данных до быстрого создания собственных цифровых ИИ-объектов, путем агрегации существующих блоков искусственного интеллекта, их модернизации, обучения и дальнейшего создания на их основе практических сервисов.
SMILE
Создана платформа для управления компьютерными моделями SMILE. Она предоставляет разработчику инструменты моделирования технологических процессов и управленческих решений в условиях неопределенности и неполноты данных. SMILE позволяет создать цифрового двойника любой организационно-технической системы или систему поддержки принятия решений на предприятии. На данный моммент платформа предлагает широкий список встроенных моделей машинного обучения (МО) и обработки данных, модули гипероптимизации параметров моделей МО, а также высокоуровневый модуль оценки консистентности входных данных с подбором оптимальных моделей для типовых задач (регрессия, классификация, кластеризация). В SMILE есть удобный менеджер внешних модулей для интеграции в платформу и генератор отчетов. В 2021 году была реализована возможность создавать вычислительные модели на основе предобученных модулей из других проектов, а также добавлена возможность вызова моделей платформы во внешних сервисах через API. Произошла интеграция с внешними источниками данных, а также в систему были добавлены фреймворки Fedot (для автоматического машинного обучения) и ProFit (для процессной аналитики). Также в 2021 году были существенно усовершенствован личный кабинет пользователя и повышена стабильность работы платформы в целом.
Платформа "Умный город — экспертиза лояльности"
Разработана платформа "Умный город — экспертиза лояльности", обеспечивающая анализ и прогнозирование неочевидных явлений и процессов городской среды на основе агрегации различных источников данных, а также YourMaps – интерактивный веб-сервис, предназначенный для упрощения извлечения, обработки и агрегации геоданных из карт и популярных геоинформационных систем, ряд сервисов ориентированных на медицинские учреждения и пр.
В результате реализации ключевых проектов Центра в 2021 году была спроектирована, разработана и испытана на реальных задачах индустриальных партнеров среда генеративного моделирования и дизайна цифровых объектов в системах реального мира. Это позволило достигнуть синергетического эффекта от объединения нескольких платформенных решений, предлагаемых НЦКР: платформы поддержки жизненного цикла интеллектуальных объектов на основе промышленных больших данных, платформы автоматизации построения моделей технологических и бизнес-процессов на основе сетевых структур и данных измерений и фреймворка генеративного автоматического машинного обучения. С помощью данной среды пользователи могут быстро и эффективно создавать цифровые объекты искусственного интеллекта с применением подходов Low-Code-программирования, автоматического машинного обучения и генеративных механизмов.
Центр также предлагает разнообразные сервисы, способные упростить, усовершенствовать и/или удешевить различные бизнес-, производственные и иные процессы.
На их основе развивается основное средство производства — облачная среда генеративного моделирования и дизайна цифровых объектов в системах реального мира. Она позволяет с помощью методов искусственного интеллекта синтезировать весь процесс создания новых цифровых объектов (математических и информационных моделей, спецификаций и архитектур ПО, интеллектуальных элементов и пр.), облегчает и ускоряет решение творческих задач различных предметных областей.
Создание важных объектов инфраструктуры
Создана инфраструктура публичного доступа к свободно распространяемому программному обеспечению, разработанному НЦКР, постоянно развивается и совершенствуется распределенная инфраструктура хранения и обработки данных, обеспечивающей деятельность Консорциума НЦКР, с возможностью удаленного доступа к ней.
Внедрение и коммерциализация результатов деятельности центра
На основе платформы экосистемы цифровой личности для ПАО «Сбербанк» и ПАО «Банк-Санкт-Петербург» был разработан цифровой ассистент маркетолога, для ПАО «Сбербанк» был создан корпоративный цифровой ассистент сотрудника банка. Кроме того, на базе данной технологии для Университета ИТМО создана система учебных цифровых ассистентов «Аватар ИТМО», реализованная в виде мобильного приложения.
В 2021 году на основе DataMall для ООО «Техкомпания Хуавэй» была создана имитационная среда распределенных вычислений. Для ПАО Сбербанк была разработана среда формирования параллельного выполнения моделей машинного обучения, а для ООО «Сименс» была сделана исследовательская разработка в рамках создания стенда с моделируемыми физическими процессами на базе машинного обучения на основе платформы.
Создание и лицензирование РИД
В ходе выполнения работ за время работы Центра создано и зарегистрировано более 100 РИД, опубликовано более 650 научных публикаций, индексируемых в базах Web of Science/Scopus. Выполнено более 60 внебюджетных проектов по заказу организаций реального сектора экономики. В 2018-2021 гг. было передано 122 лицензии на РИД Центра.
Консорциум центра в 2022 году включает 18 организаций, среди которых 8 вузов и 10 коммерческих компаний. Головная организация в консорциуме — Университет ИТМО.
Ключевые партнеры из индустрии: ПАО «Сбербанк России», ПАО «МТС», ООО «Сименс», ООО «Центр речевых технологий», ООО «Мэйл.Ру», АО «Диаконт», ООО «Газпромнефть Научно-технический Центр», ООО «Открытый код», АО «ЭР-Телеком Холдинг», ООО «Рокет Груп».
Научные и образовательные организации – партнеры:
В НЦКР реализуются следующие ключевые проекты:
Среда генеративного моделирования цифровых объектов в системах реального мира
Проект подразумевает неформальное объединение различных цифровых решений, созданных в НЦКР, для того, чтобы обеспечить покрытие полного цикла разработки прикладных систем ИИ, при этом автоматизируя наиболее нетривиальные (в т.ч. креативные) этапы работы специалиста по анализу данных, а именно:
Результатом проекта является программная система - среда генеративного моделирования цифровых объектов в системах реального мира, объединяющая и использующая ранее созданные инструменты НЦКР для реализации процесса разработки и отладки цифровых объектов, связанных с ИИ. Новизна процесса определяется использованием генеративного подхода: разработчик определяет в системе ссылки на исходные данные и фиксирует критерии качества объекта (например, предсказательной модели, системы машинного зрения или базы правил чат-бота). После этого среда синтезирует (генерирует) допустимые варианты этих объектов, которые потом могут частично корректироваться разработчиком. При этом все предлагаемые таким образом цифровые объекты тестируются на различных входных данных (включая синтетические, но построенные по датасетам разработчика); оцениваются параметры качества цифровых объектов. В итоге выбранный разработчиком наиболее приемлемый результат автоматически генерируется в виде отчуждаемого кода на языке Python.
Образовательная деятельность НЦКР включает программы магистратуры и аспирантуры, а также краткосрочные программы повышения квалификации и сертификации специалистов, направленные на подготовку специалистов, способных разрабатывать и внедрять, а также эффективно использовать интеллектуальные решения на основе машинного обучения и когнитивных технологий в различных отраслях, с учетом потребностей и сложностей индустриальных партнеров и рынков НТИ.
Магистратуры обучаются на Факультете цифровых трансформаций Университета ИТМО по четырем образовательным программам: “Большие данные и машинное обучение”, “Финансовые технологи больших данных”, “Цифровые геотехнологии” и “Технологии разработки компьютерных игр”. Две образовательные программы реализованы в Институте дизайна и урбанистики Университета ИТМО: “Цифровые технологии умного города” и “Урбанистика”.
Полный перечень и описание программ магистерской и аспирантской подготовки, реализуемых НЦКР на базе Университета ИТМО, доступны по ссылке.
Также НЦКР предлагает программы дополнительного профессионального образования, нацеленные на развитие у специалистов навыков в разработке и применении решений, созданных на базе искусственного интеллекта, машинного обучения и когнитивных технологий. Перечень программ ДПО, даты проведения и форма для регистрации доступны по ссылке.
За четыре года центр подготовил 4778 специалистов: 1545 бакалавров, 1412 магистров, 83 аспиранта и 1218 выпускников программ ДПО.
В 2021 году 520 человек успешно прошли курс “Прикладной искусственный интеллект”.
Руководители лабораторий и научных подразделений НЦКР:
По вопросам PR-взаимодействия:
Адрес: 199034, Санкт-Петербург, Биржевая линия, д. 14
Тел.: +7 (812) 909 3156
https://actcognitive.org/
director_nccr@ifmo.ru