Центр формирует отечественную экосистему разработки и внедрения когнитивных технологий и машинного обучения. Он ориентирован на создание систем усиленного интеллекта, способных помогать человеку принимать решения в сложных ситуациях, при этом самообучаясь и развиваясь вместе с ним.
Когнитивные технологии универсальны: они применимы абсолютно на всех рынках НТИ, так как являются драйвером развития современной информатики. Они предназначены для решения интеллектуальных и творческих задач, имеющих прикладное значение в различных областях науки, промышленности, бизнеса и социальной сферы.
НЦКР является оператором комплексных проектов в части цифровой трансформации различных отраслей бизнеса, государственного управления и социальной сферы на основе системного применения интеллектуальных технологий.
Стратегические цели и задачи НЦКР:
Для достижения этих задач Центр использует следующие технологии:
Генеративное машинное обучение (GAN), AutoML, Big Data, AR/VR
Значимые результаты научно-исследовательской деятельности
В период 2019-2022 гг. НЦКР сформировал экосистему собственных цифровых решений для систем усиленного интеллекта.
FEDOT
Популярным решением от НЦКР является open-source фреймворк генеративного машинного обучения FEDOT. Он позволяет автоматически создавать и оптимизировать цепочки задач (пайплайны) машинного обучения или отдельные их элементы. FEDOT не ограничивается одним классом задач, а претендует на универсальность и расширяемость. Технология позволяет более гибко управлять сложностью моделей и за счет этого достигать лучших результатов. Например, для задачи кредитного скоринга FEDOT достиг значения метрики качества ROC AUC равного 0.859 и успешно превзошел как baseline (0.822), так и варианты конфигураций моделей, найденных конкурентами (TPOT - 0.846, H2O - 0.856, MLBox - 0.83) за то же время. С результатами бенчмарков можно ознакомиться тут.
Базовая версия фреймворка была опубликована в открытом доступе на платформе GitHub в 2019 году. За последние 3 года было выпущено несколько релизов и обновлений FEDOT. Каждая версия вела к расширению функциональности фреймворка, а также исправлению возможных ошибок. Так, была реализована базовая поддержка обработки текстовых данных, добавлен удобный пользовательский API, а также доработана визуализация композитных моделей. Была усовершенствована основная логика фреймворка и обеспечено повышение качества моделирования: операции с данными стали полностью поддерживаться как отдельные узлы, что позволило расширить пространство поиска подходящего пайплайна ML и вывести качество моделирования на новый уровень. Было обеспечено эффективное автоматическое создание пайплайнов для прогнозирования временных рядов. Были улучшены алгоритмы оптимизации гиперпараметров моделей, добавлены многокритериальный вариант оптимизации структуры моделей и прототип создания мульти-модального пайплайна, решающего задачи классификации для изображений, текстов и таблиц.
Платформа экосистемы цифровой личности
Учеными центра был создан прототип платформы экосистемы цифровой личности, которая предназначена для создания и поддержки персональных виртуальных ассистентов – аватаров. Аватары способны обучаться на больших массивах данных и действовать в интересах владельца путем имитации социально-демографических, поведенческих, эмоциональных и когнитивных качеств человека. На основе платформы экосистемы цифровой личности в ИТМО была запущена и протестирована система учебных цифровых ассистентов.
DataMall
В Центре была также разработана платформа для создания интеллектуальных объектов на основе больших данных – DataMall. Она позволяет решать широкий спектр задач: от генерации (майнинга) новых знаний на основе больших данных до быстрого создания собственных цифровых ИИ-объектов, путем агрегации существующих блоков искусственного интеллекта, их модернизации, обучения и дальнейшего создания на их основе практических сервисов. В 2022 г. в рамках данного направления был запущен новый проект по созданию распределенной системы для обеспечения жизненного цикла обработки сейсмических и геологических данных в интересах организации-партнера.
SMILE
В НЦКР была также создана платформа для управления компьютерными моделями SMILE. Она предоставляет разработчику инструменты моделирования технологических процессов и управленческих решений в условиях неопределенности и неполноты данных. SMILE позволяет создать цифрового двойника любой организационно-технической системы или систему поддержки принятия решений на предприятии. На данный момент платформа предлагает широкий список встроенных моделей машинного обучения (МО) и обработки данных, модули гипероптимизации параметров моделей МО, а также высокоуровневый модуль оценки консистентности входных данных с подбором оптимальных моделей для типовых задач (регрессия, классификация, кластеризация). В SMILE есть удобный менеджер внешних модулей для интеграции в платформу и генератор отчетов.
В 2021 году была реализована возможность создавать вычислительные модели на основе предобученных модулей из других проектов, а также добавлена возможность вызова моделей платформы во внешних сервисах через API. Произошла интеграция с внешними источниками данных, а также в систему были добавлены фреймворки Fedot (для автоматического машинного обучения) и ProFit (для процессной аналитики). Был существенно усовершенствован личный кабинет пользователя и повышена стабильность работы платформы в целом.
В 2022 году на основе платформы были разработаны обучающие материалы для организации-партнера, которые позволили предметным специалистам (вне сферы ИТ) освоить базовые навыки разработки моделей машинного обучения, проверки качества моделей и визуализации результатов. В ближайшее время предполагается развитие в рамках НЦКР на основе SMILE инструментальной среды быстрой разработки и обучения отраслевых систем машинного зрения в условиях неопределенности и неполноты исходных данных.
Платформа "Умный город — экспертиза лояльности"
За несколько лет в Центре был сформирован целый пул интеллектуальных решений в области цифровой урбанистики. Так, по заказу компании Rocket Group был разработан программный комплекс, позволяющий за счет интеллектуальных технологий быстро и эффективно генерировать проекты застройки новых районов, соответствующие современным стандартам комфортной жизни, оценивать и прогнозировать экономические перспективы участков и проектов для девелопмента, проверять их на соответствие существующим нормам. Благодаря данному решению, сложная аналитическая работа делается не только качественнее, но и несравнимо быстрее.
Также была разработана платформа "Умный город — экспертиза лояльности". Она обеспечивает анализ и прогнозирование неочевидных явлений и процессов городской среды на основе агрегации различных источников данных.
Интерактивный веб-сервис YourMaps упрощает извлечение, обработку и агрегацию данных из карт и популярных геоинформационных систем.
Кроме решений в области цифровой урбанистики, в НЦКР был также разработан ряд сервисов, ориентированных на медицинские учреждения и рынок digital healthcare в целом.
В результате реализации ключевых проектов Центра в 2021 году была спроектирована, разработана и испытана на реальных задачах индустриальных партнеров среда генеративного моделирования и дизайна цифровых объектов в системах реального мира. Это позволило достигнуть синергетического эффекта от объединения нескольких платформенных решений, предлагаемых НЦКР: платформы поддержки жизненного цикла интеллектуальных объектов на основе промышленных больших данных, платформы автоматизации построения моделей технологических и бизнес-процессов на основе сетевых структур и данных измерений и фреймворка генеративного автоматического машинного обучения. С помощью данной среды пользователи могут быстро и эффективно создавать цифровые объекты искусственного интеллекта с применением подходов Low-Code-программирования, автоматического машинного обучения и генеративных механизмов.
Центр также предлагает разнообразные сервисы, способные упростить, усовершенствовать и/или удешевить различные бизнес-, производственные и иные процессы.
На их основе развивается основное средство производства — облачная среда генеративного моделирования и дизайна цифровых объектов в системах реального мира. Она позволяет с помощью методов искусственного интеллекта синтезировать весь процесс создания новых цифровых объектов (математических и информационных моделей, спецификаций и архитектур ПО, интеллектуальных элементов и пр.), облегчает и ускоряет решение творческих задач различных предметных областей.
Создание важных объектов инфраструктуры
Создана инфраструктура публичного доступа к свободно распространяемому программному обеспечению, разработанному НЦКР, постоянно развивается и совершенствуется распределенная инфраструктура хранения и обработки данных, обеспечивающей деятельность Консорциума НЦКР, с возможностью удаленного доступа к ней.
Внедрение и коммерциализация результатов деятельности центра
На основе платформы экосистемы цифровой личности для ПАО «Сбербанк» и ПАО «Банк-Санкт-Петербург» был разработан цифровой ассистент маркетолога, для ПАО «Сбербанк» был создан корпоративный цифровой ассистент сотрудника банка. Кроме того, на базе данной технологии для Университета ИТМО создана система учебных цифровых ассистентов «Аватар ИТМО», реализованная в виде мобильного приложения.
В 2021 году на основе DataMall для ООО «Техкомпания Хуавэй» была создана имитационная среда распределенных вычислений. Для ПАО Сбербанк была разработана среда формирования параллельного выполнения моделей машинного обучения, а для ООО «Сименс» была сделана исследовательская разработка в рамках создания стенда с моделируемыми физическими процессами на базе машинного обучения на основе платформы.
Создание и лицензирование РИД
В ходе выполнения работ за время работы Центра создано и зарегистрировано более 100 РИД, опубликовано более 850 научных публикаций, индексируемых в базах Web of Science/Scopus. Выполнено более 60 внебюджетных проектов по заказу организаций реального сектора экономики. В 2018-2022 гг. было передано 155 лицензий на РИД Центра.
Консорциум центра в 2023 году включает 18 организаций, среди которых 8 вузов и 10 коммерческих компаний. Головная организация в консорциуме — Университет ИТМО.
Ключевые партнеры из индустрии: ПАО «Сбербанк России», ПАО «МТС», ООО «Сименс», ООО «Центр речевых технологий», ООО «Мэйл.Ру», АО «Диаконт», ООО «Газпромнефть Научно-технический Центр», ООО «Открытый код», АО «ЭР-Телеком Холдинг», ООО «Рокет Груп».
Научные и образовательные организации – партнеры:
В НЦКР реализуются следующие ключевые проекты:
Среда генеративного моделирования цифровых объектов в системах реального мира
Проект подразумевает неформальное объединение различных цифровых решений, созданных в НЦКР, для того, чтобы обеспечить покрытие полного цикла разработки прикладных систем ИИ, при этом автоматизируя наиболее нетривиальные (в т.ч. креативные) этапы работы специалиста по анализу данных, а именно:
Результатом проекта является программная система - среда генеративного моделирования цифровых объектов в системах реального мира, объединяющая и использующая ранее созданные инструменты НЦКР для реализации процесса разработки и отладки цифровых объектов, связанных с ИИ. Новизна процесса определяется использованием генеративного подхода: разработчик определяет в системе ссылки на исходные данные и фиксирует критерии качества объекта (например, предсказательной модели, системы машинного зрения или базы правил чат-бота). После этого среда синтезирует (генерирует) допустимые варианты этих объектов, которые потом могут частично корректироваться разработчиком. При этом все предлагаемые таким образом цифровые объекты тестируются на различных входных данных (включая синтетические, но построенные по датасетам разработчика); оцениваются параметры качества цифровых объектов. В итоге выбранный разработчиком наиболее приемлемый результат автоматически генерируется в виде отчуждаемого кода на языке Python.
Образовательная деятельность НЦКР включает программы магистратуры и аспирантуры, а также краткосрочные программы повышения квалификации и сертификации специалистов, направленные на подготовку специалистов, способных разрабатывать и внедрять, а также эффективно использовать интеллектуальные решения на основе машинного обучения и когнитивных технологий в различных отраслях, с учетом потребностей и сложностей индустриальных партнеров и рынков НТИ.
Магистратуры обучаются на Факультете цифровых трансформаций Университета ИТМО по четырем образовательным программам: “Большие данные и машинное обучение”, “Финансовые технологии больших данных”, “Цифровые геотехнологии” и “Технологии разработки компьютерных игр”. Две образовательные программы реализованы в Институте дизайна и урбанистики Университета ИТМО: “Цифровые технологии умного города” и “Урбанистика”.
Полный перечень и описание программ магистерской и аспирантской подготовки, реализуемых НЦКР на базе Университета ИТМО, доступны по ссылке.
Также НЦКР предлагает программы дополнительного профессионального образования, нацеленные на развитие у специалистов навыков в разработке и применении решений, созданных на базе искусственного интеллекта, машинного обучения и когнитивных технологий. Перечень программ ДПО, даты проведения и форма для регистрации доступны по ссылке.
За пять лет центр подготовил 6964 специалистов: 2211 бакалавров, 2120 магистров, 98 аспиранта и 2535 выпускников программ ДПО. В 2021 году 520 человек успешно прошли курс “Прикладной искусственный интеллект”.
director_nccr@itmo.ru
Руководители лабораторий и научных подразделений НЦКР:
По вопросам PR-взаимодействия:
Адрес: 199034, Санкт-Петербург, Биржевая линия, д. 14 Тел.: +7 (812) 909 3156 https://actcognitive.org/ director_nccr@ifmo.ru