четверг, 14 апреля 2022 г.

Что такое (AI)-generated media или персонажи, созданные искусственным интеллектом?

 

Отслеживая применения искусственного интеллекта в образовании, я обратил внимание на те возможности, которые позволяют создавать учебно-методические продукты и инструменты нового типа. Известно, что технологии компьютерного зрения позволяют не только обрабатывать, «оживлять», но и создавать новые, несуществующие изображения и видео, речевые технологии позволяют озвучить и переозвучить любую сущность, а подключение «большой языковой модели» может дать этой сущности подобие интеллекта. Эти новые медиа-сущности способны вступать с человеком в том числе и в образовательные взаимодействия. 

Сотрудники Медиа-лаборатории Массачусетского технологического института в своей недавней статье дали этому направлению в ИИ наименование: генеративные медиа (см. Pat Pataranutaporn, Valdemar Danry, Joanne Leong, Parinya Punpongsanon, Dan Novy, Pattie Maes & Misha Sra «AI-generated characters for supporting personalized learning and well-being»/Nature Machine Intelligence volume 3, pages1013–1022 (2021)

Ниже привожу наиболее важные выдержки из этой статьи

Персонажи, созданные ИИ

1.      Авторы определяют персонажей, сгенерированных ИИ (AI-generated characters), как цифровые представления человека, созданные алгоритмами машинного обучения, которые выглядят, звучат и ведут себя реалистично, не обязательно будучи злонамеренными (как дипфейки).

2.      Чтобы определить место таких персонажей среди других схожих объектов их характеризуют  по трем осям: реализм, интерактивность и воплощение (рис. 1). Персонажи, созданные ИИ, благодаря их виртуальному воплощению отличаются от физически воплощенных персонажей, таких как гуманоидные роботы.  По этим осям персонажей, созданных ИИ, можно сравнивать с другими областями, такими как роботы-гуманоиды, персонажи CGI/VFX в фильмах и 3D-персонажи в играх. В отличие от  персонажей, созданных вручную (например, трехмерные (3D) или персонажи CGI/VFX - компьютерные изображения/визуальные эффекты) они могут быть значительно более реалистичными.  ИИ-персонажи (будем называть их так) обладают различной степенью интерактивности


Рис. 1.

3.      Авторы выделяют два подтипа ИИ-персонажа:  1) пользователь становится сгенерированным ИИ персонажем с заменой лица и 2) пользователь взаимодействует с сгенерированным ИИ персонажем, который находится под контролем либо другого человека, либо ИИ- системы.

4.      Первый подтип позволяет человеку носить лицо сгенерированного персонажа, что  может помочь пользователю представить себя кем-то другим и мотивировать его к необходимым действиям,  экспериментировать с идеями посредством ролевых игр. Было показано, что виртуальное существование кем-то другим повышает способность к объективному мышлению , укрепляет вовлеченность  и уменьшает дискриминационные предубеждения.

5.      Второй подтип позволяет пользователям взаимодействовать с другими пользователями с ИИ-лицом  или с воплощеннымиИИ-системами. Последние могут служить мотиваторами, изображая личностно значимого наставника, советника или сторонника, демонстрируя их черты лица, голос и манеры.

6.      Принципиальным моментом является потенциально легкая доступность этих персонажей (в отличие от роботов или персонажей, созданных вручную), а также их перестраиваемость с одного  сценария на другой.

7.      Оба подтипа персонажей ИИ могут быть доступны в различных формах (видео, 3D, аудио) и через несколько устройств, таких как смартфоны, ноутбуки или гарнитуры дополненной и виртуальной реальности, которые могут предоставить новые возможности для взаимодействия

8.      Для целей образования в использовании ИИ-персонажей авторы выделяют следующие направления

8.1. ИИ-персонажей можно использовать для создания увлекательных учебных материалов для всех возрастов, от предоставления контента в классе до взаимодействия с контентом в таких местах, как музеи, исторические памятники или даже на природе. С помощью современных алгоритмов можно оживить выдающихся исторических, современных или вымышленных деятелей, чтобы познакомить учащихся с «живым» опытом ученых, делающих свои открытия, исторических деятелей, рассказывающих о битвах, или художников, обсуждающих свое вдохновение и процесс. От себя заметим перспективность их использования для конструирования открытых онлайн-курсов (МООК) (см. рис. 2)


Рис. 2

8.2. Персонажи, созданные искусственным интеллектом, могут представляться в качестве виртуальных преподавателей. Способ, которым учителя интегрируют технологию в свои планы уроков, играет важную роль в мотивации наряду с психологическими процессами учащихся и контекстуальными факторами, участвующими в обучении. Это было продемонстрировано в начале 2020 года, когда профессор увидел всплеск энтузиазма студентов после того, как провел свои онлайн-уроки в роли аниме-персонажа. Такие возможности поддерживают множество новых сценариев обучения.

8.3. Студенты, воплощающие персонажей, созданных искусственным интеллектом. Например, студент может стать Эйнштейном и попытаться изложить свою теорию относительности. Исследователи продемонстрировали, что воплощение персонажа в виртуальной реальности может положительно влиять на поведение и способности людей. См. также про ролевые игры (рис. 3)


Рис. 3

8.4. Персонажи, созданные ИИ, как ровесники. Помимо использования сгенерированных ИИ персонажей в качестве инструкторов или ролевых игр студентов для более захватывающего обучения, авторы предполагают использование сгенерированных персонажей в качестве сверстников в группах поддержки обучения. Было показано, что социальные вознаграждения, такие как похвала от других, способствуют большей мотивации у детей, улучшают успеваемость и повышают самоэффективность . Аналогичным образом было показано, что похвала от искусственных объектов, таких как роботы и виртуальные агенты, повышает человеческую мотивацию и производительность решения задач.

9.      Далее идет описание предлагаемого авторами конвейера для «Создания  ИИ персонажей из текста, аудио и видео». Конвейер позволяет легко создавать реалистичный контент на основе реальных и вымышленных гуманоидных персонажей с мимикой, голосом и движением. Он сочетает в себе современные генеративные модели искусственного интеллекта, которые преобразуют текст в аудио, аудио в видео и видео в видео, и может использоваться для создания различных аудио- и видеовыходов на основе доступных данных. Используются следующие модели:

91.1.VOCA 63 (анимация персонажей с голосовым управлением),

9.2. FLAME 64 (лица, изученные с помощью артикуляционной модели и выражений),

9.3. управляемая речью лицевая анимация,

9.4. и модель движения первого порядка.

10.  В заключение авторы говорят о будущем, в котором генеративный ИИ станет повсеместным в повседневной жизни как часть постоянно растущего ландшафта взаимодействия человека и ИИ. Помимо сферы образования, эти технологии, вероятно, будут использоваться для положительного воздействия во многих других областях, включая развлечения, творчество и безопасность. Хотя современные алгоритмы далеки от совершенства, они открывают новые творческие возможности не только для художников и кинематографистов, но и производителей более скромного учебного контента, поскольку не требуют бюджетов и сроков голливудского уровня.

Мы весьма впечатлены этими возможностями для использования в задачах создания качественного, мотивирующего обучение контента.

Комментариев нет:

Отправить комментарий