вторник, 7 марта 2023 г.

ЧТО CHATGPT И ГЕНЕРАТИВНЫЙ ИИ ЗНАЧАТ ДЛЯ НАУКИ

Под таким названием Крис Стокел-Уокер, Ричард Ван Норден опубликовали в Nature 9 февраля небольшую заметку  Вот несколько полезных абзацев из нее:

Ученые говорят, что теперь они регулярно используют LLM не только для редактирования рукописей, но и для помощи в написании или проверке кода, а также для мозгового штурма идей. «Теперь я использую LLM каждый день, — говорит Хафстейн Эйнарссон, специалист по информатике из Исландского университета в Рейкьявике. Он начал с GPT-3, но с тех пор перешел на ChatGPT, который помогает ему писать слайды презентаций, студенческие экзамены и задачи курсовой работы, а также преобразовывать студенческие диссертации в статьи. «Многие люди используют его в качестве цифрового секретаря или помощника, — говорит он.
 ....
Некоторые исследователи считают, что LLM хорошо подходят для ускорения таких задач, как написание статей или грантов, если есть человеческий контроль. «Ученые больше не собираются сидеть и писать длинные предисловия к заявкам на гранты», — говорит Альмира Османович Тунстрём, нейробиолог из Сальгренской университетской больницы в Гётеборге, Швеция.

Далее довольно много неинтересных фраз про толерантность, опасность, авторское право и тп.

Вот еще из содержательного:
Можно ли устранить недостатки? (известные как "галлюцинации") 
...Некоторые инструменты поисковых систем, такие как Elicit, ориентированный на исследователей, обходят проблемы атрибуции LLM, используя их возможности сначала для направления запросов на соответствующую литературу, а затем для краткого обобщения каждого из веб-сайтов или документов, которые находят поисковые системы. вывод содержимого, на которое явно ссылаются (хотя LLM может по-прежнему неправильно суммировать каждый отдельный документ).
В конце декабря Google и DeepMind опубликовали препринт о клинически ориентированном LLM, который он назвал Med- PaLM7 . Инструмент мог отвечать на некоторые открытые медицинские вопросы почти так же хорошо, как и обычный врач-человек, хотя у него все еще были недостатки и ненадежность. 

Но значительно полезнее нам статья Грина и Пивидори, на которую в статье дана ссылка. Привожу  здесь ее перевод на русский и краткую аннотацию:
Авторы представляют новый инструмент редактирования с помощью ИИ. Рабочий процесс основан на инфраструктуре Manubot для научных публикаций [6], платформе, разработанной для реализации как индивидуальных, так и масштабных совместных проектов [7,8]. Наш рабочий процесс включает в себя разбор рукописи, использование большой языковой модели (ChatGPT) с подсказками по конкретным разделам, а затем генерирование набора предлагаемых изменений для включения в основной документ. Эти изменения представляются пользователю на рассмотрение через интерфейс GitHub. Чтобы оценить наш рабочий процесс, мы провели тематическое исследование с тремя рукописями, которые включали разделы различной сложности. Наши результаты показывают, что в большинстве случаев модели смогли сохранить первоначальный смысл текста, улучшить стиль написания и даже интерпретировать математические выражения. Наш рабочий процесс написания с помощью ИИ может быть включен в любую рукопись Manubot, и мы ожидаем, что он поможет авторам.
Приведены промты-подсказки для типовых разделов научной статьи и программное обеспечение, которое позволяет автоматизировать процесс создания и редактирования рукописи с помощью ChatGPT в среде Manubot
Когда пользователь запускает программу, рукопись разбирается по разделам, а затем по абзацам) и передается в языковую модель вместе с набором пользовательских подсказок-промтов. Затем модель возвращает отредактированную версию текста. Затем наш рабочий процесс использует API GitHub для создания нового запроса, позволяя пользователю просмотреть и изменить полученный результат, прежде чем объединить изменения с рукописью. Этот рабочий процесс приписывает текст либо пользователю-человеку, либо языковой модели ИИ, что может быть важно в свете возможных будущих юридических решений, которые изменят ландшафт авторского права на результаты генеративных моделей.
Для доступа к этим моделям мы использовали API OpenAl. Поскольку этот API влечет за собой расходы на каждый прогон, которые зависят от длины рукописи, мы реализовали рабочий процесс в GitHub Actions, который может быть запущен пользователем вручную. Наша реализация позволяет пользователям настраивать затраты в соответствии со своими потребностями, позволяя им выбирать конкретные разделы для пересмотра, а не всю рукопись. Кроме того, можно настроить несколько параметров модели, чтобы еще больше скорректировать затраты, например, версию языковой модели (включая Davinci и Curie, а также потенциально недавно опубликованные), степень риска модели или "качество" завершений. Например, при использовании моделей Davinci (наиболее сложных и способных) стоимость одного прогона для большинства рукописей составляет менее $0,50. 

Комментариев нет:

Отправить комментарий