Компания OpenAI, занимающаяся созданием ChatGPT, работает над новым подходом к своим моделям искусственного интеллекта в рамках проекта под кодовым названием «Strawberry», по словам человека, знакомого с этим вопросом, и внутренней документации, изученной Reuters.
Проект, подробности которого ранее не сообщались, реализуется в то время, когда стартап, поддерживаемый Microsoft, стремится показать, что предлагаемые им модели способны обеспечить расширенные возможности мышления.
Команды внутри OpenAI работают над Strawberry, согласно копии недавнего внутреннего документа OpenAI, с которым Reuters ознакомилось в мае. Reuters не удалось установить точную дату публикации документа, в котором подробно описывается план того, как OpenAI намерена использовать Strawberry для проведения исследований. Источник описал Reuters план как незавершенную работу. Информационное агентство не смогло установить, насколько близка Strawberry к тому, чтобы стать общедоступной.
По словам собеседника, принцип работы Strawberry держится в строжайшем секрете даже внутри OpenAI.
В документе описывается проект, в котором используются модели Strawberry с целью позволить ИИ компании не просто генерировать ответы на запросы, но и планировать их наперед, чтобы автономно и достоверно просматривать интернет и проводить то, что OpenAI называет «глубокими исследованиями», по словам источника.
Это то, что до сих пор ускользало от моделей ИИ, согласно интервью с более чем дюжиной исследователей ИИ.
Отвечая на вопрос о Strawberry и деталях, о которых говорится в этой статье, представитель компании OpenAI сказал: «Мы хотим, чтобы наши модели ИИ видели и понимали мир так же, как мы сами. Непрерывные исследования новых возможностей ИИ – это обычная практика в индустрии, и мы верим, что со временем эти системы станут более разумными».
Пресс-секретарь не стал напрямую отвечать на вопросы о Strawberry.
Проект Strawberry ранее был известен как Q*, который, по данным Reuters, в прошлом году уже рассматривался внутри компании как прорыв.
Два источника рассказали, что в начале этого года сотрудники OpenAI видели демонстрационные образцы Q*, способные отвечать на сложные научные и математические вопросы, недоступные для современных коммерческих моделей.
09.07.2024 года на внутреннем собрании всех сотрудников OpenAI показала демонстрацию исследовательского проекта, который, по ее словам, обладает новыми человекоподобными навыками мышления, сообщает Bloomberg, открыв новую вкладку. Представитель OpenAI подтвердил факт встречи, но отказался сообщить подробности ее содержания. Reuters не удалось выяснить, был ли продемонстрированный проект Strawberry.
OpenAI надеется, что инновация значительно улучшит способность моделей ИИ к мышлению, сказал человек, знакомый с этим, добавив, что Strawberry включает в себя специализированный способ обработки модели ИИ после ее предварительного обучения на очень больших наборах данных.
Аналитики, с которыми пообщалось агентство Reuters, утверждают, что разум – это ключ к тому, чтобы ИИ достиг человеческого или сверхчеловеческого уровня интеллекта.
Хотя большие языковые модели уже могут резюмировать объемные тексты и сочинять изящную прозу гораздо быстрее, чем человек, технология часто не справляется с проблемами в области логического мышления, решения которых кажутся людям интуитивно понятными, например с распознаванием логических ошибок или игрой в крестики-нолики. Когда модель сталкивается с подобными проблемами, она часто «выдает» ложную информацию.
Специалисты по ИИ, опрошенные Reuters, в целом согласны с тем, что разум в контексте ИИ подразумевает создание модели, которая позволяет ИИ планировать будущее, отражать особенности функционирования физического мира и надежно решать сложные многоэтапные задачи.
Улучшение процесса мышления в моделях ИИ рассматривается как ключ к раскрытию способности моделей делать все – от совершения крупных научных открытий до планирования и создания новых программных приложений.
Генеральный директор OpenAI, Сэм Альтман, заявил ранее в этом году, что в ИИ «наиболее важные области прогресса будут связаны с умением рассуждать».
Другие компании, такие как Google, Meta и Microsoft, также экспериментируют с различными методами улучшения мышления в моделях ИИ, как и большинство академических лабораторий, проводящих исследования в области ИИ. Однако исследователи расходятся во мнении, способны ли большие языковые модели (LLM – large language models) включать идеи и долгосрочное планирование в процесс прогнозирования. Например, один из пионеров современного ИИ, Ян ЛеКун, работающий в Meta, часто говорил, что LLM не способны рассуждать по-человечески.
ПРОБЛЕМЫ ИСКУССТВЕННОГО ИНТЕЛЛЕКТА.
По словам источника, знакомого с вопросом, Strawberry ключевой компонент плана OpenAI по преодолению этих проблем. В документе, с которым ознакомилось агентство Reuters, говорится о том, что должна обеспечить Strawberry, но не о том, как именно.
В последние месяцы компания в частном порядке сигнализировала разработчикам и другим сторонним лицам, что она находится на пороге выпуска технологии со значительно более продвинутыми возможностями мышления, по словам четырех человек, которые слышали заявления компании. Они отказались назвать свои имена, поскольку не имеют права говорить о частных делах.
По словам одного из источников, «Strawberry» включает в себя специализированный способ так называемого «посттренинга» генеративных моделей ИИ от OpenAI, или адаптации базовых моделей для улучшения их работы в определенных направлениях после того, как они уже были «обучены» на большом количестве обобщенных данных.
Посттренировочный этап разработки модели включает в себя такие методы, как «тонкая настройка» – процесс, используемый сегодня почти во всех языковых моделях и имеющий множество разновидностей, например, когда люди дают модели обратную связь на основе ее ответов и снабжают ее примерами хороших и плохих ответов.
Strawberry имеет сходство с разработанным в Стэнфорде в 2022 году методом под названием «Self-Taught Reasoner» или «STaR», сообщил один из источников, знакомых с этим вопросом. STaR позволяет моделям ИИ «обучаться» до более высокого уровня интеллекта путем итеративного создания собственных обучающих данных и теоретически может быть использован для создания языковых моделей, превосходящих человеческий уровень интеллекта, сказал Reuters один из его создателей, профессор Стэнфорда, Ноа Гудман.
Среди возможностей, на которые OpenAI нацеливает Strawberry, – выполнение задач с длинным горизонтом (LHT – long-horizon tasks), говорится в документе, где речь идет о сложных задачах, требующих от модели планирования и выполнения ряда действий в течение длительного периода времени, пояснил первый источник.
Для этого OpenAI создает, обучает и оценивает модели на базе данных, которые компания называет «глубокими исследованиями», говорится во внутренней документации OpenAI. Reuters не удалось выяснить, что входит в этот набор данных и насколько длительным будет этот период.
OpenAI хочет, чтобы ее модели использовали эти возможности для проведения исследований, автономно просматривая веб-страницы с помощью «CUA», или агента, использующего компьютер, который может предпринимать действия на основе полученных данных, говорится в документе и в одном из источников. OpenAI также планирует протестировать свои возможности на выполнении работы инженеров по программному обеспечению и машинному обучению.
Источник: Reuters.