OpenAI o1

Материал из Википедии — свободной энциклопедии
Это старая версия этой страницы, сохранённая Zboris (обсуждение | вклад) в 00:35, 1 февраля 2025 (Примечания). Она может серьёзно отличаться от текущей версии.
Перейти к навигации Перейти к поиску
o1
Тип Генеративная предварительно обученная трансформерная модель
Разработчик OpenAI
Первый выпуск 12 сентября 2024
Тестовая версия (12 сентября 2024; 8 месяцев назад (2024-09-12))
Сайт openai.com/o1/ (англ.)

OpenAI o1 — это генеративная предварительно обученная трансформерная модель (GPT). Превью o1 было выпущено компанией OpenAI 12 сентября 2024 года. o1 затрачивает время на «размышления» перед ответом, что делает его более способным к сложным задачам рассуждения, научным и программным задачам по сравнению с GPT-4o.[1] Полная версия была выпущена для пользователей ChatGPT 5 декабря 2024 года.[2]

История

Предыстория

Согласно утечкам информации, o1 ранее был известен внутри OpenAI как «Q*», а затем как «Strawberry».[3] Кодовое название «Q*» впервые появилось в ноябре 2023 года, во время отстранения и последующего восстановления Сэма Альтмана, когда появились слухи, что эта экспериментальная модель показала многообещающие результаты в математических тестах.[4] В июле 2024 года Reuters сообщил, что OpenAI разрабатывает генеративную предварительно обученную трансформерную модель, известную как «Strawberry»,[3] которая позже стала o1.

Выпуск

«o1-preview» и «o1-mini» были выпущены 12 сентября 2024 года для пользователей ChatGPT Plus и Team.[1] GitHub начал тестировать интеграцию o1-preview в своей службе Copilot в тот же день.[5] 5 декабря 2024 года была выпущена полная версия o1.[6]

Возможности

OpenAI утверждает, что o1 был обучен с использованием нового алгоритма оптимизации и специально подобранного набора данных, а также интеграции обучения с подкреплением в процесс обучения.[7] As of January 2025, API usage for the full o1 model is limited to developers on usage tier 5.[8] По словам OpenAI, o1 не заменяет GPT-4o, а дополняет его.[9][10]

o1 затрачивает дополнительное время на размышления (генерацию цепочки рассуждений), что делает его лучше при решении сложных задач, особенно в науке и математике.[1]

Ограничения

o1 требует больше вычислительных ресурсов, чем другие модели GPT от OpenAI, так как генерирует длинные цепочки рассуждений перед выдачей ответа[11].

См. также

Примечания

  1. 1 2 3 Metz, Cade. OpenAI Unveils New ChatGPT That Can Reason Through Math and Science. The New York Times (12 сентября 2024). Дата обращения: 12 сентября 2024.
  2. Introducing OpenAI o1. OpenAI. Дата обращения: 6 декабря 2024.
  3. 1 2 Tong, Anna; Paul, Katie. Exclusive: OpenAI working on new reasoning technology under code name 'Strawberry'. Reuters (15 июля 2024). Дата обращения: 12 сентября 2024.
  4. OpenAI researchers warned board of AI breakthrough ahead of CEO ouster, sources say. Reuters. 2023-11-23.
  5. Peters, Jay. GitHub has started testing OpenAI's o1-preview in GitHub Copilot. The Verge (12 сентября 2024). Дата обращения: 12 сентября 2024.
  6. Robison, Kylie (2024-12-05). OpenAI is charging $200 a month for an exclusive version of its o1 'reasoning' model. The Verge. Дата обращения: 2024-12-05.
  7. Robison, Kylie. OpenAI releases o1, its first model with 'reasoning' abilities (англ.). The Verge (12 сентября 2024). Дата обращения: 15 сентября 2024.
  8. OpenAI o1 and new tools for developers (амер. англ.). openai.com. Дата обращения: 26 января 2025.
  9. Knight, Will. OpenAI Announces a New AI Model, Code-Named Strawberry, That Solves Difficult Problems Step by Step. Wired (англ.). ISSN 1059-1028. Дата обращения: 2024-09-15.
  10. New reasoning models: OpenAI o1-preview and o1-mini (англ.). OpenAI Developer Forum (12 сентября 2024). Дата обращения: 17 октября 2024.
  11. Learning to Reason with LLMs. OpenAI. Дата обращения: 13 сентября 2024. Архивировано 12 сентября 2024 года.