OpenAI o1
o1 | |
---|---|
Тип | Генеративная предварительно обученная трансформерная модель |
Разработчик | OpenAI |
Первый выпуск | 12 сентября 2024 |
Тестовая версия | (12 сентября 2024 ) |
Сайт | openai.com/o1/ (англ.) |
OpenAI o1 — это генеративная предварительно обученная трансформерная модель (GPT). Превью o1 было выпущено компанией OpenAI 12 сентября 2024 года. o1 затрачивает время на «размышления» перед ответом, что делает его более способным к сложным задачам рассуждения, научным и программным задачам по сравнению с GPT-4o.[1] Полная версия была выпущена для пользователей ChatGPT 5 декабря 2024 года.[2]
История
Предыстория
Согласно утечкам информации, o1 ранее был известен внутри OpenAI как «Q*», а затем как «Strawberry».[3] Кодовое название «Q*» впервые появилось в ноябре 2023 года, во время отстранения и последующего восстановления Сэма Альтмана, когда появились слухи, что эта экспериментальная модель показала многообещающие результаты в математических тестах.[4] В июле 2024 года Reuters сообщил, что OpenAI разрабатывает генеративную предварительно обученную трансформерную модель, известную как «Strawberry»,[3] которая позже стала o1.
Выпуск
«o1-preview» и «o1-mini» были выпущены 12 сентября 2024 года для пользователей ChatGPT Plus и Team.[1] GitHub начал тестировать интеграцию o1-preview в своей службе Copilot в тот же день.[5] 5 декабря 2024 года была выпущена полная версия o1.[6]
Возможности
OpenAI утверждает, что o1 был обучен с использованием нового алгоритма оптимизации и специально подобранного набора данных, а также интеграции обучения с подкреплением в процесс обучения.[7] As of January 2025, API usage for the full o1 model is limited to developers on usage tier 5.[8] По словам OpenAI, o1 не заменяет GPT-4o, а дополняет его.[9][10]
o1 затрачивает дополнительное время на размышления (генерацию цепочки рассуждений), что делает его лучше при решении сложных задач, особенно в науке и математике.[1]
Ограничения
o1 требует больше вычислительных ресурсов, чем другие модели GPT от OpenAI, так как генерирует длинные цепочки рассуждений перед выдачей ответа[11].
См. также
Примечания
- ↑ 1 2 3 Metz, Cade. OpenAI Unveils New ChatGPT That Can Reason Through Math and Science . The New York Times (12 сентября 2024). Дата обращения: 12 сентября 2024.
- ↑ Introducing OpenAI o1 . OpenAI. Дата обращения: 6 декабря 2024.
- ↑ 1 2 Tong, Anna; Paul, Katie. Exclusive: OpenAI working on new reasoning technology under code name 'Strawberry' . Reuters (15 июля 2024). Дата обращения: 12 сентября 2024.
- ↑ OpenAI researchers warned board of AI breakthrough ahead of CEO ouster, sources say. Reuters. 2023-11-23.
- ↑ Peters, Jay. GitHub has started testing OpenAI's o1-preview in GitHub Copilot. The Verge (12 сентября 2024). Дата обращения: 12 сентября 2024.
- ↑ Robison, Kylie (2024-12-05). OpenAI is charging $200 a month for an exclusive version of its o1 'reasoning' model. The Verge. Дата обращения: 2024-12-05.
- ↑ Robison, Kylie. OpenAI releases o1, its first model with 'reasoning' abilities (англ.). The Verge (12 сентября 2024). Дата обращения: 15 сентября 2024.
- ↑ OpenAI o1 and new tools for developers (амер. англ.). openai.com. Дата обращения: 26 января 2025.
- ↑ Knight, Will. OpenAI Announces a New AI Model, Code-Named Strawberry, That Solves Difficult Problems Step by Step. Wired (англ.). ISSN 1059-1028. Дата обращения: 2024-09-15.
- ↑ New reasoning models: OpenAI o1-preview and o1-mini (англ.). OpenAI Developer Forum (12 сентября 2024). Дата обращения: 17 октября 2024.
- ↑ Learning to Reason with LLMs . OpenAI. Дата обращения: 13 сентября 2024. Архивировано 12 сентября 2024 года.