OpenAI представляет GPT-4 Omni
OpenAI представила свою новую флагманскую модель искусственного интеллекта GPT-4o, где буква "o" означает "omni", что указывает на ее способность обрабатывать текст, речь и видео. В ближайшие недели компания планирует постепенно внедрять GPT-4o в свои продукты.
GPT-4o значительно улучшает функциональность чат-бота ChatGPT. Хотя платформа и раньше предлагала голосовой режим, теперь GPT-4o расширяет эту функцию, позволяя пользователям взаимодействовать с ChatGPT как с ассистентом. Пользователи могут задавать вопросы и прерывать чат-бота во время ответов. Модель обеспечивает отзывчивость «в реальном времени» и может определять нюансы в голосе пользователя, генерируя ответы в разных эмоциональных стилях.
Кроме того, GPT-4o улучшает визуальные возможности ChatGPT. Получив фотографию или скрин, чат-бот теперь может более эффективно отвечать на вопросы. В будущем эта модель позволит ChatGPT «просматривать» видео, давать комментарии и объяснения. GPT-4o многоязычный, с улучшенной производительностью примерно на 50 языках. Сообщается, что GPT-4o в API OpenAI и Microsoft Azure OpenAI Service вдвое быстрее, вдвое дешевле и предлагает более высокие ограничения скорости по сравнению с GPT-4 Turbo.
GPT-4o доступен бесплатно в ChatGPT, а также подписчикам премиум планов Plus и Team с повышенными лимитами на сообщения. OpenAI также отмечает, что когда пользователи достигнут лимита, ChatGPT автоматически переключится на GPT-3.5.