Chat GPT и голосовые функции

OpenAI представляет улучшения в голосовых и графических функциях своего чат-бота ChatGPT, который базируется на мощной языковой модели GPT. В официальном блоге стартапа было объявлено о запуске этих нововведений.

Chat GPT голос

Голосовой интерфейс. Пользователи ранее имели возможность задавать вопросы голосом через мобильное приложение ChatGPT. Теперь же бот приобрел свой уникальный голос — точнее, даже пять различных голосов на выбор. Осуществление этого подвига возможно благодаря сотрудничеству OpenAI с профессиональными актерами-дублерами, а для преобразования речи в текст используется уникальная технология Whisper.

Распознавание изображений. Теперь общение с ChatGPT не ограничивается лишь текстом и голосом. Пользователи могут показывать чат-боту одно или несколько изображений. Например, можно отсканировать содержимое холодильника и получить список рецептов на основе имеющихся продуктов. Также бот способен проанализировать сложные графики и делать выводы. Для выделения определенных фрагментов на изображении предусмотрен инструмент рисования в мобильном приложении.

Новые возможности будут постепенно доступны для подписчиков тарифов Plus и Enterprise. Отметим, что функция голосового чата будет работать исключительно в приложениях ChatGPT для iOS и Android.