Лабораторія досліджень штучного інтелекту OpenAI розробила нову модель ШІ GPT-4о. Він здатен розпізнавати об’єкти через об’єктив смартфона і розповідати про них. Наприклад, “бачить” качок у ставку й детально описує їхню поведінку.
Про появу новинки повідомляє TechCrunch.
Літера “о” є посиланням на латинськ слово “omni” (все), і описує здатність ШІ працювати із текстом, голосом та візуальним зображенням в реальному часі.
Якщо звертати до GPT-4o, то він реагує зі швидкістю 320 мілісекунди, що дорівнює людським показникам.
Технічна директорка OpenAI Міра Мураті сказала, що такі здібності їхнього ШІ “надзвичайно важливі, адже компанія дивиться у майбутнє взаємодії міє людьми і машинами”.
Новий ШІ має різні емоції користувача і навіть спів (тож можна наспівати улюблені пісню, і програма відгадає її). Але особливо добре модель справляється із розумінням зображення і звуку. GPT давно передбачає голосову функцію, але нова модель значно покращує її.
Наприклад, він може “прочитати” меню і перекласти його. Або “подивитися” якусь спортивну гру і пояснити власнику правила.
Це стало можливо завдяки кооперації із Be My Eyes — датським мобільним додатком, який має на меті допомогти незрячим і людям із вадами зору розпізнавати предмети та справлятися з повсякденними ситуаціями.
На відео, що опублікували Open AI, видно, що ШІ здатен визначити за піднятим королівським штандартом, чи знаходиться король Чарльз ІІІ у Букінгемському палаці та поговорити про те, як качки плавають у озері.
GPT-4o буде доступна усім безкоштовно із 13 травня, але доступ до голосових функцій з’явиться лише у невеликої кількості “довірених партнерів”. У червні, як передбачається, його отримають платні підписники.
Як розповідало BitukMedia, Даян Белон навіть не підозрювала, що технологія ШІ одного дня врятує їй життя. У 62-річної жінки діагностували найсмертоносніший у світі вид раку на багато років вперед завдяки аналізу крові за допомогою ШІ.