Мовна модель GPT-4 від OpenAI склала тест Тюрінга. Він оцінює, наскільки здатність машини демонструвати інтелект не відрізняється від людської. 54% учасників експерименту повірили, що розмовляють з реальною людиною. Хоча для успішного проходження вистачило б і 30%. Тест провели дослідники з Інституту інженерів електротехніки та електроніки США (IEEE).
Про це розповідає портал LiveScience.
Інститут інженерів електротехніки та електроніки (IEEE) провів тест Т’юрінга, щоб оцінити, наскільки сучасні моделі штучного інтелекту можуть імітувати людське спілкування.
Йдеться про тест, запропонований англійським вченим Аланом Тюрінгом у 1950 році. Він залишається ключовим інструментом для визначення здатності машини демонструвати інтелектуальну поведінку, яка не відрізняється від людської. За умовами тесту, якщо випробовуваний неспроможний відрізнити машину від людини, машина вважається такою, що склала тест і здатної до мислення. Тест вважається складеним, якщо понад 30% “суддів”, ставлячи запитання машині, сплутають її з людиною.
У тесті взяли участь пів тисячі людей. Вони спілкувалися з чотирма “співрозмовниками”: лише один з них був реальною людиною, решта — моделями штучного інтелекту (ШІ). Крім GPT-4, в експерименті також пройшли перевірку ELIZA 1960-х років та GPT-3.5.
Програму ELIZA, в основі якої немає великої мовної моделі або нейромережі, сприйняли за людину лише 22% учасників. GPT-3.5 набрав 50%. Людина була розпізнана як людина 67% учасників. Серед ШІ-моделей найбільше відсотків (54%) набрала GPT-4, заявлена в березні 2023 року.
За словами Елеонори Вотсон, дослідниці штучного інтелекту з IEEE, сучасний Штучний Інтелект дедалі частіше демонструє поведінку, властиву людині. Зокрема, нейромережі здатні на маніпуляції та навіть навмисний обман.
“Всі ці елементи означають, що людські слабкості та чудасії відображаються в системах ШІ, що робить їх більш схожими на людину, ніж попередні ШІ, які володіли трохи більше ніж списком готових відповідей”, — зазначила Вотсон. Вона також додала, що експеримент показує, як сильно змінився штучний інтелект в епоху GPT.
Разом з тим, на думку вчених, існують обґрунтовані критичні зауваження щодо тесту Тюрінга, мовляв, він надто спрощений, а “стилістичні та соціально-емоційні фактори відіграють важливішу роль у проходженні тесту Тюрінга, ніж традиційні уявлення про інтелект”.
Як розповідало раніше BitukMedia, дослідники з Массачусетського технологічного інституту створили чат-бот на основі штучного інтелекту, який імітує свого користувача у старшому віці. Вони вважають, що “спілкування” з 60-річним собою змінить уявлення молоді про своє здоров’я, гроші та роботу.