Meta Марка Цукерберга анонсувала SeamlessM4T. Йдеться про мультимодальну модель штучного інтелекту для перекладу аудіо та тексту на 100 різних мов. Мета — допомогти носіям різних мов ефективніше спілкуватися один з одним.
Про це розповідає сайт Meta.
Згідно з анонсом компанії, нейронна мережа SeamlessM4T може обробляти до 100 мов.
Завдання SeamlessM4T – виконувати розпізнавання мовлення (ви даєте їй аудіозапис і вона перетворює його на текст), перекладати мовлення в текст (вона перекладає звук, що вимовляється, іншою мовою у вигляді тексту), перекладати аудіо в аудіо (ви завантажуєте в неї аудіозапис, і вона виводить вже перекладений текст), перекладати текст в текст (аналогічно тому, як працює Google Translate), а також інші функції, такі як переклад тексту в мовлення (введіть їй текст, і вона перекладе та вимовить його іншою мовою).
Кожна з функцій перекладу тексту підтримує близько сотні мов, а функції виведення підтримують близько 36 мов.
Нейромережу SeamlessM4T вже назвали майбутньою заміною синхронних перекладачів. Сама компанія порівнює свою модель з вавилонською рибкою з книг Дугласа Адамса “Автостопом по галактиці”.
Разом з тим, дослідники Meta попереджають, що продовжують вдосконалювати роботу нейромережі, тому поки що її переклади можуть містити неточності. Компанія не рекомендує використовувати SeamlessM4T для перекладу довгих форм та будь-яких документів, наприклад, тих, які визнаються державними установами та органами перекладу. Meta також не рекомендує використовувати SeamlessM4T для медичних та юридичних перекладів.
Компанія Meta відкрила доступ до демо-версії нейромережі для всіх бажаючих. Спробувати можна тут.
Як розповідало раніше BitukMedia, штучний інтелект навчили перетворювати гнівні повідомлення на ввічливі.