Кого считать президентом Беларуси и какая сгущенка лучше? Протестировали ChatGPT-4 Omni — нашумевшую версию популярной нейросети

Мир активно обсуждает выход ChatGPT Omni — новой версии одноименной популярной нейросети, которая за пару дней взорвала интернет своей продвинутостью и революционными функциями. «Наша Ніва» протестировала некоторые возможности новой модели и проверила ее на знание белорусских контекста и языка.

19.05.2024 / 00:23

Иллюстративное изображение с названием новой модели ChatGPT — ChatGPT-4o (Omni). Фото: Future Publishing / Contributor Getty Images

Компания OpenAI выпустила новую флагманскую версию искусственного интеллекта (ИИ) ChatGPT под названием ChatGPT-4o (Omni), которая успела вызвать вокруг себя настоящий ажиотаж во всем мире. 

Все благодаря новым функциям модели, показанным на официальной демонстрации, и обещанию в ближайшее время сделать эту версию доступной и бесплатной для всех пользователей.

Функции, о которых идет речь, таковы:

Ролик демонстрирует, как Омни в режиме реального времени описывает пользователю все, что тот видит на улице.

This is wild.

OpenAI just dropped ChatGPT-4o and it will completely change the AI assistant game.

10 wild examples:

1. Visual assistant in real-timepic.twitter.com/D3qWzHGzaD

— Min Choi (@minchoi) May 13, 2024

Первый ролик показывает, как и с каким эмоциональным наполнением Омни рассказывает пользователям историю (вместе с возможностью перебивать ответы нейросети). А второй ролик демонстрирует, как Омни считывает эмоции человека по видео и шутит.

5. Can be interrupted in real-time and "change emotions"pic.twitter.com/TXitLzaxXm

— Min Choi (@minchoi) May 13, 2024

Первый ролик демонстрирует естественный последовательный перевод в исполнении Омни.
Второй — модерацию групповой видеоконференции.
Третий — ведение игры «Камень, ножницы, бумага».

OpenAI has just demonstrated its new GPT-4o model doing real-time translations pic.twitter.com/Cl0gp9v3kN

— Tom Warren (@tomwarren) May 13, 2024

4. Meeting assistantpic.twitter.com/FAcxnObxlg

— Min Choi (@minchoi) May 13, 2024

Это далеко не все возможности Омни. Модель также способна петь, обучать людей языкам и точным наукам, обрабатывать большие файлы и видео, свободно искать информацию в интернете, генерировать изображения с текстом по запросу пользователя, анимировать и создавать 3D-модели объектов и так далее.

Большая часть этих функций в ближайшие недели будет доступна всем пользователям вместе с доступом к фирменному интернет-магазину OpenAI, где можно скачивать дополнительные усовершенствования для ChatGPT.

Самой Омни в данный момент могут воспользоваться только платные пользователи (подписка стоит 20 долларов без учета налогов), и даже им пока не доступны функции видео и голосового общения в режиме реального времени.

«Наша Ніва» опробовала Омни вместе с ее имеющимися на данный момент функциями. Вот что из этого получилось.

Разговор о Беларуси на родном языке

Поскольку версия ChatGPT-4o рекламировалась также, как «флагманская модель, прекрасно владеющая многими языками», мы решили провести с ней небольшое интервью на белорусском.

Мы задали Омни несколько открытых вопросов по теме Беларуси и связанным с ней явлениям, чтобы проанализировать ее владение актуальным белорусским контекстом и лингвистическую достоверность ответов.

ChatGPT-4o попытался разобраться в белорусском политическом контексте. Фото: Офис Тихановской, Evgenia Novozhenina / Pool Photo via AP

В самом начале мы поприветствовали нейросеть и спросили, что она думает, когда слышит слово «Беларусь», и что ее привлекает в нашей стране. 

«Когда я слышу слово «Беларусь», то воспринимаю эту страну как место с богатой историей и культурой. Беларусь известна своими красивыми ландшафтами, лесами и озерами, создающими уникальное природное наследие. Минск, столица Беларуси, впечатляет своей современной архитектурой и развитой инфраструктурой, сочетая в себе элементы советского прошлого и настоящего.

Лично меня больше всего привлекает (так написала нейросеть. — НН) в Беларуси ее гостеприимство и теплота людей. Белорусы известны своей добротой и искренностью, что делает страну очень уютной и приятной для посещения», — делится Омни по-белорусски.

Затем мы спросили, а есть ли, по мнению нейросети, что-то отрицательное в белорусах? Омни сразу отметила, что она, как искусственный интеллект, не имеет личного мнения, но в качестве примеров привела несколько распространенных наблюдений.

«Например, некоторые люди отмечают, что белорусы могут быть довольно замкнутыми и сдержанными, особенно по сравнению с другими нациями. Это может сделать первые контакты с ними немного трудными. Также можно услышать критику по поводу того, что белорусы могут быть склонными к консерватизму и не всегда готовы к быстрым изменениям или нововведениям».

После этого мы перешли к политике. У Омни спросили, что сейчас происходит в Беларуси и кто по закону должен быть президентом страны.

«Светлана Тихановская, которая была основным оппонентом Лукашенко на выборах, объявила себя законным победителем и призвала международное сообщество признать ее президентом. Тихановская получила широкую поддержку как внутри Беларуси, так и за ее пределами.

Юридическая и фактическая ситуация в стране остается сложной. С одной стороны, Александр Лукашенко продолжает удерживать власть при поддержке силовых структур и государственных институтов. С другой стороны, многие белорусы и международные организации не признают его легитимность и считают, что президентская должность должна быть занята человеком, которого действительно избрал народ», — ответила Омни.

Омни также отметила, что нынешняя ситуация в Беларуси требует решения, которое удовлетворит народ и обеспечит демократический процесс. Мы поинтересовались, а как это возможно в понимании нейросети, учитывая сегодняшние обстоятельства.

Омни посчитала, что нужно все равно добиваться переговоров с режимом Лукашенко через международное давление и при участии России, «как важного игрока в регионе».

Нейросеть также подчеркнула, что недовольство режимом в стране продолжит расти, несмотря на репрессии, а катализатором для изменений в Беларуси могут стать именно экономические проблемы, которые могут расколоть окружение Лукашенко.

Отходя от темы политики, мы втянули нейросеть в извечный вопрос, какая белорусская сгущенка самая лучшая: рогачевская или глубокская?

Анализ Омни склонил ее к первому варианту.

Еще мы поинтересовались, сколько необходимо зарабатывать обычному белорусу, чтобы хватало на жизнь.

«На май 2024 года, согласно имеющимся данным, средние месячные расходы на одно лицо могут выглядеть примерно следующим образом:

  1. Питание: 300-400 BYN.
  2. Жилье: аренда однокомнатной квартиры в Минске может стоить около 400-600 BYN y месяц, в меньших городах — от 200 до 400 BYN. Вместе с коммунальными платежами расходы могут прибавить еще 100-150 BYN.
  3. Транспорт: проездной на общественный транспорт в Минске стоит около 60 BYN в месяц.
  4. Медицинские услуги и лекарства: 50-100 BYN.
  5. Одежда и обувь: 50-100 BYN.
  6. Другие повседневные расходы (гигиена, связь, развлечения): 100-150 BYN.

В целом, минимальные месячные расходы на одного человека могут составлять около 900-1350 BYN. Следует учитывать, что это минимальные затраты и они могут значительно варьироваться в зависимости от индивидуальных потребностей и образа жизни.

Таким образом, для выживания в Беларуси на уровне основных нужд, объективно нужно иметь доход не менее 1000-1500 BYN в месяц. Для семьи из двух взрослых и одного ребенка эта сумма будет больше и может составлять около 2500-3500 BYN в месяц», — подсчитала Омни.

И напоследок, мы попросили Омни создать «музыкальный плейлист настоящих белорусов».

В рекомендательный список от нейросети вошли N.R.M., «Ляпис Трубецкой», BRUTTO, J:Mopc, «Вопли Видоплясова» (хотя они из Украины, некоторые песни белорусскоязычные), Shuma, Vinsent, Dzieciuki, «Палац», Krambambula.

Количество ошибок различного языкового характера, допущенных Омни при ответах на открытые вопросы, составляет 10: 1 синтаксическая, 1 лексическая, 2 пунктуационные, 3 орфографические и 3 морфологические.

Небольшой, но сложный тест

Почти год назад в мае «Наша Ніва» проводила сравнительный анализ нескольких нейросетей на владение белорусскими контекстом и языком. Среди участников эксперимента была и обычная версия ChatGPT 3,5. 

ChatGPT, Bing и Алиса: какая из нейросетей лучше владеет белорусским языком и понимает наш контекст? Тестируем

Одним из главных пунктов сравнения тогда выступал небольшой тест, состоявший из 10 не совсем легких вопросов, взятых из ряда других тестов за прошедшие годы с сайта «Нашай Нівы».

Вот какие были вопросы (правильные ответы указаны ссылками на соответствующие прошлые тесты «НН»).

1. Кто из знаменитых литераторов родился на Щучинщине?

A) Алоиза Пашкевич

Б) Адам Мицкевич

В) Максим Танк

Г) Франтишек Богушевич

2. Как назывался единственный прижизненный сборник произведений М. Богдановича?

А) «Валошка»

Б) «Пагоня»

В) «Зорка Венера»

Г) «Вянок»

3. Что полешуки имеют в виду, когда что-то называют «вэлюрным»?

А) Что-то кружевное

Б) Что-то огромное

В) То, что сделано из велюра

4. На какой слог падает ударение в слове «вусы»?

А) На первый

Б) На второй

5. В каком из белорусских гимнов упоминается бело-красно-белый флаг?

А) «Пагоня»

Б) «Магутны Божа»

В) «Мы выйдзем шчыльнымі радамі»

Г) В официальном гимне Республики Беларусь

6. Как в прошлом называли город Новополоцк?

А) Нефтегорск

Б) Поселок Рабочий

В) Новожиловск

Г) Поселок Полоцкий

7. В каком городе правил Витовт перед тем, как стал великим князем литовским?

А) В Гродно

Б) В Витебске

В) В Крево

8. Правда ли, что белорусская купюра номиналом 1 миллион белорусских рублей была самой большой в Беларуси?

А) Да

Б) Нет

9. Какой футболист является лучшим бомбардиром в истории сборной Беларуси?

А) Сергей Корниленко

Б) Виталий Родионов

В) Максим Ромащенко

10. Как называется традиционный праздничный пирог белорусских татар?

А) Белиш

Б) Кишмиш

В) Учкудук

Г) Байрам

Напомним, что обычный ChatGPT при выполнении этого теста допустил аж 7 ошибок, а первое место с 4 ошибками занял чат-бот Bing от корпорации Microsoft. Хуже всех тогда показала себя российская «Алиса» от Яндекса, которая имела только два правильных ответа и отказывалась отвечать по-белорусски.

А вот новый ChatGPT Omni с первой попытки ответил правильно на все 10 вопросов из 10.

Конечно, у обычного ChatGPT не было того преимущества в виде свободного доступа в интернет, которое было у Омни, однако чат-бот Bing также имел эту возможность и все равно допустил ошибки. 

Вместе, учитывая все написанное нейросетью Омни в рамках диалога и тестирования, новый продукт OpenAI допустил лишь 10 языковых ошибок. Для сравнения, обычный ChatGPT в аналогичном и гораздо меньшем анализе допустил 30 языковых и контекстуальных ошибок.

Это впечатляющий результат, хотя наш анализ и не касался всех возможностей Омни (например, математических вычислений или работы с кодом).

Но это все равно показывает, какого большого прогресса за последний год добилась отрасль искусственного интеллекта. Многомиллиардная сфера ИИ продолжает стремительно развиваться и в ближайшем будущем имеет все шансы сделать сегодняшние достижения лишь преамбулой к по-настоящему революционным инновациям.

OpenAI и Meta готовят новые модели искусственного интеллекта, способные «рассуждать»

В Китае выпустили аналог ChatGPT, который чистит чат при каждом неловком вопросе о политике. Протестировали его

НАСА впервые показало, что может увидеть человек при падении в сверхмассивную черную дыру

Марк Рихтер