Адказ Google на GPT-4: ШІ-мадэль Gemini пазіцыянуецца як «самая здольная мадэль, якую мы калі-небудзь стваралі»
Кампанія плануе ўключыць новую мадэль штучнага інтэлекту ва ўсе свае прадукты, пачынаючы з чат-бота Bard.
Гегемонія кампаніі OpenAI у сферы генератыўнаага штучнага інтэлекту, магчыма, падыходзіць да завяршэння. У пачатку снежня Google афіцыйна прадставіў сваю самую здольную на сёння моўную мадэль пад назвай Gemini 1.0, якая пазіцыянуецца як першая з «новага пакалення мадэляў ШІ, натхнёных тым, як людзі разумеюць свет і ўзаемадзейнічаюць з ім».
Падчас прэзентацыі было сказана шмат гучных слоў пра ўсе перадавыя «навароты», якія, па словах прадстаўнікоў кампаніі, робяць Gemini «самай сучаснай ШІ-мадэллю амаль ва ўсіх сферах». Сістэма была распрацаваная як «інтэграваны мультымадальны штучны інтэлект».
Многія сённяшнія ШІ-мадэлі могуць складацца з груп меншых мадэляў, прычым кожная асобная мадэль навучаная выконваць сваю спецыфічную функцыю як частка большага цэлага. Усё гэта добра для «неглыбокіх» функцый (напрыклад, для апісання малюнкаў), але не вельмі добра пасуе для складаных задач мыслення.
Gemini ж была з самага пачатку навучаная і наладжаная на «розных мадальнасцях», што дазволіла мадэлі «плаўна разумець і разважаць пра ўсе віды ўваходных даных з нуля, значна лепш, чым наяўныя мультымадальныя мадэлі», перадае словы прадстаўнікоў Google выданне Engaget. Магчымасць прымаць розныя формы даных адначасова павінна дапамагчы Gemini даваць лепшыя адказы на больш складаныя тэмы кшталту, напрыклад, фізікі.
Заяўляецца таксама, што Gemini ўмее кадзіраваць: мадэль валодае папулярнымі мовамі праграмавання, уключаючы Python, Java, C++ і Go. Google нават выкарыстаў спецыялізаваную версію Gemini для стварэння AlphaCode 2, пераемніка леташняга генератыўнага ШІ, які перамог у спецыялізаваным конкурсе. Як сцвярджаюць у кампаніі, AlphaCode 2 вырашыў удвая больш праблемных пытанняў, чым яго папярэднік, што павысіла ягоную прадукцыйнасць больш чым на 85 адсоткаў у параўнанні з іншымі удзельнікамі конкурсу.
Хаця Google не адразу падзяліўся колькасцю параметраў, якія Gemini можа выкарыстоўваць, кампанія рэкламавала аперацыйную гнуткасць мадэлі і здольнасць працаваць у розных форм-фактарах: ад вялікіх цэнтраў апрацоўкі даных да лакальных мабільных прылад. З гэтай мэтай Gemini выпускаецца ў трох памерах: Nano, Pro і Ultra.
Nano з'яўляецца самай маленькай з трыо і прызначаная ў асноўным для задач на прыладах. Версія Pro — больш універсальная і здольная прапанова — неўзабаве будзе інтэграваная ў многія з наяўных прадуктаў Google, у тым ліку ў чат-бот Bard. Неўзабаве Bard пачне выкарыстоўваць спецыяльна наладжаную версію Gemini Pro, якая, як абяцае кампанія, будзе прапаноўваць «больш прасунутыя развагі, планаванне, разуменне і многае іншае».
У наступным годзе, з выхадам Gemini Ultra, Google таксама прэзентуе Bard Advanced — яшчэ мацнейшы ШІ з дадатковымі функцыямі. Ultra не будзе даступны прынамсі да 2024 года, паколькі патрабуецца дадатковае тэставанне. Але калі ён з'явіцца, Ultra абяцае стаць неверагодна магутным для далейшага развіцця ШІ, абяцае кампанія.
Каментары