Bbabo NET

Znanost & Tehnologija Novice

xAI je predstavil nevronsko mrežo Grok-1.5 Vision (Grok-1.5V), ki lahko dela s slikami

Podjetje xAI Elona Muska je predstavilo Grok-1.5 Vision, novo različico nevronske mreže Grok. Orodje lahko obdeluje ne le besedilo, ampak tudi vizualne informacije: fotografije, posnetke zaslona, ​​diagrame in še veliko več.

Glede na xAI lahko Grok-1.5V pretvori fotografijo diagrama poteka v kodo Python ali posnetek zaslona tabele v datoteko CSV. Lahko bi jo tudi prosili, naj pove pravljico na podlagi otroške risbe ali razloži meme.

xAI trdi, da ta multimodalni model izstopa med svojimi primerki (GPT-4V, Claude 3Sonnet, Claude 3 Opus in Gemini Pro 1.5) in prekaša tekmece v številnih priljubljenih merilih zaradi uporabe tehnologije RealWorldQA. Nevronska mreža je bila trenirana na več kot 700 slikah, ki so jih spremljala vprašanja in odgovori na vsako temo.

Konec marca je xAI izdal Grok-1.5, ki lahko obravnava do 128.000 žetonov, kar chatbotu omogoča izvajanje bolj zapletenih poizvedb in boljše razumevanje dohodnih podatkov.

"[Grok-1.5 je sposoben] uporabljati informacije iz veliko večjih dokumentov," piše X.ai. "Poleg tega lahko model obravnava bolj zapletene poizvedbe, medtem ko ohranja zmožnost sledenja navodilom, ko se kontekstno okno razširi."

Aprila je Elon Musk dejal, da je bilo za usposabljanje klepetalnega robota Grok 2 uporabljenih približno 20 tisoč grafičnih procesorjev Nvidia H100 AI, nova generacija Grok 3 pa bo zahtevala 100 tisoč grafičnih procesorjev.

xAI je predstavil nevronsko mrežo Grok-1.5 Vision (Grok-1.5V), ki lahko dela s slikami