O Google DeepMind har precis släppt sitt senaste projekt i världen av artificiell intelligens: Ande, Generativa interaktiva miljöer (Generativa interaktiva miljöer), som lovar att skapa verkligt spelbara spel baserat på bilduppmaningar. Se hur det fungerar:
Vad är Genie?
Den nya AI av Google skapar spel med kontrollerbara åtgärder, såväl som en hel interaktiv miljö från bara ett foto eller en teckning. Enligt företaget kan den här bilden vara av något som finns i den verkliga världen - till exempel ett objekt - eller skapad av något annat AI-verktyg som omvandlar text till en bild.
Detta skapar ett stort prejudikat för spelvärldens framtid, eftersom det skulle möjliggöra skapandet av spel med avancerade kontroller på mycket kortare tid, förutom möjligheten att decentralisera processen ytterligare, ge amatörspelskapare fler möjligheter och jämna ut tävling..
I själva verket, hypotetiskt sett, kan verktyget gå mycket längre än så och generera omedelbara virtuella världar, med hyperrealistiska simuleringar.
Företaget uppger också att det kommer att vara möjligt att skapa spel från ritningar, från de mest sofistikerade som gjorts av proffs med hjälp av verktyg som t.ex. Adobe Illustrator även teckningar skapade av barn eller handgjorda skisser.
"Under de senaste åren har vi sett framväxten av generativ AI, med modeller som kan generera nytt och kreativt innehåll genom språk, bilder och till och med videor...Idag introducerar vi ett nytt paradigm för generativ AI, generativa interaktiva miljöer: Genie".
Google DeepMind
Hur Genie skapar spel
O Ande Det kan skapa en hel kontrollerbar värld med bara en bild, och enligt modeller som presenteras av företaget är material med bra definition inte ens nödvändigt för att AI ska fungera.
Utbildad från en uppsättning onlinevideor snarare än aktieetiketter, denna nya spel-AI från Google fokuserat på att lära sig 2D-plattformsspel och robotik på sina mer än 200.000 11 timmar data och tränade XNUMX miljarder världsmodeller. En annan anmärkningsvärd funktion av den nya Google Genie är att simulera deformerbara föremål, och företaget tror att det kan bli en tränare för generalistiska AI-agenter i framtiden.
"...på ett oövervakat sätt lär Genie sig flera latenta handlingar som kontrollerar karaktärer på ett konsekvent sätt."
Tim Rocktäschel, utvecklare av Google DeepMind uppgav i Twitter.
Tim Rocktaschel, även angett i hans redogörelse den Twitter (Eller X) att AI Ande kan skapa olika banor från den initiala ramen och fokus för denna skapelse är "action" – en punkt som är verktygets största differentiator, som vi ännu inte har sett ens i AI-verktyg som sora, meddelade också denna månad.
Tim betonade också att inlärningsprocessen av Genie AI gjordes på ett helt oövervakat videosätt, med en typ av temporärt videomedveten kanaliserare för att komprimera videor till intuitiva dataenheter, en latent verkan (latenta åtgärder) som kodar övergångar från 2 bildrutor till en av 8 latent verkan och MaskGIT dynamikmodell som förutsäger framtida ramar.
Enligt YouTuber Wes Roth i videon ovan, gör den latenta åtgärden som används en process för att förstå vilka typer av åtgärder som vidtogs mellan 2 ramar av video. Därför, om en karaktär dyker upp i en bildruta på marken och i den andra han är i luften, förstår han att handlingen som inträffade mellan dem är anledningen till att han hoppade. Dynamikmodellen MaskGIT används för att förutsäga vad som hände efter handlingen, det vill säga om en tv-spelkaraktär hoppar från en klippa, kommer han förmodligen att falla, fortsätta sin bana, men falla till marknivån där han hoppade.

Exempel
A Deepmind och hans medarbetare publicerade till och med några exempel på prompter med din nya artificiella intelligens:

Tillgänglighet
O Google Genie Det är ett verktyg under utveckling och är ännu inte tillgängligt för allmänheten. Företaget lämnade ingen prognos för sin ankomst på marknaden.
Detta verkar vara det mest innovativa AI-verktyget som skapats av Google, eftersom det kan vara nyckeln till att ta bort en idé från papper och omvandla den till något kortfattat och interaktivt på bara några ögonblick. Det nya verktyget, enligt vad som presenterades i denna första produktdemo, är vad vi förväntade oss av en teknikjätte som Google. Nu behöver vi bara veta om hon kommer att överleva förväntningarna!
Om du letar efter mer information om världen av artificiell intelligens rekommenderar vi Denna artikel som förklarar i detalj vad det är, huvudtyperna, framsteg inom området med mera.
Se också
källor: Google DeepMind e X.
Granskats av Glaucon Vital den 27/2/24.
Upptäck mer om Showmetech
Registrera dig för att få våra senaste nyheter via e-post.