Egy új mesterséges intelligencia másodpercek alatt készít 3D-s képeket fotóinkból

Volt idő, amikor egy régi fénykép digitális képpé alakítása lenyűgözte az embereket. Manapság pedig már ennél is sokkal többre vagyunk képesek, például egy mesterséges intelligencia segítségével életre is kelthetjük őket.



Korábbi munkájukra építve az NVIDIA kutatói megmutatták, hogy egy tucat képen betanított kis neurális hálózat hogyan képes a fotón látható jelenetet teljes 3D-ben megjeleníteni. A csapat demóként egy Polaroid fényképezőgépet tartó modell képeit alakította át 3D-s jelenetté.

Ez a projekt pedig több okból is figyelemre méltó. Először is, rendkívül gyors. A korábbi mesterséges intelligencia modellek betanítása órákat vett igénybe, a 3D-s jelenetek renderelése pedig perceket.

Az NVIDIA neurális hálózatának a betanítása nem vesz igénybe több mint néhány percet, a jelenetet pedig tízezredmásodpercek alatt rendereli le.

Másodszor, maga a mesterséges intelligencia parányi a mai hatalmas nyelvi modellekhez képest. A GPT-3-hoz hasonló nagy modellek több száz vagy több ezer grafikus feldolgozóegységen (GPU) képződnek. Az NVIDIA képmegjelenítő mesterséges intelligenciája egyetlen GPU-n fut.

Így az NVIDIA blogbejegyzése szerint az algoritmus akár 1000-szer gyorsabban fut, anélkül, hogy a minőséget feláldozták volna.

Az NVIDIA elképzelései szerint a technológia a robotok és az önvezető autók között is helyet kaphat, segítve őket abban, hogy jobban vizualizálják és megértsék az őket körülvevő világot. Arra is felhasználható lenne, hogy a virtuális világokba importálható, nagy valósághű avatárokat készítsenek, vagy hogy a digitális világban valós jeleneteket másoljanak le, amelyeket a tervezők módosíthatnak és továbbfejleszthetnek.

Ilyen esetekben a neurális hálózatok sebessége és mérete is számít, mivel a hatalmas algoritmusokat, amelyek hatalmas mennyiségű számítási teljesítményt igényelnek, a legtöbb ember nem tudja használni, és a felhővel való villámgyors és megbízható kapcsolat nélkül a robotok és autók számára sem praktikusak.

A bemutató az NVIDIA e heti fejlesztői konferenciájának része volt. A többi kiemelt esemény között szerepelt egy önvezető autókhoz készült rendszer, amelynek célja, hogy 2024-re 300 ezer mérföldnyi utat térképezzen fel centiméteres pontossággal, valamint egy mesterséges intelligencia szuperszámítógép, amely a vállalat szerint a megjelenéskor a világ leggyorsabbja lesz. Ezt az állítást egyébként a Meta is elfogadta nemrég.

A digitális világ tehát átáramlik a valós világba, és fordítva. És nem csak könyvek, zenék, fényképek, dokumentumok és fizetések, hanem emberek, helyek és az infrastruktúra is. Mivel az NVIDIA chipjei kiválóak az AI és a grafika terén, a vállalat jó helyzetben van ahhoz, hogy mindebben szerepet vállaljon.

S nem elégednek meg az egyes helyszínek digitális másolatainak létrehozásával, hanem a Föld digitális ikertestvérét szeretnék megépíteni.

(Singularityhub)

A figyelmetekbe ajánljuk