
Egy új mesterséges intelligencia másodpercek alatt készít 3D-s képeket fotóinkból
Korábbi munkájukra építve az NVIDIA kutatói megmutatták, hogy egy tucat képen betanított kis neurális hálózat hogyan képes a fotón látható jelenetet teljes 3D-ben megjeleníteni. A csapat demóként egy Polaroid fényképezőgépet tartó modell képeit alakította át 3D-s jelenetté.
Ez a projekt pedig több okból is figyelemre méltó. Először is, rendkívül gyors. A korábbi mesterséges intelligencia modellek betanítása órákat vett igénybe, a 3D-s jelenetek renderelése pedig perceket.
Az NVIDIA neurális hálózatának a betanítása nem vesz igénybe több mint néhány percet, a jelenetet pedig tízezredmásodpercek alatt rendereli le.
Másodszor, maga a mesterséges intelligencia parányi a mai hatalmas nyelvi modellekhez képest. A GPT-3-hoz hasonló nagy modellek több száz vagy több ezer grafikus feldolgozóegységen (GPU) képződnek. Az NVIDIA képmegjelenítő mesterséges intelligenciája egyetlen GPU-n fut.
Így az NVIDIA blogbejegyzése szerint az algoritmus akár 1000-szer gyorsabban fut, anélkül, hogy a minőséget feláldozták volna.
Az NVIDIA elképzelései szerint a technológia a robotok és az önvezető autók között is helyet kaphat, segítve őket abban, hogy jobban vizualizálják és megértsék az őket körülvevő világot. Arra is felhasználható lenne, hogy a virtuális világokba importálható, nagy valósághű avatárokat készítsenek, vagy hogy a digitális világban valós jeleneteket másoljanak le, amelyeket a tervezők módosíthatnak és továbbfejleszthetnek.
Ilyen esetekben a neurális hálózatok sebessége és mérete is számít, mivel a hatalmas algoritmusokat, amelyek hatalmas mennyiségű számítási teljesítményt igényelnek, a legtöbb ember nem tudja használni, és a felhővel való villámgyors és megbízható kapcsolat nélkül a robotok és autók számára sem praktikusak.
A bemutató az NVIDIA e heti fejlesztői konferenciájának része volt. A többi kiemelt esemény között szerepelt egy önvezető autókhoz készült rendszer, amelynek célja, hogy 2024-re 300 ezer mérföldnyi utat térképezzen fel centiméteres pontossággal, valamint egy mesterséges intelligencia szuperszámítógép, amely a vállalat szerint a megjelenéskor a világ leggyorsabbja lesz. Ezt az állítást egyébként a Meta is elfogadta nemrég.
A digitális világ tehát átáramlik a valós világba, és fordítva. És nem csak könyvek, zenék, fényképek, dokumentumok és fizetések, hanem emberek, helyek és az infrastruktúra is. Mivel az NVIDIA chipjei kiválóak az AI és a grafika terén, a vállalat jó helyzetben van ahhoz, hogy mindebben szerepet vállaljon.
S nem elégednek meg az egyes helyszínek digitális másolatainak létrehozásával, hanem a Föld digitális ikertestvérét szeretnék megépíteni.
Nyitókép: Shutterstock