Apple haben eine Methode zur schnellen und effektiven Erstellung von 3-tägigen Szenen mithilfe künstlicher Intelligenz vorgestellt.
Apple und die Hongkong Universität stellen die Technologie LGTM vor – effizientere Darstellung von 3‑D-Szenen
Wissenschaftler von Apple in Zusammenarbeit mit Forschern der Hongkong Universität entwickelten ein System namens LGTM (Less Gaussians, Texture More). Es ermöglicht eine erhebliche Verbesserung der Bildqualität bei hochauflösenden dreidimensionalen Räumen ohne Erhöhung der Rechenressourcen.
Wie funktioniert LGTM
1. Aufteilung der Komplexität
Traditionelle Methoden zur Darstellung von 3‑D-Szenen, die auf Gaußfunktionen oder anderen Ansätzen basieren, erfordern einen quadratischen Anstieg der Kosten bei höherer Auflösung. LGTM „trenn“ die geometrische Struktur einer Szene von ihren visuellen Details.
2. Zwei Trainingsschritte
* Im ersten Schritt baut das Modell eine einfache Geometrie (Rahmen) aus Bildern niedriger Auflösung auf.
* Im zweiten Schritt vergleicht es den Rahmen mit originalen hochqualitativen Bildern und lernt anschließend, detaillierte Texturen zu erzeugen, die über den einfachen Rahmen gelegt werden.
3. Ergebnis
Bei Renderings in 2 K und 4 K erhalten wir ein genaues Ergebnis ohne Artefakte und „leere“ Bereiche, während die Ressourcen nicht quadratisch wachsen.
Praktische Bedeutung
* VR/AR – Die Technologie ist besonders nützlich für Systeme der virtuellen und erweiterten Realität.
* Apple Vision Pro hat eine Gesamtauslösung von 23 Megapixeln, was normalerweise enorme Rechenleistung erfordert. LGTM ermöglicht die Wiedergabe detaillierter Szenen in 4K ohne solchen Ressourcenanstieg, wodurch ein flüssigeres und qualitativ hochwertigeres Erlebnis möglich wird.
Damit stellt LGTM einen bedeutenden Fortschritt im Rendern hochqualitativer 3‑D-Szenen dar und bleibt dabei recheneffizient.
Kommentare (0)
Teile deine Meinung — bitte bleib höflich und beim Thema.
Zum Kommentieren anmelden