Ein neues Patent, das diese Woche im Internet aufgetaucht ist, enthüllt, dass AMD eine leistungsstarke neue Innovation in der Beleuchtungstechnologie für seine Grafikprozessoren anstrebt.
Das Patent beschreibt das Design und die allgemeinen Ziele dieser neuen Technologie und offenbart einen interessanten Ansatz, mit dem AMD mit Nvidia konkurriert. AMD hat sich gegen Intel gewehrt, AMD wird sogar als harter Konkurrent angesehen, und nun scheint Nvidia an der Reihe zu sein. Mit der bevorstehenden Markteinführung der PS5 und der Scarlett Xbox erwarten die Gamer in der nächsten Konsolengeneration deutlich verbesserte Frameraten und eine bessere Bildqualität. Und es sieht so aus, als würde sich AMD darauf vorbereiten, genau das zu liefern.
Es handelt sich um einen sehr tiefgreifenden Prozess, der drei Hauptkomponenten umfasst, die alle um eine Kernpipeline herum aufgebaut sind, die die Verarbeitungslast auf dedizierte Hardware verteilt. Es gibt eine Shader-Einheit, die für die eigentliche Schattierung und die Verschönerung der Lichteffekte zuständig ist. Diese wird von einem Texturprozessor unterstützt, der die gesamte Hauptverarbeitung übernimmt, und schließlich von einem Cache zum Speichern und Organisieren der verarbeiteten Daten.
Der Texturprozessor (TP) ist eine unglaublich komplexe Mischung aus mehreren Teilen, die einen erstaunlichen Durchsatz erzielen können. Wenn Daten für eine Szene in den TP gepumpt werden, macht sich eine Handvoll Hardware- und Software-Tools an die Arbeit und weist der Szene Positionen für Texturen und Schattierungen zu.
Beim Ray Tracing werden die Pfade der Lichtstrahlen in einer Szene mit einer Technik abgebildet, die dem Textur-Sampling ähnelt, was zu mehr Realismus und Detailreichtum führt, obwohl es sich in der Regel um einen recht intensiven Prozess handelt. Außerdem gibt es einige Probleme mit dem Durchsatz und dem Overhead, die mit einer hardwarebasierten Lösung einhergehen. Aus diesem Grund entwickelt AMD die neue Technologie als eine Mischung aus Software und Hardware.
Die Details überlasse ich allerdings AMD selbst. Unten finden Sie eine ausführliche Beschreibung:
Der hybride Ansatz (feste Funktionsbeschleunigung für einen einzelnen Knoten des BVH-Baums und Verwendung einer Shader-Einheit zur Planung der Verarbeitung) löst die Probleme mit ausschließlich hardware- und/oder ausschließlich softwarebasierten Lösungen. Die Flexibilität bleibt erhalten, da die Shader-Einheit weiterhin die Gesamtberechnung steuern und die Hardware mit festen Funktionen bei Bedarf umgehen kann, ohne auf den Leistungsvorteil der Hardware mit festen Funktionen verzichten zu müssen. Außerdem entfallen durch die Nutzung der Infrastruktur des Texturprozessors große Puffer für die Strahlenspeicherung und das BVH-Caching, die in der Regel in einer Hardware-Raytracing-Lösung erforderlich sind, da die vorhandenen VGPRs und der Textur-Cache an ihrer Stelle verwendet werden können, was zu erheblichen Einsparungen bei Fläche und Komplexität der Hardware-Lösung führt.
Das System umfasst einen Shader, einen Texturprozessor (TP) und einen Cache, die miteinander verbunden sind. Der TP umfasst eine Texturadresseinheit (TA), einen Textur-Cache-Prozessor (TCP), eine Filter-Pipeline-Einheit und ein Strahlenschnittverfahren. Der Shader sendet eine Texturanweisung, die Strahldaten und einen Zeiger auf einen Bounded Volume Hierarchy (BVH)-Knoten enthält, an den TA. Der TCP verwendet eine von der TA bereitgestellte Adresse, um BVH-Knoten-Daten aus dem Cache zu holen. Die Strahlenschnittpunkt-Engine führt anhand der Strahlendaten und der BVH-Knotendaten Schnittpunkttests zwischen Strahlen und BVH-Knoten durch. Die Ergebnisse der Schnittpunktprüfung und Hinweise für die BVH-Traversierung werden über einen Texturdaten-Rückgabepfad an den Shader zurückgegeben. Der Shader prüft die Ergebnisse der Schnittpunktprüfung und die Hinweise, um zu entscheiden, wie zum nächsten BVH-Knoten verfahren werden soll.
Ein auf einem Texturprozessor basierendes Verfahren und System zur Beschleunigung der Strahlenverfolgung wird hier beschrieben. Eine Logik für die Prüfung von BVH-Schnittpunkten und deren Durchquerung (eine häufige und teure Operation in Raytracern) mit fester Funktion wird auf Texturprozessoren implementiert. Dadurch können die Leistung und die Energieeffizienz der Strahlenverfolgung erheblich verbessert werden, ohne dass hohe Flächen- und Arbeitskosten anfallen. Pfade mit hoher Bandbreite innerhalb des Texturprozessors und der Shader-Einheiten, die für die Texturverarbeitung verwendet werden, werden für die BVH-Schnittpunktprüfung und -überquerung wiederverwendet. Im Allgemeinen erhält ein Texturprozessor eine Anweisung von der Shader-Einheit, die Strahlendaten und BVH-Knotenzeigerinformationen enthält. Der Texturprozessor holt die BVH-Knotendaten aus dem Speicher, indem er z. B. 16 Doppelwort-Blöcke (DW) lädt. Der Texturprozessor führt vier Strahlen-Box-Schnittpunkte und Kindersortierung für Box-Knoten und einen Strahlen-Dreieck-Schnittpunkt für Dreieck-Knoten durch. Die Schnittergebnisse werden an die Shader-Einheit zurückgegeben.
Es gibt viele Spekulationen darüber, ob diese Funktion in die nächste Iteration der NAVI-GPUs integriert wird oder ob sie eine eigene GPU-Linie erhält. Es wird wahrscheinlich einige Zeit dauern, diese neue Beleuchtungstechnik zu entwerfen und zu entwickeln, auch wenn das Patent erst 2017 eingereicht wurde. Die RX 5700 XT und RX 5700 GPUs erscheinen nächsten Monat am 7. Juli. Diese High-End 7nm-GPUs bieten eine deutliche Leistungssteigerung, bei einem ziemlich steilen Preisanstieg.
AMD hat offenbar beschlossen, DXR Ray Tracing im PC-Bereich vorerst auszulassen, um die Technologie auf die nächste Generation von Spielkonsolen zu übertragen. Das erscheint seltsam, aber der allgemeine Konsens war, dass DXR auf dem PC noch etwas mehr Reife braucht, um auf dem PC alltäglicher zu werden. Die Idee scheint zu sein, dass Konsolen leichter so gestaltet werden können, dass sie die erforderlichen Leistungsziele erfüllen, die die PS5 und Xbox Scarlett benötigen. Hinzu kommt die Tatsache, dass viele PC-Spieler nicht dazu neigen, im oberen Preissegment einzukaufen, wo NAVI derzeit angesiedelt ist, da viele Leute nicht mehr als 300 Dollar für eine GPU ausgeben können oder wollen.
AMD wird die Iteration in den nächsten Jahren nutzen, da sie ihre Hardware- und Softwaretechnologie in ihren neuesten Mittel- und Oberklasse-GPUs und -CPUs langsam und stetig verbessern werden. Dies sollte dazu beitragen, die Preise zu senken, wenn DXR ausgereift ist, so dass es in Mittelklassekarten häufiger eingesetzt wird.
Quelle: FreePatentsOnline über AMD