CD LABS: Radon Project
Lötkolbengott/-göttin
Naja, es gibt ja durchaus mehr Erklärungsansätze als bloße Notwendigkeit. Ein Dual-DIE-Aufbau kann auch schlicht und ergreifend günstiger sein. Also in der praktischen Fertigung wird das sogar ziemlich sicher der Fall sein:An eine Kombination aus 2 kleineren Dies hab ich bislang noch nicht gedacht, glaube ich aber in der Gen (weil es noch nicht notwendig ist immer noch nicht).
Bei B200 sind es ja zwei Chips mit ~800mm² und damit jeweils Chips am ReticleLimit. Da ist eindeutigerweise, wie du auch schon gesagt hast, der Dual-DIE-Aufbau notwendig. Eine Kostenfrage stellt sich nicht, es geht schlicht und ergreifend nicht anders. Aber: Das ist natürlich insgesamt teuer.
Mal hingegen ein Szenario zum Sparen von Geldern durch DualDIE, jetzt einfach ausgegangen vom AD103 mit seinen 379mm² vs. 609mm² vom AD102: Wahrscheinlich sind (bei ähnlicher Chipqualität) bereits zwei AD103er günstiger zu haben als ein AD102er. Einfach ausgegangen von den gängigen Rechnern bzgl. Defektrate und Ausbeute bei Wafern. Günstiger als ein hypothetischer AD100, der einfach ein verdoppelter AD103er gewesen wäre und das ReticleLimit ziemlich ausgereizt hätte, ist er allemal.
Wieso hat es Nvidia nicht gemacht? Na, weil sie noch keinen Dual-DIE-Aufbau entwickelt hatten. Der wurde jetzt aber anscheinend entwickelt --- und entsprechend naheliegend ist es auch, ihn noch ein weiteres Mal (in abgespackter Weise) zu verwenden.
Diese Aufstellung würde es attraktiv machen, eben allen Fokus auf den GB203 zu legen. Vollausbauten würden in die 5080 wandern, teildefekte Chips würden für die 5090 verwendet werden. Der volle Verbund aus zwei GB203ern könnte sowohl (wie schon erwähnt) für eine neue Titan-Karte verwendet werden, als auch als in (vergleichsweise) in Masse hergestellter Lückenfüller für den AI-Markt.
Ich gehe schwer davon aus, dass gute Skalierung bei Raytracing weiterhin gegeben sein wird. Da bin ich voll bei dir. Bzgl. Rasterizer: Keine Ahnung. Wir haben ja bislang mit der 4090 nur einen sehr harten Salvage vom AD102 im Rasterizer-Einsatz gesehen. Kann gut sein, dass ein Vollausbau oder ein merkwürdiger Mischmasch (insbesondere mit vollem Cacheausbau) die Probleme nicht hätte.Den einzigen Performancesprung den ich erwarte ist in Sachen Raytracing:
Während die 4090 so pi mal Daumen 75% mehr Raster-Hardware hat wie die 4080 bringt sie davon nur 30% auf die Straße. Entweder ein Bottleneck oder Rastern skaliert nicht mehr. Dann ist man also am Ende angelangt und es hilft eigentlich gar nichts mehr, mehr Rasterleistung zu verbauen. Sehr wohl aber mehr RT Units, die aktuell eh nur einen sehr kleinen Teil des Chips "fressen", hier ist also schnell Leistungssteigerung möglich