RTX 5090性能測(cè)試還不及4090!原因終于找到了
3月4日消息,試還前不久我們報(bào)道了關(guān)于NVIDIA新一代RTX 50系列在PassMark的不及測(cè)試排行榜上還不如上代產(chǎn)品,比如RTX 5090就沒(méi)能超過(guò)RTX 4090。原因
而PassMark的終于找調(diào)查揭示了這一問(wèn)題的根源:NVIDIA在其“Blackwell”架構(gòu)中停止了對(duì)32位OpenCL和CUDA的支持,導(dǎo)致與現(xiàn)有測(cè)試工具和應(yīng)用程序存在兼容性問(wèn)題。試還
PassMark的不及測(cè)試結(jié)果顯示,當(dāng)運(yùn)行DirectCompute基準(zhǔn)測(cè)試時(shí),原因RTX 50系列顯卡返回了錯(cuò)誤代碼“CL_OUT_OF_RESOURCES (-5)”。終于找
經(jīng)過(guò)調(diào)查,試還開發(fā)人員發(fā)現(xiàn),不及盡管測(cè)試的原因主要應(yīng)用程序多年來(lái)一直是64位的,但部分計(jì)算子測(cè)試仍使用32位代碼,終于找這些代碼在RTX 4000及更早的試還顯卡上運(yùn)行正常。
然而在RTX 50系列GPU上,不及32位CUDA應(yīng)用程序無(wú)法直接運(yùn)行,原因需依賴CPU處理,導(dǎo)致性能大幅下降。
PassMark目前正在將受影響的OpenCL代碼移植到64位,以便正確測(cè)試新顯卡的性能,不過(guò)他們也表示,在不修改源代碼的情況下,許多包含32位OpenCL組件的應(yīng)用程序,可能永遠(yuǎn)無(wú)法在RTX 50系列上正常運(yùn)行。
此外,PassMark還指出,這一變化并不能完全解釋Direct X9性能不佳的原因,可能還有其他架構(gòu)變化影響了舊版渲染路徑。