蘋果官方發(fā)布視頻介紹 A17 Pro 和 M3 系列芯片的 GPU 技術(shù)細節(jié)

更新時間:2024-07-29

近日,蘋果官方發(fā)布了時長將近半小時的開發(fā)者視頻,詳細介紹 M3 系列芯片和 A17 Pro 芯片中的諸多技術(shù)細節(jié),并通過基礎(chǔ)術(shù)語解釋了改進原理等。

視頻中表示開發(fā)者使用 Metal API 構(gòu)建應用程序過程中,不需要更改現(xiàn)有應用程序代碼就能看到 M3 和 A17 Pro 的性能提升。這些芯片組利用動態(tài)緩存(Dynamic Caching)、硬件加速光線追蹤和硬件加速網(wǎng)格映射等,大幅提高了 GPU 表現(xiàn)。

動態(tài)緩存

蘋果在 M3 和 A17 Pro 中引入了下一代著色器核心,應用調(diào)用 GPU 核心時,這些著色器可以更加高效運行,大大提高輸出性能。

蘋果官方發(fā)布視頻介紹 A17 Pro 和 M3 系列芯片的 GPU 技術(shù)細節(jié)

通常,GPU 只能根據(jù)執(zhí)行操作期間執(zhí)行操作中的最高帶寬進程分配寄存器內(nèi)存。因此,如果操作的某一部分需要比其他部分多得多的寄存器內(nèi)存,則該操作將為給定進程使用更多的寄存器內(nèi)存。

動態(tài)緩存允許 GPU 為其執(zhí)行的每個操作分配恰到好處的寄存器內(nèi)存量,釋放以前不可用的寄存器內(nèi)存,允許并行執(zhí)行更多著色器任務(wù)。

靈活的片上存儲器

以前,片上存儲器(on-chip memory)會為寄存器、線程組和帶有緩沖區(qū)緩存的切片存儲器分配固定的內(nèi)存。這意味著,如果一個操作使用一種類型的內(nèi)存比另一種類型的內(nèi)存更多,那么大部分內(nèi)存就會被閑置。

蘋果官方發(fā)布視頻介紹 A17 Pro 和 M3 系列芯片的 GPU 技術(shù)細節(jié)

蘋果調(diào)整讓所有片上存儲器都可以用于存儲器類型的緩存。嚴重依賴線程組內(nèi)存的操作可以利用片上內(nèi)存的整個跨度,甚至可以將操作溢出到主內(nèi)存中。

著色器內(nèi)核可動態(tài)調(diào)整片上內(nèi)存占用率,以最大限度地提高性能,這意味著減少開發(fā)者的應用優(yōu)化時間。

著色器核心的高性能 ALU 管線

蘋果建議開發(fā)人員在其程序中執(zhí)行 FP16 數(shù)學運算,但高性能 ALU 并行執(zhí)行整數(shù)、FP32 和 FP16 的不同組合。

蘋果官方發(fā)布視頻介紹 A17 Pro 和 M3 系列芯片的 GPU 技術(shù)細節(jié)

指令在并行執(zhí)行的不同操作中執(zhí)行,這意味著 ALU 利用率會隨著占用率的提高而提高。

如果不同的操作包含相同的 FP32 或 FP16 指令,這些指令將在不同的時間點執(zhí)行,則可以重疊執(zhí)行以增加并行性。(jAb88.cOM 88教案網(wǎng))

硬件加速圖形管道

硬件加速大幅加快光線追蹤過程,重要的交叉計算從 GPU 功能中移除。由于硬件負責部分計算,因此允許并行展開更多操作,從而加快硬件組件的光線追蹤速度。

蘋果官方發(fā)布視頻介紹 A17 Pro 和 M3 系列芯片的 GPU 技術(shù)細節(jié)

硬件加速網(wǎng)格著色使用類似的方法。它采用幾何計算管道的中間,并將其傳遞給專用單元,從而允許更多并行操作。

蘋果官方發(fā)布視頻介紹 A17 Pro 和 M3 系列芯片的 GPU 技術(shù)細節(jié)