mohol si toto dat aj do threadu G80, G92, ale ok ...
najprv si musime vysvetlit z co pozostava TMU = texturovacia jednotka. Kazda TMU sa sklada z TFU a TAU (viac nas teraz nezaujima). TFU = texture filtering unit = filtrovacia jednotka a TAU = texture addressing unit, adresovacia jednotka. V pripade, ze je pomer TFUs a TAUs 1:1 mozno hovorit o "klasickych" TMUs. Vo viacerych pripadoch - ako G80, R600 ale tento pomer filtrovacich/adresovacich jednotiek nie je 1:1 - je zmeneny. Preto nie je uplne presne hovorit v tychto pripadoch o presnom pocte TMUs.
Pozrieme sa teraz na G80, clanok mame na pretaktovanie.sk tiez:
Prve pohlady na architekturu G80. G80 teda nema klasicke TMUs, nakolko nema 1:1 pomer TFUs:TAUs. Ich pomer je 2:1 v prospech TFUs. Ma viac filtrovacich jednotiek ako adresovacich, preto nemoze vsetky filtrovacie jednotky vyuzit pokial sa vyuziva len bilinearne filtrovanie. Obrazok od nV k tomu:
( znazorneny je 1 cluster, G80 v podobe GeForce 8800GTX ich ma 8 )
Dokopy ma G80, keD si to vypocitame: 64 filtrovacich a 32 adresovacich jednotiek. Kvoli nizsiemu poctu TAUs nemozno pocitat pri teoretickych hodotach so "64 TMUs" ale len s 32, nakolko sa pri peak teoretickej hodnote jedna o bilinear peak texelfillrate. KeD si pozrieme cisla ku G80 tak nam vychadza:
18 400 Mtexels/s v pripade peak bilinear texelfillrate.
Aky to ma teda vsetko zmysel ? KeD sa filtruje cisto len bilinearne, vie G80 vyuzit len 32 TFUs, lebo ma len 32 TAUs = 32 klasickych TMUs = vie adresovat len tych 32 filtrovanych Texelov. Dalsich 32 TFUs sa jednoducho nevyuziva (v tomto pripade - bilinear filter) = nic nerobia. Tento pripad je ale zriedkavy, nakolko sa vo vacsine pripadov vyuziva bilinear-ny alebo trilinear-ny anisotropny filter.
Druhy priklad: vyziadane je bilinearne 2x AF, to by stalo keby mal G80 len 32 TFUs - 2 takty. Nakolko ma ale 64 TFUs to stoji len jeden takt - teda bilinearne 2xAF je podobne ako cisto trilinearne filtrovanie cisto z pohladu TMUs - texelfillrate -
zadarmo = bez straty vykonu. (teoreticky, v praxi nie je nic zadarmo). Preto
mozno hovorit o trilinearnych TMUs v pripade G80. Takisto keD si zoberieme peak FP-16 texelfillrate (napr.) tak je u G80 rovnaka ako peak bilinear texefillrate = 18 400 Mtexels/s. Pomenovanie trilinearne TMUs ale nie je znovu celkom presne, nakolko by 32 trilinearnych TMUs, presne povedane -
sampler jednotky G80 vedia urychlit/uskutocnit bez straty vykonu aj anisotropne filtrovanie.
Tento pomer 2:1 TFUs:TAUs nema G92. Preto mozno hovorit o bilinearnych TMUs a preto ma cisto teoreticky vyssiu peak bilinear texelfillrate - nakolko ma 64 TFUs, 64 TAUs = 64 klasickych TMUs. (v praxi sa ale cisto bilinearne filtrovanie uz skoro nepouziva, teda tada tuto vyhodu v praxi nema)
Jeho max. bilinear texelfillrate je 41 600Mtexels/s. Lenze G92 nema zadarmo bilinearne 2xAF, straca vykon. Rovnako aj v pripade max. bilinear FP-16 texefillrate - na polovicu. Teda na 20 800 Mtexels/s a pod. Teda realny rozdiel je sposobeny do velkej miery len rozdielom pracovnych frekvencii TMUs/ROPs domeny - 575MHz (8800GTX) ku 650MHz (8800GTS-512).