CUDA

xaircon · RAM: DDR2 2*2*2GB A-DATA Vitesta Extreme Edition 800MHz, 4-4-4-12, 2,0 VRAM ,

Programoval uz v nej niekto?

uprimne pochybujem

(ze niekto z nasho fóra v nej intenzivne robil)

ale nieco predpokladam si sa chcel spytat ...

xaircon · RAM: DDR2 2*2*2GB A-DATA Vitesta Extreme Edition 800MHz, 4-4-4-12, 2,0 VRAM ,

tiez pochybujem. islo mi o to ci s tym ma niekto skusenosti a ci je vypoctovy vykon na GPU podobny vykonu na CPU, pripadne lepsi alebo horsi a teda ci ma zmysel sa do toho pustat.

zalezi co v nej chces programovat, podla toho ... preto tak skoro nevystriedaju GPUs - CPUs

aritmeticky vykon G80 je ale celkovo az ~ 10x vacsi ako high end CPUs

dobry clanok ohlade CUDA je tu: link

xaircon · RAM: DDR2 2*2*2GB A-DATA Vitesta Extreme Edition 800MHz, 4-4-4-12, 2,0 VRAM ,

v podstate by islo hlavne o matematicke operacie, napr. numericke integrovanie a pod.

trochu ma zaujima teória cisel a momentalne pracujem na kniznici pre pracu s velkymi cislami a podla mojich odhadov by bola praca s danou kniznicou na CPU dost pomala (hlavne nasobenie a delenie, nieto umocnovanie a odmocnovanie pri velkych cislach - tak 10e+100). niesom momentalne schopny vytvorit vykonne algoritmy ktore by skratili cas na praci s tymito cislami na CPU a preto by som chcel vediet ako by to slo na GPU, aby som si to mohol prakticky vyskusat.

myslim si, ze urcite rychlejsie, lenze by si sa musel najprv naucit ako pracovat s CUDA ...

xaircon · RAM: DDR2 2*2*2GB A-DATA Vitesta Extreme Edition 800MHz, 4-4-4-12, 2,0 VRAM ,

pomaly sa s tym zacnem hrat a uvidim ako mi to pojde.

nVidia vydala teraz CUDA Toolkit 1.0, takze staci ovladat "C" pre programovanie GPGPU aplikacii

kami_sama

preco nerobis napr. operaciu nasobenia podla divide & conquer?

resp. preco vyuzivat "jednoduche" algoritmy, namiesto takych, co by ti pridali programu na strane efektivity?

napr. existuju metody na nasobenie n bitovych cisel, kde ti staci nasobit 4 krat n/2 bitove cisla (resp. ked aj to je velke, rozdelit rekurziou). a to je len jedna z metod. cize podla mna by bolo jednoduchsie si to nastudovat (co sa tyka zefektivnenia programov). popripade vyhladat neakych matematikov - teoretickych informatikov.

xaircon · RAM: DDR2 2*2*2GB A-DATA Vitesta Extreme Edition 800MHz, 4-4-4-12, 2,0 VRAM ,

co sa tyka toho "divide & conquer", neviem si to dost dobre efektivne predstavit pri nasobeni, dalo by sa to aplikovat na opakovane scitavanie (to bol aj moj povodny zamer), ale tam by bol prave problem s narocnostou na vypoctovy vykon a tak som to urobil tak ako nas to ucily na zakladnej skole (dve cisla pod seba a nasobit prve cislo kazdou cifrou z druheho a posuvat o jedno miesto dolava a nakoniec scitat), tym sa to rapidne okresalo z narocnosti vypoctu (vykona sa len par cyklov - kolko cifier tolko cyklov), kDezto v tom prvom by bolo tolko cyklov aka by bola hodnota cisla.

teraz rozmyslam nad delenim, ako to zefektivnit.

PS: to moje jedno cislo je definovane ako pole celych cisel (0-9)

kami_sama

nooo, ja som mal skor na mysli nieco ako fourierova transformacia.=;

tu najdes neaku teoriu okolo toho.

k tomu deleniu: cisla by si mohol mat aj v binarnej forme, napriklad v retazci napr. podla formatu IEEE 754. potom delenie by sa zjednodusilo (aspon si myslim).

algoritmus (efektivneho) delenia sa tiez da najst na nete dost, napriklad tu .

btw: sorry ze uz idem do offtopic. asi na tuto diskusiu by sa viac hodila nova tema.