Novy optimalizacny PC
Novy optimalizacny PC
Ahojte, premyslam na upgrade-om optimalizacneho PC u nás vo firme. Pocitac optimalizuje podklady pre pilu aby bolo co najmenej odpadu. Momentálne to šlape na i7 8700k (softver Cut Rite cutting). Optimalizacia trva tak 10 až 40 min, zaleží od konkretnej zakazky a ciel je, skratiť čas minimálne na polovicu. CPU ide po cely čas na 100%. Premyslam nad CPU AMD Ryzen 9 7950X alebo Intel Core i9-14900K. Rozdiely pri multi-core benchmarkoch sú minimálne-takže skôr ma to ťahá ku AMD Čo si o tom myslíte? Vdaka za kazdu radu.
- scream
- Pokročilý používateľ
- Príspevky: 4775
- Dátum registrácie: Ut 04. Okt, 2005, 20:00
- Bydlisko: Kosice
Re: Novy optimalizacny PC
Ak ti ide o hrubu silu a cas, kedze to asi zaraba peniaze tak mozno by som zvazil nejaku cloudovu masinu. Autoscaling moze robit zazraky. Ak to ale pouzivas len obcasne, tak to asi zmysel nema. Tiez by som pohladal nejake testy daneho softwaru, kde to slape najlepsie.
Ryzen5 7600, 32GB DDR5 6000 Corsair, MSI PRO B650-P WIFI, Fortis 5, XFX RX 6700 10g, 2x2TB samsung 980 pro, 2TB SATA, EVGA SuperNOVA 550 GT @ 31,5" iiyama G-Master GB3271QSU-B1
XBOX series X
XBOX series X
Re: Novy optimalizacny PC
Ťažko povedať, netušíme čo je bottleneck pre ten SW, na ktorom CPU pôjde lepšie. To že vie využiť 12 threadov i7 8700K na 100% ešte neznamená že vie dobre škálovať aj do 32 threadov, či nebude brzdený latenciami, pamäťovou priepustnosťou, či sa dáta náhodou ešte nezmestia do bežnej ale už zmestia do väčšej 3D cache, či vie využiť AVX-512... ideálne by boli nejaké testy ale na nete som nič nenašiel, ani na ich fóre...
Čiže v konečnom dôsledku to všetko bude len hádanie, každopádne oba CPU ti ponúknu výborný výkon, AMD pri nižšej spotrebe.
Je tu ešte možnosť skúsiť zorganizovať tu na fóre nejaký dobrovoľný benchmark viacerých CPU pre porovnanie (vidím tam v downloads nejaké demo ale tam musíš pomôcť čo a ako pustiť pre otestovanie výkonu, ideálne dačo čo nepôjde hodinu ale maximálne pár minút). Vedel by som pomôcť spustením toho dema na mojom R5 7600X, teoreticky môžeš na existujúcom 8700k, ale furt to bude malá vzorka, ešte by sa museli prihlásiť ďalší s inými CPU pre porovnanie, ideálne tými dvoma zvažovanými 14900k (alebo takmer rovnaký len s nižším boostom 13900k) a 7950x, možno aj nejakým X3D pre porovnanie či 3D cache výrazne pomôže alebo nie, či by stálo za zváženie 7950X3D či dokonca 7800X3D. Asi skôr nie ale človek nikdy nevie kde je bottleneck, väčšina productivity aplikácií nevie ťažiť z 3D cache ale je aj zopár takých ktoré vedia.
Čiže v konečnom dôsledku to všetko bude len hádanie, každopádne oba CPU ti ponúknu výborný výkon, AMD pri nižšej spotrebe.
Je tu ešte možnosť skúsiť zorganizovať tu na fóre nejaký dobrovoľný benchmark viacerých CPU pre porovnanie (vidím tam v downloads nejaké demo ale tam musíš pomôcť čo a ako pustiť pre otestovanie výkonu, ideálne dačo čo nepôjde hodinu ale maximálne pár minút). Vedel by som pomôcť spustením toho dema na mojom R5 7600X, teoreticky môžeš na existujúcom 8700k, ale furt to bude malá vzorka, ešte by sa museli prihlásiť ďalší s inými CPU pre porovnanie, ideálne tými dvoma zvažovanými 14900k (alebo takmer rovnaký len s nižším boostom 13900k) a 7950x, možno aj nejakým X3D pre porovnanie či 3D cache výrazne pomôže alebo nie, či by stálo za zváženie 7950X3D či dokonca 7800X3D. Asi skôr nie ale človek nikdy nevie kde je bottleneck, väčšina productivity aplikácií nevie ťažiť z 3D cache ale je aj zopár takých ktoré vedia.
Spoiler: ukázať
-
- Pokročilý používateľ
- Príspevky: 12262
- Dátum registrácie: St 27. Apr, 2011, 11:16
- Bydlisko: ta Blava, ňe ?
Re: Novy optimalizacny PC
>> Autoscaling moze robit zazraky.
a tato aplikacia to urcite podporuje, je nadherne skalovatelna a distribuovatelna atd, ze ? Presne tak ako web servery, databazy a podobne.
a tato aplikacia to urcite podporuje, je nadherne skalovatelna a distribuovatelna atd, ze ? Presne tak ako web servery, databazy a podobne.
Som matematik... Vzrusuju ma cisla, napriklad 8300 na otackomeri alebo 2,15 baru z kompresora a este aj 1-12-5-8-3-10-6-7-2-11-4-9.
Re: Novy optimalizacny PC
Dakujem chalani, musim zistit ake obmedzenia ma ten demo režim (full verzia potrebuje hw kluc) a skusim testnut asi v tom cloude. V OCI mám este nejake kredity
- 1adad1
- Používateľ
- Príspevky: 2589
- Dátum registrácie: Ut 06. Okt, 2009, 20:19
- Bydlisko: Bratislava V - Petržalka
Re: Novy optimalizacny PC
Neviem ci ti budem uplne dobre poradit, ale moj sukromy tip je, ze tento cutting problem sa da formulovať ako MILP problem a myslim si, ze tak to riesi aj dany softver.
My aktualne v praci tiez riesime MILP problem, ale my si softver robime na mieru a pouzivame krabickovy solver, ktory sa vola Gurobi.
Cena za Gurobi je pomerne vysoka lebo je to asi to najlepsie co si vies kupit a pouziva sa to len v tedy kedy je sanca ze sa to zaplati. Su samozrejme aj lacnejsie pripadne opesourcove alternativy, ale tie maju horsi performance.
Problem Gurobi ako takeho je, ze bezna serverova licencia Ti plati na 8 jadier a 16 threadov, ak chces viac tak za kazde jedno jadro doplacas tusim, ze 3k rocne.
No a gurobi z vsetkych tychto solvrov asi najviac peňazí nalial do multhriedoveho riesenia, ale napriek tomu by som nepovedal, ze to je úplne kľúčová vec. Jasne ked mas 4 jadra namiesto 2 tak ten rozdiel je celkom citit, ale 4 vs 8 už až taky rozdiel nie je. To ale celkovo vyplýva z povahy toho problému.
Co je asi najdolezitejsie je frekvencia jedného jadra, tam vies z mojej skusenosti nabrat najviac performance.
Co sa tyka avx512 tak tam promovali nieco okolo 20%, co teda tiez nie je na zahodenie.
My sme to v praci vyriesili tak, že mame jeden server s AMD EPYC 75F3 a na nom bezia tri virtualky a nejaky balast. Zaroven nam na toto staci jedna licencia (ano overovali sme si to s dodavatelom). T.j. takto pomerne dosť usetrime za licencie.
Docasne sme tieto veci pocital aj na beznom desktope s 5900x a vykon bol tiez ok. Serverove riesenie je vsak spolahlivejsie.
Keby ti mam poradit len tak od oka, tak v ramci povahy problemu by som siel do niečoho s 3D cache(7950x3d), aj keď to nemám vyskúšané tak si myslím, že to moze riešenie dosť zrýchliť.
My aktualne v praci tiez riesime MILP problem, ale my si softver robime na mieru a pouzivame krabickovy solver, ktory sa vola Gurobi.
Cena za Gurobi je pomerne vysoka lebo je to asi to najlepsie co si vies kupit a pouziva sa to len v tedy kedy je sanca ze sa to zaplati. Su samozrejme aj lacnejsie pripadne opesourcove alternativy, ale tie maju horsi performance.
Problem Gurobi ako takeho je, ze bezna serverova licencia Ti plati na 8 jadier a 16 threadov, ak chces viac tak za kazde jedno jadro doplacas tusim, ze 3k rocne.
No a gurobi z vsetkych tychto solvrov asi najviac peňazí nalial do multhriedoveho riesenia, ale napriek tomu by som nepovedal, ze to je úplne kľúčová vec. Jasne ked mas 4 jadra namiesto 2 tak ten rozdiel je celkom citit, ale 4 vs 8 už až taky rozdiel nie je. To ale celkovo vyplýva z povahy toho problému.
Co je asi najdolezitejsie je frekvencia jedného jadra, tam vies z mojej skusenosti nabrat najviac performance.
Co sa tyka avx512 tak tam promovali nieco okolo 20%, co teda tiez nie je na zahodenie.
My sme to v praci vyriesili tak, že mame jeden server s AMD EPYC 75F3 a na nom bezia tri virtualky a nejaky balast. Zaroven nam na toto staci jedna licencia (ano overovali sme si to s dodavatelom). T.j. takto pomerne dosť usetrime za licencie.
Docasne sme tieto veci pocital aj na beznom desktope s 5900x a vykon bol tiez ok. Serverove riesenie je vsak spolahlivejsie.
Keby ti mam poradit len tak od oka, tak v ramci povahy problemu by som siel do niečoho s 3D cache(7950x3d), aj keď to nemám vyskúšané tak si myslím, že to moze riešenie dosť zrýchliť.
Re: Novy optimalizacny PC
Myslel som, že 3D cache pomáha hlavne pri hrách... Pri aplikačných testoch má naviac skôr klasicka 7950X. Ale nechám si poradiť. Ešte otázka má zmysel ísť do nejakých OC RAM? Predbežne vybrané tieto: https://www.alza.sk/kingston-fury-32-gb ... 326447.htm
- Jednoduska
- Sponzor fóra silver
- Príspevky: 5861
- Dátum registrácie: Po 19. Nov, 2012, 15:45
- Bydlisko: Kosice, 040 01
Re: Novy optimalizacny PC
6400 nema istotu rozbehania, 6000 by ti malo ist vsade, po zapnuti EXPO.
Nepisem zo skusenosti ale z rad co mi chalani dali v teme tyzden dva dozadu
Nepisem zo skusenosti ale z rad co mi chalani dali v teme tyzden dva dozadu
-
- Pokročilý používateľ
- Príspevky: 12262
- Dátum registrácie: St 27. Apr, 2011, 11:16
- Bydlisko: ta Blava, ňe ?
Re: Novy optimalizacny PC
ale ved este ani nevieme aku platformu bude pan mat, a uz vieme ze 6400 pamate nepojdu ! Na inteli chodi 8000 takze v pohode. Na nepodarenom AMDcku vies vzdy pustit 6400 pamate na 6200 a bude to v pohode, ak nahodou 6400 nebude chodit (velmi casto chodi).
>> Myslel som, že 3D cache pomáha hlavne pri hrách... Pri aplikačných testoch má naviac skôr klasicka 7950X.
takymto odhadovanim od stolika vyriesis akurat prd. Wingo dobre napisal, najprv musis zistit ci je pre teba dolezitejsia frekvencia cpu, pocet jadier, latencie na pamate (pretoze aj to hraje ulohu), velkost cache, ci aplikacia dobre reaguje na velku cache pretoze moze aj nemusi a to nijako neodhadnes... to ze cpu ide na 100% neznamena vsetko - zober si testy pamati, winrar alebo 7zip, vzdy ide procesor na plne pecky ale ked mu das rychlejsiu pamat, tak sa skrati cas a furt procesor pojde na "rovnakych" 100%. Povedane inak : nevies a nevidis, bez sikovnej analyzy ktora tu zjavne neprebehla, co konkretne tych 100% znamena. Procesor "vytazis" na 100% aj ked budes po seriovom porte prenasat 9.6kbit/s pretoze on bude "obsluhovat" tu komunikaciu.
Nemozes povedat ze 3d pomaha hlavne pri hrach. Nemozes povedat ze klasicka 7950x bude lepsia - mozno ta predbehne 7800x3d. Nemozes povedat ze AMD bude lepsie, kluuuuudne sa moze stat ze aplikacia bola pisana na Inteli, ze programatori su howada (ano, velmi casto sa stava), ze architektura ma zaklad v dinosauroch a kludne na inteli pobezi o 50% rychlejsie nez na AMD. Nemozes povedat absolutne nic. Nemozes odhadnut absolutne nic.
Este skus priblizit ako by si konkretne testoval tuto aplikaciu v Oracle cloude alebo akomkolvek inom podobnom - pretoze ked rozmyslas ze zoberes "desktopovy" 7900, 7950, xxx3D procesor, tak taku architekturu "ASI" bude zlahka problem najst v ORacli. A ked si to v Oracli pustis na AMD Epic alebo Intel Xeon procesoroch ktore maju ine cache, ine pamate, ine latencie, ine jadra, ine IPC, absolutne neznamy pocet inych virtualok beziacich na tom stroji (alebo ty si prenajmes rovno cely host ?), tak to som zvedavy ako konzistentne a vypovedajuce vysledky budes mat, ked test spravis 10x.
>> Myslel som, že 3D cache pomáha hlavne pri hrách... Pri aplikačných testoch má naviac skôr klasicka 7950X.
takymto odhadovanim od stolika vyriesis akurat prd. Wingo dobre napisal, najprv musis zistit ci je pre teba dolezitejsia frekvencia cpu, pocet jadier, latencie na pamate (pretoze aj to hraje ulohu), velkost cache, ci aplikacia dobre reaguje na velku cache pretoze moze aj nemusi a to nijako neodhadnes... to ze cpu ide na 100% neznamena vsetko - zober si testy pamati, winrar alebo 7zip, vzdy ide procesor na plne pecky ale ked mu das rychlejsiu pamat, tak sa skrati cas a furt procesor pojde na "rovnakych" 100%. Povedane inak : nevies a nevidis, bez sikovnej analyzy ktora tu zjavne neprebehla, co konkretne tych 100% znamena. Procesor "vytazis" na 100% aj ked budes po seriovom porte prenasat 9.6kbit/s pretoze on bude "obsluhovat" tu komunikaciu.
Nemozes povedat ze 3d pomaha hlavne pri hrach. Nemozes povedat ze klasicka 7950x bude lepsia - mozno ta predbehne 7800x3d. Nemozes povedat ze AMD bude lepsie, kluuuuudne sa moze stat ze aplikacia bola pisana na Inteli, ze programatori su howada (ano, velmi casto sa stava), ze architektura ma zaklad v dinosauroch a kludne na inteli pobezi o 50% rychlejsie nez na AMD. Nemozes povedat absolutne nic. Nemozes odhadnut absolutne nic.
Este skus priblizit ako by si konkretne testoval tuto aplikaciu v Oracle cloude alebo akomkolvek inom podobnom - pretoze ked rozmyslas ze zoberes "desktopovy" 7900, 7950, xxx3D procesor, tak taku architekturu "ASI" bude zlahka problem najst v ORacli. A ked si to v Oracli pustis na AMD Epic alebo Intel Xeon procesoroch ktore maju ine cache, ine pamate, ine latencie, ine jadra, ine IPC, absolutne neznamy pocet inych virtualok beziacich na tom stroji (alebo ty si prenajmes rovno cely host ?), tak to som zvedavy ako konzistentne a vypovedajuce vysledky budes mat, ked test spravis 10x.
Som matematik... Vzrusuju ma cisla, napriklad 8300 na otackomeri alebo 2,15 baru z kompresora a este aj 1-12-5-8-3-10-6-7-2-11-4-9.
Re: Novy optimalizacny PC
Jasné že keď všade testujú rendering a Photoshop, a tieto dve úlohy s 3D cache neškálujú, tak všade píšu že 3D cache v produktivite nepomáha. Ale všetko závisí od toho, ako aplikácia funguje a ktoré časti CPU sú bottleneck.
Rendering (napr. Cinebench) nezaujíma rýchlosť RAM, naopak kompresia či kompilácia škáluje s rýchlosťou RAM.
3D cache napr. pomáha pri kompilácii shaderov ale už nie pri výpočte osvetlenia v Unreal Engine 5.1:
https://www.pugetsystems.com/labs/artic ... eal_Engine
Niektoré optimalizačné úlohy milujú veľkosť cache ak sa im do nej zmestia pracovné dáta, napr. tu sú nejaké prezentácie z Milan-X (serverové CPU s 3D cache):
https://www.tomshardware.com/news/micro ... benchmarks
Rendering (napr. Cinebench) nezaujíma rýchlosť RAM, naopak kompresia či kompilácia škáluje s rýchlosťou RAM.
3D cache napr. pomáha pri kompilácii shaderov ale už nie pri výpočte osvetlenia v Unreal Engine 5.1:
https://www.pugetsystems.com/labs/artic ... eal_Engine
Niektoré optimalizačné úlohy milujú veľkosť cache ak sa im do nej zmestia pracovné dáta, napr. tu sú nejaké prezentácie z Milan-X (serverové CPU s 3D cache):
https://www.tomshardware.com/news/micro ... benchmarks
Workloads, such as computational fluid dynamics (CFD), explicit finite element analysis (FEA), weather simulation, and EDA RTL simulation will benefit from Milan-X's generous helping of L3 cache. On the contrary, workloads that are dependant on peak FLOPS, clock speeds, or memory capacity are immune to large L3 caches. These include molecular dynamics, EDA full-chip design, EDA parasitic extraction, and implicit finite element analysis.
At the 64 VM configuration, Milan-X delivered up to 77% higher performance than Milan and was up to 257% faster than Skylake with the f1_racecar_140 model on Ansys Fluent 2021 R1.
Je zaujímavé sledovať tie grafy v tom článku ako rastie a klesá účinok cache s nárastom či poklesom parametrov.Under the OpenFOAM Motorbike benchmark, Milan-X was up to 60% faster than Milan and 305% faster than Skylake at the 8 VM setup.
Spoiler: ukázať
Re: Novy optimalizacny PC
v OCI chcem otestovat skalovanie, ako rastie výkon s pribúdajcimi core's. Je mi jasne, že tam nenasimulujem desktopovy procesor, ale ako taku vypovednu hodnotu by to mohlo mať.
>> nevies a nevidis, bez sikovnej analyzy ktora tu zjavne neprebehla
Porad ako to šikovne analyzovať?
>> kluuuuudne sa moze stat ze aplikacia bola pisana na Inteli, ze programatori su howada
Tohoto sa tak trochu obávam
>> nevies a nevidis, bez sikovnej analyzy ktora tu zjavne neprebehla
Porad ako to šikovne analyzovať?
>> kluuuuudne sa moze stat ze aplikacia bola pisana na Inteli, ze programatori su howada
Tohoto sa tak trochu obávam
Re: Novy optimalizacny PC
Ono zase bacha lebo tie serverové CPU majú "trošku" vyššiu pamäťovú priepustnosť, EPYC 12 kanálov RAM oproti dvom v Ryzen, takže aj to škálovanie môže (ale nemusí) byť zradné - napr. na serveri bude škálovať dajme tomu do 64 threadov ale na PC to dajme tomu prestane škálovať už pri 16 lebo tie desktopové CPU bežia na vyšších frekvenciách (3,5GHz EPYC vs 5GHz RYZEN) a zároveň majú výrazne nižšiu pamäťovú priepustnosť. Nevravím že sa to stane, ale je to jedno z mnohých možných úskalí ktoré môžu nastať. A to už nevravím o tom že Intel serverové CPU majú v podstate úplne inú architektúru ako desktop, AMD majú aspoň CCD rovnaké, rozdiel je len všetko okolo toho.
Nevravím že to nie je užitočné, určite hej keď máš tú možnosť v podstate zadarmo vyskúšať čo to spraví, len si daj pozor aby si náhodou z toho nevyvodil falošné závery.
Čo sa programovacích prasačín týka, pokiaľ to nebude vyslovene ako slávny Intel compiler čo dekádu dozadu pre Intel CPU generoval AVX inštrukcie a pre AMD iba zastaralé SSE tak by tam veľký rozdiel hádam nemal byť, skôr dané slabinami jednej či druhej architektúry, čiže sprasený kód nemusí byť nutne výhoda Intelu, môže lepšie vyhovovať aj AMD ak si s tým kódom ich architektúra bude vedieť lepšie poradiť.
Nevravím že to nie je užitočné, určite hej keď máš tú možnosť v podstate zadarmo vyskúšať čo to spraví, len si daj pozor aby si náhodou z toho nevyvodil falošné závery.
Čo sa programovacích prasačín týka, pokiaľ to nebude vyslovene ako slávny Intel compiler čo dekádu dozadu pre Intel CPU generoval AVX inštrukcie a pre AMD iba zastaralé SSE tak by tam veľký rozdiel hádam nemal byť, skôr dané slabinami jednej či druhej architektúry, čiže sprasený kód nemusí byť nutne výhoda Intelu, môže lepšie vyhovovať aj AMD ak si s tým kódom ich architektúra bude vedieť lepšie poradiť.
Spoiler: ukázať
-
- Pokročilý používateľ
- Príspevky: 12262
- Dátum registrácie: St 27. Apr, 2011, 11:16
- Bydlisko: ta Blava, ňe ?
Re: Novy optimalizacny PC
hlavne tie stare aplikacie ktore proste architekturu nezmenis... cojaviem zober taky Photoshop, Autocad, Catiu, Nemetschek, SAP... to su monolity ktore sa programovali roky rokuce a proste to nezmenis odpiky za mesiac ani za rok. Navyse, serverove CPU maju totalne odlisne mnozstva cache, totalne odlisne pamatove architektury (daleko viac pamatovych kanalov, ukrutne vacsie priepustnosti avsak bezia na mensich frekvenciach takze typicky maju horsie latencie - a teraz co je zaujimave pre tvoju appku, priepustnost GB/s alebo latencie v nanosekundach ? sprint alebo štafeta alebo maraton ?).
>> Je mi jasne, že tam nenasimulujem desktopovy procesor, ale ako taku vypovednu hodnotu by to mohlo mať.
nema, lebo nikdy nevies ake dalsie workloady bezia popri tebe - takze nevies physical-to-virtual core ratio, nepoznas zatazenie cache, pamati atd atd.
Uplne sa na to vykasli. Jedina moznost by bola ze si prenajmes komplet cely server, nie virtualku, ale aj toto ti prdlajz povie.
Takto : dnes mas 8700k co je fyzicke 6jadro. Aby si skratil vypoctovy cas na polovicu co je zadanie, za predpokladu ze vysledny cas zavisi 100.000% vyhradne od procesora co je tak trosku nerealne (ziadne data necita nezapisuje ? ziadna komunikacia s okolim ?), tak potrebujes 12jadro s rovnakou frekvenciou a IPC, instructions per clock. IPC sa medzigeneracne trosku zlepsovalo, ale dnesny 4GHz procesor nie je 2x rychlejsi nez 8700k keby bezala na 4GHz. Navyse, nie je IPC ako IPC, zavisi ake konkretne instrukcie sa vykonavaju, aky je komplet cely branch prediction, cache pipeline atd atd, proste je to nesmierne komplikovana vec na urovni kozmickeho vyletu.
14700k/14900k dosahuju priblizne 10% vyssiu frekvenciu nez 8700k : okolo 5.5GHz namiesto 5GHz. Ono aj s tou debilnou frekvenciou to neni jednoduche, pretoze ked bezi jedno jadro mas ine GHz ako ked bezia styri ako ked bezi osem ako ked bezi 16 a potom sa zacneme bavit o velkych jadrach a malych jadrach, o schopnosti priradovat spracovanie a vytazovat tieto rozlicne jadra ktore maju absolutne rozlicne latencie, pristup k pamatiam, zdielanu nezdielanu cache, paneboze...
Co sa tyka IPC, neviem ani odhadnut. Mr.Wingo pise ze ak software pouziva AVX, AVX512 instrukcie, tak na tom so sucasnymi cipmi bude vyrazne lepsie nez s povodnym. Ak nepouziva... tak nebude. IPC by som statisticky tresol 50% zlepsenie lenze strasne silno zdoraznujem ze niekde dosiahnes 5% navyse, niekde 100% pretoze rozlicne instrukcie, rozlicne vyuzitie cache, straaaasne komplikovana tema.
Podla mna dosiahnes pozadovanych 50% ci uz na inteli alebo na AMD. Ak mozem poradit, z titulu kompatibility a stability by som sa pozeral po Inteli pretoze je vrcholne nepravdepodobne, ze tvoja aplikacia bola vyvijana a optimalizovana pre AMD. Neviem, nepoznam, neskumal som, nedokazem poradit a mysel profesionalneho IT architekta ma taaaaaak strasne vela dalsich otazok a vidi taaaaaaaak strasne vela dalsich zakrut... len sproste nastavenie BIOSu ti zmeni vykon 20% len tak zahuci. Latencie a casovania pamati na ktore aplikacia moze ale nemusi byt citliva (vypoctovo narocne aplikacie vedia potrapit aj pamat), vyladenie procesora v zmysle chladenia, dosahovanych frekvencii...
>> Je mi jasne, že tam nenasimulujem desktopovy procesor, ale ako taku vypovednu hodnotu by to mohlo mať.
nema, lebo nikdy nevies ake dalsie workloady bezia popri tebe - takze nevies physical-to-virtual core ratio, nepoznas zatazenie cache, pamati atd atd.
Uplne sa na to vykasli. Jedina moznost by bola ze si prenajmes komplet cely server, nie virtualku, ale aj toto ti prdlajz povie.
Takto : dnes mas 8700k co je fyzicke 6jadro. Aby si skratil vypoctovy cas na polovicu co je zadanie, za predpokladu ze vysledny cas zavisi 100.000% vyhradne od procesora co je tak trosku nerealne (ziadne data necita nezapisuje ? ziadna komunikacia s okolim ?), tak potrebujes 12jadro s rovnakou frekvenciou a IPC, instructions per clock. IPC sa medzigeneracne trosku zlepsovalo, ale dnesny 4GHz procesor nie je 2x rychlejsi nez 8700k keby bezala na 4GHz. Navyse, nie je IPC ako IPC, zavisi ake konkretne instrukcie sa vykonavaju, aky je komplet cely branch prediction, cache pipeline atd atd, proste je to nesmierne komplikovana vec na urovni kozmickeho vyletu.
14700k/14900k dosahuju priblizne 10% vyssiu frekvenciu nez 8700k : okolo 5.5GHz namiesto 5GHz. Ono aj s tou debilnou frekvenciou to neni jednoduche, pretoze ked bezi jedno jadro mas ine GHz ako ked bezia styri ako ked bezi osem ako ked bezi 16 a potom sa zacneme bavit o velkych jadrach a malych jadrach, o schopnosti priradovat spracovanie a vytazovat tieto rozlicne jadra ktore maju absolutne rozlicne latencie, pristup k pamatiam, zdielanu nezdielanu cache, paneboze...
Co sa tyka IPC, neviem ani odhadnut. Mr.Wingo pise ze ak software pouziva AVX, AVX512 instrukcie, tak na tom so sucasnymi cipmi bude vyrazne lepsie nez s povodnym. Ak nepouziva... tak nebude. IPC by som statisticky tresol 50% zlepsenie lenze strasne silno zdoraznujem ze niekde dosiahnes 5% navyse, niekde 100% pretoze rozlicne instrukcie, rozlicne vyuzitie cache, straaaasne komplikovana tema.
Podla mna dosiahnes pozadovanych 50% ci uz na inteli alebo na AMD. Ak mozem poradit, z titulu kompatibility a stability by som sa pozeral po Inteli pretoze je vrcholne nepravdepodobne, ze tvoja aplikacia bola vyvijana a optimalizovana pre AMD. Neviem, nepoznam, neskumal som, nedokazem poradit a mysel profesionalneho IT architekta ma taaaaaak strasne vela dalsich otazok a vidi taaaaaaaak strasne vela dalsich zakrut... len sproste nastavenie BIOSu ti zmeni vykon 20% len tak zahuci. Latencie a casovania pamati na ktore aplikacia moze ale nemusi byt citliva (vypoctovo narocne aplikacie vedia potrapit aj pamat), vyladenie procesora v zmysle chladenia, dosahovanych frekvencii...
Som matematik... Vzrusuju ma cisla, napriklad 8300 na otackomeri alebo 2,15 baru z kompresora a este aj 1-12-5-8-3-10-6-7-2-11-4-9.
-
- Pokročilý používateľ
- Príspevky: 12262
- Dátum registrácie: St 27. Apr, 2011, 11:16
- Bydlisko: ta Blava, ňe ?
Re: Novy optimalizacny PC
... no pozeram ze Mr.Wingo pise ako moje druhe ja
Som matematik... Vzrusuju ma cisla, napriklad 8300 na otackomeri alebo 2,15 baru z kompresora a este aj 1-12-5-8-3-10-6-7-2-11-4-9.
Re: Novy optimalizacny PC
Ak by to niekomu do buducna pomohlo... nakoniec som išiel do AMD Ryzen 9 7950X3D, požadovaných 50% bolo dosiahnutých LTT. Vyťaženie CPU okolo 70-80%. Na PC sa dá súbežne plnohodnotne pracovať-pred upgradom to bolo ako za trest. Za mňa spokojnosť, ďakujem