motto1:Mýliť sa je ľudské, ale zbabrať niečo dokonale na to treba počítač motto2: Silný zdroj a veľký chladič to istí motto3: Ten most prekročíme až k nemu prídeme, Jack O'Neill motto4:Nikdy nič nieje ľahké, Zeddicus Zu'l Zorander
Myslim, ze je to velmi podstatne pre vyrobne naklady a vytaznost. 4 male cipy urcite budu lacnejsie ako keby to bol 1 velky cip. A samozrejme je to spojene infty fabric rovnako ako aj 1-cipove Ryzeny.
Music: AKG K240 MK II / Beyerdynamic DT 770 Pro 80 Ohm @ Topping DX7 Pro
Bike: 2022 Canyon Neuron CF 8; Coffee: Chemex 6-cup
motto1:Mýliť sa je ľudské, ale zbabrať niečo dokonale na to treba počítač motto2: Silný zdroj a veľký chladič to istí motto3: Ten most prekročíme až k nemu prídeme, Jack O'Neill motto4:Nikdy nič nieje ľahké, Zeddicus Zu'l Zorander
vzdy bude niekde nejaky limit. Aj Intel ma QPI... tiez to neni nelimitovane.
Pravda, pri styroch cipoch vnutri puzdierka to je na jednej strane lepsie nez dva externe cipy intelu, na druhej strane styri chrobaky dat dohromady je kapanek iny prieser nez dva. Na com stroskotavaju massive parallel clustre je prave toto, holt ano massive parallel neznamena styri ale stovky az tisice.
Pockame si na prakticku implementaciu, tak ako vzdy. A vies co je najlepsie ?
Nemas aplikacie ktore by dokazali vyuzit 32 threadov a zaroven ich linearne vytazit. Ze bude nejaky benchmark v renderoch lepsi nez na 6jadre ? Bude. Prakticke pouzitie ? Asi tak ako Vejron s maximalkou 437km/h.
Som matematik... Vzrusuju ma cisla, napriklad 8300 na otackomeri alebo 2,15 baru z kompresora a este aj 1-12-5-8-3-10-6-7-2-11-4-9.
motto1:Mýliť sa je ľudské, ale zbabrať niečo dokonale na to treba počítač motto2: Silný zdroj a veľký chladič to istí motto3: Ten most prekročíme až k nemu prídeme, Jack O'Neill motto4:Nikdy nič nieje ľahké, Zeddicus Zu'l Zorander
Tuto je zaujimavy test https://www.pcper.com/reviews/Processor ... ver-Bullet
Ocividne je nejaka latencia medzi jednotlivymi CCX, co sa samozrejme dalo cakat. Asi je rozumne cakat, ze latencia medzi jednotlivymi cipmi bude o nieco horsia.
Efekt tej latencie na vykon zalezi na aplikacii. To myslim vidime aj na benchoch Ryzenu. Ked mas nejaku "productivity" aplikaciu, kde proste potrebujes len spracovat mnozstvo dat (video, rendering, atd. by tu malo spadat), tak ti tie latencie nejak nevadia a skalujes s poctom vlakien prakticky dokonale. Proste len vytvoris tolko worker threadov kolko potrebujes a ide sa.
Prejavovat by sa tie latencie mali pri aplikaciach, kde potrebujes synchronizaciu a komunikaciu medzi jednotlivymi vlaknami. Asi by tam mohla zohrat dost velku ulohu aj cache.
Teraz si idem trochu vymyslat, lebo tymto smerom zial nie som dost vzdelany... Asi to bude zalezat na architekture, ale pride mi velmi rozumne to, ze Level 3 cache, ktora je zdielana medzi jadrami, velmi napomaha eliminovat (alebo uplne eliminuje?) cache miss pri vymene dat medzi vlaknami. Pretoze ked jedno jadro s datami pracuje, tak tie data su v cache, cize su aj v L3 cache, kde ich najde to druhe jadro, na ktorom bezi ine vlakno. Ponuka sa mi teda myslienka, ci by takejto viac-cipovej zostave pomohla nejaka L4 cache (pripadne v podobe HBM), ktoru by zdielali vsetky cipy.
Momentalne si ale nie som uplne isty, ci som spravne pochopil architekturu L3 u Ryzenu.
Music: AKG K240 MK II / Beyerdynamic DT 770 Pro 80 Ohm @ Topping DX7 Pro
Bike: 2022 Canyon Neuron CF 8; Coffee: Chemex 6-cup
uplne najhorsie na tom bude, ze tie cipy nebudu zrejme schopne komunikovat kazdy s kazdym. Priznam pravdu ze som nestudoval veci dopodrobna takze mozno tresnem : pravdepodobne kvoli cene a technickej narocnosti bude Blok1 prepojeny s Blokom2 a Blokom3 (susedia) a ked bude chciet vypravat s blokom4, musi ist cez dvojku alebo trojku. Rovnako, ked bude chciet trojka vypravat so stvorkou alebo jednickou tak moze pretoze su pri sebe, ale uz ku dvojke musi ist cez jednicku alebo cez stvorku.
Potom by dochadzalo vo vyraznejsej miere k tomu co uz teraz vidno : nedostatok kapacity na tom Infinicirkuse.
No, ako Stíví Wonder povedal, uvidime...
Som matematik... Vzrusuju ma cisla, napriklad 8300 na otackomeri alebo 2,15 baru z kompresora a este aj 1-12-5-8-3-10-6-7-2-11-4-9.
Veru, uvidime. Ked uz pcper merali normalny Ryzen, tak snad zmeraju aj tieto. Desktopovemu Threadripperu by mali stacit 2 cipy, nie 4 ako na tom obrazku.
Inak ten infinity fabric je podla mna skvela vec. V kombinacii s CCX blokmi to umoznuje takuto skalovatelnost. Uz len pockat aby sme aj videli ako je na tom vykon. Je dost mozne, ze v buducnosti bude takato "konstrukcia" standard pre CPU a GPU s velkym poctom jadier. Ale pravdou je, ze by bolo super keby ten infinity fabric bol o nieco rychlejsi. Co v buducnosti urcite bude.
Music: AKG K240 MK II / Beyerdynamic DT 770 Pro 80 Ohm @ Topping DX7 Pro
Bike: 2022 Canyon Neuron CF 8; Coffee: Chemex 6-cup
Skôr to má výhodu asi jedine pre AMD, že nemusia navrhovať ďalší celý čip, len zoberú viac CCX a prepoja ich tým ich fabricom, pretože evidentne ten fabric je to čo celý výkon AMD kazí.
strasne som zvedavy co to bude stat. To mi ale nebrani sa tesit na dalsie vianoce.
1700viek som uz nakupil "zopar" a neviem si to vynachvalit. Ak bude threadripper ako 1700-vka v bledo-modrom, beriem vsetkymi desiatimi.
Predsa moj obstarozny 3930k@5GHz uz dodychava a chcelo by to obnovu workstationu.
Tak rad by som, uvidime co to bude kostovat a ci mi to dovoli doktor penazenka.
Doteraz mi vyslo apson u Intelu, ze je lepsie mat napriklad 3x5820k@4.4GHz ako WS 2x Xeon E5-2640v4 a este mi pri tom zostane na bublifuk. Zopar Ryzenov uz mam a je to uplne super cpu. Ak sa zadari, tak o mesiac bude v sekcii o kejsoch moj ghetto mod 3 az 6 Ryzenov v "jednom kejse" alebo story ako spravit socialnu ediciu racku. Zrovna zajtra by som mal ist vyzdvihnut prototyp prveho unitu a podrobit ho testovaniu ci sa ten moj vymysel da uchladit.