local LLM, AI, Vibe Coding

Sekcia o programovaní, programovacích jazykoch...
Používateľov profilový obrázok
lepermessiah
Sponzor fóra gold
Sponzor fóra gold
Príspevky: 2973
Dátum registrácie: Št 30. Dec, 2010, 02:41
Bydlisko: ZV

Re: local LLM, AI, Vibe Coding

Príspevok od používateľa lepermessiah »

ako pise @LordKJ , aj u nas sa robi 80% kodu uz len cez Claude. tych 20% je kolega, ktory odmieta zmenu, ale je taky dobry, ze to AI nepotrebuje :D ale zas nejake konverzie Figmy robi aj on, no Vue cez Claude je unho no-go.

Je ale naozaj potrebne rozlisovat mediora/seniora, ktory zada presnu specifikaciu a ladi ju kym s nou nie je spokojny a az nasledne pusta code a vibe-coding nejakeho SEOckara, ktory netusi co ten kod robi na pozadi, netusi, preco API kluc pre OAuth nemoze mat v HTML len tak vlepeny, netusi o com je zakladna sanitizacia inputov ani nic .. proste spravil appku za 3 hodiny, mne vynada ze co mne na tom trvalo 8 a je spokojny. Potom mu to ja "hacknem" (rozumej pochopim diery v jeho kode a ukazem mu 5 sposobov ako mu pokazit radost) a s opravovanim je na 12h. Mam kopec znamych, ktori z nicoho boli "klikaci" sablon na WP, neskor sa vyspeficikovali na Elementor alebo Bricks alebo Oxygen a teraz s AIckom su machri, ze lepia weby cez noc kym spia cez Claude a Astro, no layout sa rozpada, appka ma 4MB skriptov a pod.
Spoiler: ukázať
[Home]
[NAS]: Synology DS920+ / 12GB RAM / 4x IronWolf ST6000VN001 R.6 / 2x GigaByte GSM2NE3512GNTD + 2.5G ethernet
[Laptop]: Lenovo Legion 5 Pro / 82JQ00C3CK | 5800H + 2x Samsung 970 EVO Plus 2TB + 64GB RAM
[LCD]: Dell U4025QW
[Peripherals]: Topping DX3 Pro | Wavemaster Mx-3 | Superlux HD-662F | Logitech G815 + Kensington Slimblade Pro
[Work]
[Laptop]: HP Zbook Ultra 14 G1a / B30FZES | AI Max+ Pro 395 + SK Hynix 1TB + 64GB RAM
[LCD]: Dell U4320Q
[Peripherals]: Sabaj D2 | AKG K72 | Logitech G413 Silver + Kensington Slimblade
LordKJ
Sponzor fóra gold
Sponzor fóra gold
Príspevky: 8246
Dátum registrácie: Po 28. Feb, 2011, 11:49
Bydlisko: Bratislava

Re: local LLM, AI, Vibe Coding

Príspevok od používateľa LordKJ »

vela je aj o tom ci sa zdiela knowledge (t.j. neopakuju sa potom rovnake chyby, code style v ramci celej codebase), su nasetupovane AGENTS.md a podobne...

Pisanie specifikacie - resp. "dialog" s agentom ohladom specky je najdolezitejsi. Tam sa vysvetli drviva vacsina problemov a potom uz samotna implementacia moze bezat v pozadi kym clovek riesi nieco ine. Len sa budem opakovat na to aby ta specka davala zmysel musi ten clovek vediet co od toho chce a mat prehlad o tom co je este OK a co uz nie. Mam uz kolegov co zacali pouzivat speech-to-text lebo sa im nechce pisat :D


Zaujimave veci to dokaze napr. ked tomu date pristupy k roznym datovym zdrojom. Napr. agent, ktory sa spusti pri incidente a pozrie sa na posledne releases, codebase, logy, apm a ma za par minut prvy sumar problemu (a pripadne aj fix) zatial co on call clovek este len startuje pc...
main: 9950X + Noctua NH-D15 G2, ASUS STRIX B650E-F, Kingston 64gb DDR5 6000 CL30, 7900 GRE Nitro+, 990 Pro 4TB, ASUS STRIX Aura RGB 1000W, Fractal North XL + 4x Noctua A14x25 G2
Používateľov profilový obrázok
zoom
Používateľ
Používateľ
Príspevky: 2850
Dátum registrácie: Št 16. Jún, 2005, 20:00
Bydlisko: Bratislava (42)

Re: local LLM, AI, Vibe Coding

Príspevok od používateľa zoom »

Chris napísal: Po 09. Feb, 2026, 12:55aky HW na to pouzivas a tps dosahujes ?
Pouzivam to na mojom stroji, ako som pisal predtym, tj. 5070 Ti 16GB, 96GB RAM. Rychlosti su rovnake ako v tabulke predtym. Ten gpt-oss 120B ide tych 7, obcas 9 tps. Nemotron 3 Nano da 14 tps (90-100% GPU util). Qwen3 Coder Next 80B da nieco cez 5 tps (~50% GPU util). Tych 10-15 tps je pre mna taky pain threshold. Nepouzivam to na interaktivne doplnanie kodu alebo co, nie som programator. Som taky glorifikovany indicky zliepac kodu/skriptov - vacsinou PowerShell, obcas som zabrdol aj do T-SQL. Preto mi staci take jednoduche pouzitie, kde nepotrebujem navrhovat cele aplikacie. Skor napady, logicke otazky, obcas code review a tak. 80% zvedavost, 20% realne pouzitie.

Ten GLM 4.7 s 200-230GB RAM (podla context window) bezal na pracovnej stanici, co tu prave mam. Tam je vsak nejake stare Quadro, takze je to skor graficky decelerator a cele to slo tak <1 tps. Dost nepouzitelne, ale zaujimalo ma, ako sa s tym bude robit.

Inak to porovnanie s WP je take akuratne. Vibe coding je dnesne "programovanie" web stranok vo FrontPage ci este lepsie vo Worde (ekvivalent lepsieho a horsieho LLM). Ten, kto nevie nic alebo malo, tak ma v rukach silny nastroj. Len s tym nemoze robit bez rozmyslu vsetko (= celofiremna enterprise stranka vo FrontPage).

Na druhu stranu, poznam realny priklad, kde sa custom vnutropodnikovy system nedal pouzivat poriadne cez VPN. Ked som to riesil, sniffoval, databazoval, tak som zistil, ze je to (ludmi) napisane tak, ze pri scrollovani tabulky v okne sa jednoducho pri kazdom posune znovu a znovu dopytuje databaza. Nie ze si vylistujem napriklad zoznam v sklade a to sa rozparsuje do okna na viac stranok, ale kazdym posunom v tabulke sa nacitavali dalsie a dalsie hodnoty (aj tie, co uz boli predtym nacitane)... realne to robilo traffic radovo v MB/s. Tipujem, ze to by sa s lepsim LLM nestalo.
Používateľov profilový obrázok
Chris
Pokročilý používateľ
Pokročilý používateľ
Príspevky: 5400
Dátum registrácie: Pi 13. Jan, 2006, 02:00
Bydlisko: Bratislava

Re: local LLM, AI, Vibe Coding

Príspevok od používateľa Chris »

aha, tak to mas dost biedne vystupy.

s M4Max to ide 10x lepsie, este rozmyslam ci s tymito to nepojde dobre, ked to je za 2.7k a 128GB vRAM https://www.computeruniverse.net/de/p/1 ... id=1306233
Master of PaloAlto NGFWs, Cisco ASAs
Používateľov profilový obrázok
stiv
Sponzor fóra gold
Sponzor fóra gold
Príspevky: 10426
Dátum registrácie: Pi 16. Nov, 2012, 21:30
Bydlisko: BT

Re: local LLM, AI, Vibe Coding

Príspevok od používateľa stiv »

mp3turbo napísal: Po 09. Feb, 2026, 18:55 uz sa tesim, kedy takto budu fungovat dochtori ...
Dufam, ze coskoro.
.
Používateľov profilový obrázok
wingo
Moderátor
Moderátor
Príspevky: 6862
Dátum registrácie: St 01. Sep, 2010, 20:36
Bydlisko: Podbrezová

Re: local LLM, AI, Vibe Coding

Príspevok od používateľa wingo »

Podľa tohto ide model gpt-oss-120b MXFP4 cca 45t/s out of the box bez ladenia:
https://www.servethehome.com/framework- ... ix-halo/4/
Spoiler: ukázať
STEAM: http://steamcommunity.com/id/X-w1n9/

PC1:
Ryzen 7 9800X3D, Noctua NH-D14+Arctic P14 PWM PST, ASRock B850M-X WiFi, 32GB DDR5 Kingston Fury Renegade RGB @ 6200, Sapphire Pulse RX 9070XT 16GB, Samsung 980 PRO 2TB, Adata XPG Core Reactor 650W, BeQuiet Pure Base 500DX + 3x Arctic P14 PWM PST, LG 42OLEDC21, Eternico MKS 7010, Logitech G400, Hifiman HE-4XX/Edifier M60 + Topping NX4DSD

PC2:
Ryzen 7600X, Gigabyte B650M Gaming X AX, 32GB DDR5 Kingston Fury@6000, Gigabyte RTX 3070 8GB Vision, SSD Kingston Fury Renegade 1TB, Gigabyte P650SS ICE, Zalman P10 White, ASUS VG279Q, Marvo K605, Rapture ASPIS, Edifier WN820NB Plus
Používateľov profilový obrázok
zoom
Používateľ
Používateľ
Príspevky: 2850
Dátum registrácie: Št 16. Jún, 2005, 20:00
Bydlisko: Bratislava (42)

Re: local LLM, AI, Vibe Coding

Príspevok od používateľa zoom »

No tak urcite, ze to ide lepsie, kedze gayMac pouziva unifieeeeeed RAM/VRAM, cize sa to chova, ako keby si to akceleroval s grafikou so <128GB VRAM. Vo vseobecnosti je to kravina, ale zrovna pri tomto use-case to hodne pomoze. Nevyhoda potom je, ze musis "pracovat" na Macu a s macOS. Takze v pripade AI som medzi 16GB VRAM chudobou a zvysok sa offloaduje na pomale CPU.

Na rovnaky bandwagon nastupilo aj Strix Point od AMD, ale ti to robia vyslovene kvoli AI. Jednoducho GPU je king (10-15x rychlejsia nez CPU v tomto) a GPU s vela VRAM je vacsi king nez GPU s malo VRAM. Nic ine tam nepomaha. Ani NPU v novych CPU nie su na toto pouzitelne a takmer nic ich nepodporuje.

Mat taku krabicku na hranie s AI je sice pekne, ale nie za 2700,-€. To si radsej kupim RTX 5090 s horiacimi konektormi a vyuzijem ju aj na hranie. Ono do buducna by som na programovacie veci ocakaval skor mensie modely. Ked sa s LLM chcem porozpravat o svete, tak je samozrejme potrebne, aby mal kopec informacii o vsetkom a daval si dokopy suvislosti (viac ci menej uspesne). Ale LLM cisto na algoritmy a konkretny programovaci jazyk asi nemusi vediet ake je zlozenie klobasy, kolko sa dozivaju tucniaky a preco hurikany neprejdu cez rovnik.

Návrat na "Programovanie"