Marián Boďa | 6. marca 2026
Zdvihnite ruku:
| Čas | Blok |
|---|---|
| 9:00–10:00 | Úvod + novinky v AI |
| 10:00–10:30 | R-SYS AI Review |
| 10:30–10:40 | Prestávka |
| 10:40–11:10 | R-SYS AI Review — pokračovanie |
| 11:10–12:00 | Claude + bezpečnosť |
| 12:00–13:00 | Obed |
| 13:00–14:00 | Cvičenia |
| 14:10–15:10 | Cvičenia |
| 15:20–16:30 | Pokročilé techniky + automatizácia |
| 16:30–17:00 | Zhrnutie + akčný plán |
Najintenzívnejších 6 mesiacov v histórii AI
Tradičný cyklus "jeden model za rok" je mŕtvy.
| Lab | Modely od septembra 2025 |
|---|---|
| OpenAI | 5.1, 5.2, 5.3, 5.4 |
| Anthropic | Sonnet 4.5, Haiku 4.5, Opus 4.5, Opus 4.6, Sonnet 4.6 |
| Gemini 3 Pro, 3 Flash, 3.1 Pro | |
| xAI | Grok 4, Grok 4 Heavy, Grok 4.1 |
| Benchmark | GPT-5.2 | Claude S4.6 | Gemini 3.1 Pro | Grok 4 |
|---|---|---|---|---|
| SWE-bench (kód) | 80.0% | 79.6% | 80.6% | 72–75% |
| GPQA (veda) | ~88% | 83.4% | 94.3% | 87–88% |
| ARC-AGI-2 (rozum) | — | 58.3% | 77.1% | 15.9% |
| HLE (expert) | 34.5% | — | 44.4% | 38.6% |
Rozdiel medzi top modelmi: 1–2 percentuálne body
llm-stats.com/leaderboards/llm-leaderboard
Cena za 1M tokenov (výstup)
─────────────────────────────
Opus 4.1 (mar 2025): $75.00
Opus 4.6 (feb 2026): $25.00 ← -67%
Gemini 3 Flash: $3.00
Gemini 3 Flash Lite: $0.50
DeepSeek API: $0.27 ← reasoning
1M-tokenové kontextové okno je teraz štandard.
| Model | Parametre | Licencia | Kde beží |
|---|---|---|---|
| DeepSeek V3.2 | 685B | MIT | Cloud / HW |
| Qwen 3.5 | 397B | Apache 2.0 | Mac 128GB RAM |
| Mistral Large 3 | 675B MoE | Apache 2.0 | Cloud |
| GPT-OSS-20B | 20B | Apache 2.0 | 16GB RAM |
Tréning DeepSeek-R1: $5.9 milióna
2026 Q1: Reasoning je vstavaný. Nastavíte "effort" parameter.
reasoning_effort: low → rýchle, lacné
reasoning_effort: medium → dobrý kompromis
reasoning_effort: high → max kvalita
reasoning_effort: max → +10–30% presnosť, 5-100x cena
Claude 4.6 → "Adaptive Thinking" — model si sám vyberie hĺbku.
Podporujú: Claude, ChatGPT, Cursor, Gemini, VS Code, Copilot
krátko na to: "MCP je mŕtve, nech žijú skills a CLI"
Teraz vy. Čo používate? Čo funguje? Čo nie?
Takto väčšina ľudí zadáva úlohy AI.
"Napíš test case pre login" → generický výstup
1000-riadkový prompt so všetkým čo vás napadne → AI sa stratí, protichodné inštrukcie, horší výsledok
Irelevantné informácie, zastaralé požiadavky → AI ide zlým smerom s veľkou istotou
Priveľa a zlý kontext sú HORŠIE ako málo kontextu.
Context = všetko čo AI vie, keď začne pracovať:
"Napíš test case pre login"
"Si QA inžinier. Napíš test cases pre login. Zahrň happy path, nesprávne heslo, expirovanú session."
<switch to plan mode> "Napíš test case pre login"
Čím viac nástrojov agent má, tým väčšie riziko:
Agent nemusí byť zlomyseľný. Stačí zlý prompt, hallucinácia, alebo prompt injection — a koná vo vašom mene.
Pravidlo: Dávajte agentom len tie prístupy, ktoré naozaj potrebujú.
Napíšte si JEDNU vec:
____, použijem ____ na ____."Príklady:
marianboda@gmail.com | 0949 195 091