Ezen a héten két olyan front rendeződött egymás mellé, amik első ránézésre nem tartoznak össze, mégis ugyanarról a feszültségről szólnak. Az egyik: az “OpenClaw”-univerzum — a Peter Steinberger nyitott agent-keretrendszere és köré rendeződő vállalati válaszok — kategória-szintűvé érett, és Nate március 23-i térképe szerint négy, egymástól tisztán elváló stratégiai fogadásra esett szét: sovereignty (saját adat, saját LLM, saját kockázat), delegation (Perplexity Computer felhőben futó agentje 200 dollárért havonta), distribution (a Meta által 2 milliárdért felvásárolt Manis a 3 milliárd Facebook-szempár előtt), és safety (az Anthropic Claude Dispatch + Computer Use + scheduled tasks háromszöge). Ehhez március 16-án bejelentkezett az Nvidia Nemo Claw — egy NVIDIA OpenShell-runtime-mal kiokosított OpenClaw-fork —, ami nyíltan kimondja: Jensen az AI-stacket nyitottan, de saját kontroll alatt akarja látni.
A másik szálon ugyanezen a héten Toby Lütke, a Shopify CEO-ja, autoresearch-csel — Karpathy néhány hete kiadott csomagjával — egyik napról a másikra 53%-kal gyorsabbá tette a Liquid templating engine-t, ami minden Shopify-storefront alatt fut. Az Anthropic ugyanekkor összerakta a dispatch + computer use + scheduled tasks hármast, megnyitva azt a mintázatot, amit Nate “agent-work-while-you-sleep”-nek hív. Háttérben viszont a katari Ras Laffan helium-üzem leállása — az iráni háború közvetlen lecsapódása — kivette a globális helium-kapacitás 33%-át, és 35-48 napos időablakot adott a kelet-ázsiai chip-fab-eknek, mire a tartalékok elfogynak.
A hét tehát az agent-stack érettsége és a fizikai infrastruktúra fragilitása közötti feszültségről szól: a szoftveroldal masszív lépéseket tesz előre, miközben a hardver-ellátási lánc egyetlen rakéta-becsapódásra rendült meg.
Az OpenClaw-univerzum négy stratégiai fogadása
Ami ezen a héten kirajzolódott, az nem egy újabb termék, hanem egy paradigma. Az OpenClaw alatt azt érdemes érteni, hogy a felhasználó saját kontroll alatt tartja az adatát, saját LLM-et választ, saját messaging-réteget csatol — és cserébe vállalja a teljes biztonsági kitettséget. Nate a videójában 30 ezer publikusan, autentikáció nélkül kitett példányról és nagyjából 800 kompromittált skill-csomagról beszél. Erre a paradigmára a hét folyamán négy, egymástól tisztán elváló stratégiai válasz érkezett.
Az első a Perplexity Computer, ami a delegation-irányt képviseli: felhőben futó agent, hónapokig elmenni hagyható task-okkal, havi 200 dollárért. A trade-off itt az, hogy az adatkontrollt elveszíted, cserébe nem kell sandboxot építened. Az iróniát az adja, hogy a Perplexity közben Personal Computert is bejelent — egy lokális Mac-containert —, pontosan azért, mert az OpenClaw-közönség adat-szuverenitás-igénye olyan erős, hogy a delegation-pitch mellé sovereignty-pitch is kell.
A második a Manis, amit a Meta 2 milliárd dollárért vett meg, és azonnal OpenClaw-irányba pivotált. Ez a leggyorsabban 100 millió dolláros ARR-ig növő termék, és Nate szerint Zuckerberg itt nem hirdetési platformban gondolkodik, hanem szempár-figyelem-megragadásban: ha a következő nagy felület az agent-interfész, Meta nem hagyhatja, hogy ezt OpenAI-n vagy Anthropicon keresztül használják.
A harmadik az Anthropic-féle managed OpenClaw, ami három primitívből áll össze: március 17-én érkezett a dispatch Max-tier-en, március 23-án a computer use, március 20-án pedig a Claude Code remote tasks. Együtt ez egy menedzselt OpenClaw: telefonról dispatch, desktop végrehajt MCP-konnektoron vagy közvetlen mouse-keyboard-kontrollon át, scheduled tasks pedig felhőben fut. A trade-off egyértelmű: kevesebb flexibilitás (nincs LLM-csere, nincs on-prem Ollama), cserébe menedzselt infrastruktúra.
A negyedik a Lovable reaktív válasza: a 2025-ös év legmásolt vibe-coding-terméke, 300 millió dolláros ARR-rel, március 19-én jelentette be, hogy kilép a website-építésen túlra és általános agent-execution-platformmá alakul. Nate megfigyelése innen az, hogy a középutat — sem nem deep, sem nem general — a piac 2026-ban egyszerűen nem fogadja el.
A döntési kerete, amit Nate ad ehhez, három tengelyen mér: hol fut az agent, ki választja a modellt, és — ami a leginkább alulértékelt — mit feltételez az interfész a felhasználóról. A viselkedés-változás költségét is bele kell árazni.
SET-szempontból a kulcs az, hogy az OpenClaw nem framework-választás, hanem compounding-philosophy. Ami egy harness köré épül — skill-ek, claude.md, dispatch-routine-ok —, azt nem lépésszámban, hanem újra-építési költségben kell mérni, ha egyszer le akarod cserélni. A W10-es harness-tézist a piac most konkretizálja.
Nemo Claw és Pike öt szabálya — Jensen visszahozza a fundamentumokat
Az NVIDIA március 16-i Nemo Claw bejelentése felületesen olvasva egy enterprise-security-wrap az OpenClaw köré: NVIDIA OpenShell-runtime, YAML-alapú policy-guardrail-ek, NVIDIA-chipre optimalizált local-first compute, hozzáférés a Nemotron-modellekhez. A TechCrunch elemzése ezt az OpenClaw biztonsági gyengeségére adott válaszként pozícionálja. Az érdekes itt viszont nem ez, hanem amit Nate március 24-i videója kibont: a Nemo Claw stratégiai értéke nem a security-réteg, hanem hogy Jensen a Pike-féle öt szabályt hozza vissza a 2026-os agent-stackbe.
A Pike-szabályok eredeti megfogalmazásukban a Unix-hagyományból jönnek, és arra a kérdésre adnak választ, hogy hogyan ne ess bele a “fancy algorithm”-csapdájába. Az első kettő az, hogy nem találod ki, hol fog a programod ideje eltelni, ezért mérni kell, mielőtt optimalizálsz — agent-rendszereknél is áll: ne tunolj, amíg nem mértél, és LLM-baseline-ek ma már nem kutatási ritkaságot jelentenek, hanem alapelvárást. A harmadik és negyedik szabály a komplexitásról szól: a fancy algoritmusok lassúak, ha N kicsi, és általában N kicsi; ráadásul bug-osabbak is, mint a simple-k. Agent-stackre fordítva ez annyit tesz, hogy a simple harness mindig jobban skálázódik, mint a complex, és az agent-rendszerek debug-olását pont a feleslegesen összetett context-pumping nehezíti meg — ha tudsz egyszerűsíteni a kontext-graphon, tedd. Az ötödik szabály a legfontosabb: data dominates. Ha jó adat-struktúrákat választasz, az algoritmusok majdnem maguktól megírják magukat. Az agent-korra ez environment-engineering > prompt-engineering formában fordítható. Az agent nem azért rontja el, mert rosszul promptolod; hanem mert hiányosak a lint-szabályok, instabil a build-rendszer, az agents.md pedig nem fedi le a tényleges projekt-konvenciókat.
Nate ezt a Pike-keretet a factory.ai agent-readiness-frameworkjével köti össze, ami nyolc pillér mentén méri fel egy kódbázis agent-érettségét: style/validation, build, testing, documentation, dev-environment, code-quality, observability/security és governance. Az alaptézis ugyanaz: az agent nem azért hibázik, mert “buta”, hanem mert a környezete nincs felkészítve rá. Ehhez jött öt konkrét production-failure-minta is. A context compression terén a factory-féle “anchored iterative summarization” jobban teljesít, mint az OpenAI compact endpoint-ja vagy az Anthropic teljes-summary-regenerációs megoldása. A codebase-instrumentation, a strict linting mint agent-policy-enforcement, a planner-executor multi-agent koordináció (egy szint a több helyett), és végül a specifikációs fáradtság — a context-graph építése nehezebb munka, mint promptot írni — együtt rajzolja ki, hogy hol szakad meg a lánc.
A SET-konvergencia direkt: amit az Anthropic 2025-ben a Building Effective Agents-ben fogalmazott meg, amit a factory.ai 2026-ban environment-readiness-szel kvantifikál, és amit Pike a 70-es évek óta Unix-hagyományként tanít — ugyanaz az engineering-fegyelem, csak új absztrakciós rétegen. A hype az, ami ezt elfedi.
Toby Lütke és az autoresearch — 53%-os Liquid-gyorsítás egyetlen menetben
A március 25-i Nate-videó egy konkrét production-eseten keresztül mutatja meg, mit jelent a negyedik agent-faj, az autoresearch. A rövid története: Karpathy március 6-án publikált egy “autoresearch” csomagot (weekend project, eredetileg ML-hyperparameter-optimalizálásra) — egy LLM-vezérelt experiment-loopot, ami egy konkrét metrikát iteratívan, hill-climbing-szerűen optimalizál. Toby Lütke ezt 12 napon belül a Liquid templating engine-re alkalmazta, ami a Shopify saját, 20 éves Ruby-template-engine-je, és minden Shopify-storefront alatt fut.
A számok beszédesek: az agent 120 kísérletből 93 commitot készített, és 53%-kal gyorsabb parse+rendert mért, 61%-kal kevesebb objektum-allokációval. Simon Willison megerősítése szerint a tokenizer StringScanner-ről String#byteindex-re cserélése egymaga 12%-os parse-time-csökkenést hozott — a single-byte byteindex-search nagyjából 40%-kal gyorsabb a regex-alapú skip_until-nél.
Az 53% itt nem önmagában érdekes (impresszív, de nem világelvonal), hanem azért, mert tisztán elválasztja a négy agent-fajt egymástól. Először is van a coding harness — Karpathy-stílusú single-threaded “engineer-in-a-box” —, ahol te managelsz, az agent egy konkrét task-ot visz végig. Másodszor a project-level coding harness, Cursor-stílusú planner+executor, hosszú futtatással, ahol egy planner-agent menedzseli a sub-agenteket; a W10-es Cursor-cloud-agents ide tartoznak. Harmadszor a dark factory: spec → eval-en átment kód, humán a tetején és alján, középen az agent. Itt jön be a 2026-os Amazon-incidens figyelmeztetése — junior-engineer AI-generálta production-bug, ami principal-engineer-szintű Seattle-meetinghez vezetett —, aminek a tanulsága az, hogy a humán-judgmentet ne az eval-középen, hanem az eval-után tartsd meg. Negyedszer az auto-research, ami nem szoftvert épít, hanem metrikát optimalizál; Toby Liquid-példája ennek a tiszta esete. És végül az orchestration, ahol specializált role-okban LLM-ek adják át egymásnak a feladatot — customer-success-pipeline, content-pipeline, Langraph / Crew AI területe.
A SET-tanulság az, hogy ne keverd a fajokat. A faj kiválasztása valójában a problem-shape kiválasztása, és a kulcskérdés mindig ugyanaz: van-e olcsó verifier (eval, teszt, mérhető metrika) a probléma kimenetére? Ha igen, dark-factory vagy auto-research működhet. Ha nincs, csak coding-harness vagy orchestration jöhet szóba.
Anthropic dispatch + computer use + scheduled tasks — a “work off the desk” háromszög
A március 27-i Nate-videó az Anthropic-féle managed OpenClaw-stack három primitív-rétegét rakja össze. A scheduled tasks felhőben időzített futtatást ad MCP-konnektorokkal; a dispatch telefonról több desktop-Claude-instance párhuzamos managelését; a computer use pedig közvetlen mouse-keyboard-kontrollt ott, ahol nincs MCP-szerver. A release-notes szerint a dispatch március 17-én, a computer use 23-án, a Claude Code remote tasks 20-án jelent meg.
Nate keretezése — “work off the desk” — itt egy direkt mérnöki kérdést tesz fel: a demókban látható “proactive briefing”-ek és “summary-feedek” valójában munkanövelő primitívek (több olvasnivaló), nem munkacsökkentők. A három együtt mégis kirajzolja azt a mintázatot, amit önmagában az OpenClaw is elővett, csak hardening nélkül: a kontroll-felület (telefon) szétválasztását a végrehajtó-felülettől (desktop). Ennek az iconic anekdotája Pavle Hurin product manager 48 órás dispatch-élménye: 25 perc parancsbeírás, 48 óra agent-futás. A computer use pedig pont ott tölti be a hézagot, ahol az MCP-coverage soha nem fog kiépülni: a régi Jira/SAP-példányokra natív konnektor sosem készül, ott a mouse-keyboard-screen marad az egyetlen híd.
Ezt belülről is megerősíti Peter Yang március 29-i podcastje Jenny Wennel, az Anthropic design-leadjével, aki a Cowork-terméket vezeti. Wen “garbage-in, treasure-out”-mintázat szerint használja a Coworkot UXR-elemzésre és heti monday-morning prezentáció-generálásra (scheduled task-ként). Két tanulság jön ebből: a research-preview az új beta — a Cowork-UI a launch óta négy-öt hét alatt háromszor változott —, és az internal dog-fooding az új primer feedback-loop, Slack-channelben futtatva, nem UXR-keretben.
Apróbb hírek a hétről
- Google Stitch 2.0 és Figma-stock −12%. Március 19-én a Google publikálta a Stitch update-et — vibe-design-koncepció, multi-screen UI hangból, infinite-canvas, MCP-readable design.markdown-export. A Figma részvénye két nap alatt 12%-ot esett (YTD 35%). Nate olvasata szerint nem a vibe-design a kulcs, hanem a design.markdown: text-readable, agent-readable design-system-rögzítés, ahonnan Cursor / Claude Code / Antigravity közvetlenül buildel. Az Anthropic erre április 17-én Claude Designnal válaszol majd.
- Remotion mint Claude Code skill — 150 000 install 8 hét alatt. Programozható video (React-komponens-per-frame, MP4-render); nem AI-generált pixel-video (Sora/Runway), hanem kód-alapú video — git-be megy, paraméterezhető, lokalizálható.
- Blender MCP — 17 000 GitHub-csillag. A 1500-operátoros Blender egy MCP-réteg mögött, természetes nyelven instruálható; a 3D-előállítás költsége nullához közelít.
- Latent Space — Heather Kulik MIT és az AI for materials. A március 24-i epizódban Kulik (MIT chemical engineering) elmondja: chemistry-szempontból az LLM-ek “Wikipedia-szintű” tudást adnak, de például egy 22-atomos ligandot egyetlen LLM sem tud tervezni. AlphaFold-ekvivalens materials-discoveryre nincs — más a probléma-shape: 20 aminosav helyett több ezer building-block, gyenge experimental-ground-truth. A mérnöki tanulság: az ML domain-szuperhozam nem általános; a hype-narratíva tudományos területekkel ütközve megáll.
- AI job-market K-shape. Nate március 26-i videója szerint 3,2:1 az AI-job-to-talent arány, 142 nap az átlagos role-fill-time (Manpower). A keresett skillek: specification-precision, eval/quality-judgment, multi-agent-decomposition, failure-pattern-recognition (a silent-failure a legveszélyesebb), trust/security-design, context-architecture, cost/token-economics — és ezek nem mind engineer-titulusú szerepek, ops és PM oldalon is megjelennek.
Mellékszál — Ras Laffan és a fizikai infrastruktúra fragilitása
Nate március 29-i videója a hét legfontosabb infrastruktúra-elemzése, és gyakorlatilag kiegyenlíti az egész szoftveroldali fejlődési-narratívát. A háttér az iráni háború része: márciusban rakéta-csapások érték a katari Ras Laffan LNG- és helium-üzemet, ami a világ helium-termelésének 33%-át adja. Heliumra a chip-fabrikációban nincs alternatíva: az EUV-lithográfia-gépek üzemeltetéséhez, a plasma-etching-hűtéshez (a wafer hátulja mögé fújva, hogy ne deformálódjon), és a vacuum-chamber leak-detection-höz (a helium a legkisebb elem, így a leak-érzékenyebb) kell. 6N (99,9999%-os) tisztaság az elvárás, és a világon csak néhány helyszín képes ezt előállítani.
A számok pakkban érkeznek. 14% permanent damage — ezt maga a QatarEnergy ismeri el, a helyreállítási idő akár 5 év. 35-48 nap, mire egy ISO-konténerben evaporál a tartalom — vagyis a kelet-ázsiai chip-fab-ek két hónapos ablakkal dolgoznak. A DRAM-ár már a leállás előtt +70%-on állt, a HBM sold-out, a helium-spot-ár megduplázódott. Korea 2025-ben a heliumigényének kétharmadát Katarból szerezte. Az Airgas, az USA legnagyobb ipari-gáz-distributora, március 17-én 50%-os szállítás-csökkentést és 13,50 dollár/100 köbláb surcharge-t jelentett be.
A geopolitikai másodfok itt is kirajzolódik: a Power of Siberia 2 kínai-orosz LNG-csővezeték most reális opcióvá válik Kína számára, és a kínai belföldi helium-termelés (Guangdong, 6N-certified) gyorsul. Ha a krízis évekig elhúzódik, Kína olcsó, nem-Katar-függő chip-fabrication-stacket épít, miközben Tajvan és Korea kitett marad.
SET-szempontból két konkrét üzenetet érdemes innen elvinni. Az első a compute-procurement now-not-later: ha az ITLine-prep része chip-igény, GPU-cluster vagy workstation-fleet, akkor a most vétel jobb, mint a hat hónap múlva vétel. Az árak nem fognak csökkenni, az allokációs-bizonytalanság nőni fog. A második az AI-roadmap szakaszolása: ha az ügyfél AI-projektet 12-18 hónapra tervez, a realisztikus inference-token-cost felfelé fog mozogni, és az enterprise-token-allokáció — különösen frontier-modellekre — kérdés lesz. Az on-prem / open-weight Mistral / Llama / Nemotron-stack érték-aránya javul, ahogy a hosted frontier-tokenek drágulnak.
Ez közvetlenül visszacsatol a W10-ben jelzett trillió-token-context-layer-tézisre: ha az iparági narratíva AWS/OpenAI-monopóliumra konvergál, és emellett a fizikai chip-supply szűkül, akkor egy on-prem agent-readable kontext-réteg értéke kettősen nő — egyrészt a vendor-lock-in elkerülésére, másrészt a token-cost-per-task előre ütemezésére.
Mit viszünk magunkkal (SET / ITLine)
A hét három kérdést hagy ott a prep-listán, mindhárom direktben használható az ügyfél-anyagokban.
Az első az agent-faj-mátrix mint diszkussziós keret. Ha egy ügyfél “agent-projektet” akar, az első kérdés ne a modell-választás legyen, hanem a probléma-shape: coding-harness, dark-factory, auto-research vagy orchestration? A verifier-szempont W07-es építőköve most kvantitatív formában tér vissza: van-e olcsó és gyors metrika a kimenetre? Toby Lütke 53%-os Liquid-gyorsítása nem azért működött, mert Karpathy autoresearch-csomagja “okos”, hanem mert a Liquid-engine-nek van benchmark-suite-ja és performance-metric-je. Ahol nincs ilyen, ott az első projekt-fázis a metrika kiépítése legyen, nem az agent-build.
A második az environment-first agent-readiness audit. A factory.ai nyolc-pillére konkrét kérdéssor, amivel egy ügyfél-kódbázis agent-érettsége gyorsan felmérhető — modelltől és harness-től függetlenül. Az ITLine-portfólióban ez tisztán lehatárolt szolgáltatás-csomag: pre-flight audit 2-4 hetes engagementben, a tényleges agent-rollout előtt. A Pike-féle keretezés ezt régi engineering-fegyelemként teszi eladhatóvá — CTO-szintű döntéshozónak ez hitelesebb, mint a hype-narratíva.
A harmadik a compute-procurement és a context-layer mint kettős fedezet a chip-krízis ellen. Ras Laffan-implikációként: ha 2026 második felére AI-projektet ütemezünk, akkor most kell beszerezni a hardware-t, és az architektúrában nem szabad vasba írni a frontier-token-fogyasztást — a verifier, az audit-log és a tool-szerződések modell-független rétegek, építsük úgy őket, hogy on-prem és cloud-frontier között átállítható backend legyen. Ez a “ha a modellek okosabbak lesznek, eltűnik a moat-od”-tézis W07-ből, most inverzben: ha a modellek ritkábbak vagy drágábbak lesznek, működik még a stack? A jó válasz akkor “igen”, ha a verifier modell-független és a context-layer agent-readable.
A W14-re várhatóan érkeznek az első Anthropic Claude Design release-ek (válasz a Stitchre), és a Cursor cloud-agent-volumen első számai.
Források
Fő forrás — Nate B Jones csatornája:
- 2026-03-23 · I Mapped Where Every AI Agent Actually Sits — OpenClaw-univerzum négy stratégiai fogadása (sovereignty / delegation / distribution / safety).
- 2026-03-24 · Nvidia Just Open-Sourced What OpenAI Wants You to Pay Consultants For — Nemo Claw és Pike öt szabálya, factory.ai agent-readiness, öt production-failure-pattern.
- 2026-03-25 · Tobi Lütke Made a 20-Year-Old Codebase 53% Faster Overnight — autoresearch + a négy agent-faj különbsége.
- 2026-03-26 · The AI Job Market Split in Two — K-shaped market, hét keresett skill, 3.2:1 ratio.
- 2026-03-27 · A Markdown File Just Replaced Your Most Expensive Design Meeting — Stitch / Remotion / Blender MCP, design.markdown export, cmd-line creative.
- 2026-03-28 · Anthropic Just Gave You 3 Tools That Work While You’re Gone — dispatch + computer use + scheduled tasks, “work off the desk” framework.
- 2026-03-29 · 48 Days Until the Helium Runs Out for AI Chips — Ras Laffan-elemzés, fizikai supply-chain-fragilitás.
Körbejárás / tech-mélység — Latent Space podcast:
- 2026-03-24 · There Is No AlphaFold for Materials — Heather Kulik (MIT) — chemical-engineering-perspektíva, miért nincs AlphaFold-ekvivalens materials-discovery-re, ML model-adat-tisztaság, autonomous-lab-limits.
Bemutatós / mintaeset — Peter Yang Creator Economy:
- 2026-03-29 · Claude Cowork Tutorial — Jenny Wen (Anthropic Design Lead) — 40 perces Cowork-belső use-case, weekly Monday-morning scheduled task, internal dog-fooding mint product-feedback-rendszer.
Fact-check és hivatkozott eredeti források:
- NVIDIA — NemoClaw announcement (2026-03-16)
- TechCrunch — Nvidia’s NemoClaw could solve OpenClaw’s biggest problem (2026-03-16)
- GitHub — NVIDIA/NemoClaw
- Claude release notes — dispatch (2026-03-17), computer use (2026-03-23), remote tasks (2026-03-20)
- TechCrunch — Anthropic launches Claude Design (2026-04-17)
- DevOps.com — Claude Code Routines: cloud-scheduled AI tasks (2026-04-14, kontextus a march 20-i remote tasks-hoz)
- CNBC — Figma stock drops 12% after Google Stitch ‘vibe design’ update (2026-03-19)
- Simon Willison — Shopify Liquid 53% faster parse+render via autoresearch (2026-03-13)
- Shopify Engineering — Autoresearch isn’t just for training models
- Aakash Gupta — PM’s Guide to Karpathy’s Autoresearch
- Fortune — Iran war cuts off helium from Qatar (2026-03-21)
- CNBC — Asia tech stocks sink as Qatar attacks threaten chip supply (2026-03-19)
- Caixin Global — Qatar Helium Shutdown Adds New Risk to Chip Supply Chain (2026-03-16)
A heti hírlevelet saját gondolatainkból és független keresésekből állítjuk össze. Az eredeti források a fenti listában találhatók.