Vietinis AI: iš eksperimento į produkciją
Dar 2024 m. paleisti LLM lokaliai buvo technologų pomėgis. 2026 m. AMD Gaia 0.1.7 su „Ryzen AI" aparatūra paverčia tai realiu verslo sprendimu — su agentinėmis galimybėmis, be cloud priklausomybės.
AMD Gaia yra atviro kodo agentų frasework'as, optimizuotas AMD Ryzen AI procesorių NPU (Neural Processing Unit) galimybėms. Jis leidžia paleisti mažesnius LLM (Llama 3, Phi-3, Mistral 7B) tiesiogiai kompiuteryje — be interneto, be API mokesčių, be duomenų perdavimo trečiosioms šalims.
Kaip veikia AMD Gaia
Gaia yra ne vienas produktas, o ekosistema:
[Vartotojas / Aplikacija]
↓
[Gaia Agent Framework] ← orkestracija, atminties valdymas
↓
[LLM Runtime] ← vietinis modelio paleidimas
↓
[AMD NPU / GPU] ← aparatūros akceleracija
- Gaia Agent Core — agentų orkestracija, įrankių naudojimas, atminties valdymas
- OnnxRuntime / DirectML — modelių paleidimas AMD aparatūroje
- Ryzen AI Software — NPU driver'iai ir optimizavimas
- Gaia API — REST API, suderinamas su OpenAI formatu
OpenAI formato suderinamumas yra kritinis — tai reiškia, kad aplikacijos, naudojančios OpenAI API, gali pereiti prie Gaia pakeičiant tik endpoint URL.
Kokia aparatūra reikalinga
Gaia 0.1.7 oficialiai palaiko:
| Modelis | NPU | RAM | Rekomenduojamas LLM |
|---|---|---|---|
| Ryzen AI 9 HX 370 | 50 TOPS | 32 GB | Llama 3.1 8B, Phi-3.5 |
| Ryzen AI 9 365 | 40 TOPS | 16 GB | Phi-3 Mini, Mistral 7B |
| Ryzen 9 7945HX + GPU | Radeon 780M | 32 GB | Llama 3 8B |
| Ryzen AI Pro (Strix Halo) | 55 TOPS | 64 GB | Llama 3.1 70B (kvantuotas) |
- AMD EPYC Genoa + Instinct MI300X — didelių modelių paleidimui (~70B parametrų)
- Pradinė investicija: €3 000–15 000 už serverio stotį
BDAR ir privatumo nauda
Tai pagrindinis verslo argumentas lokaliam AI.
Duomenys neišeina iš patalpos
Kai LLM veikia lokaliiai:
- Jokių duomenų siuntimo į JAV ar kitus trečiuosius serverius
- Jokių duomenų tvarkymo sutarčių su AI tiekėjais
- Pilna duomenų gavėjų kontrolė
Praktinis pavyzdys: Advokatų kontora analizuoja konfidencialias sutartis. Su cloud AI — sutarties tekstas keliauja į OpenAI serverius. Su lokaliu Gaia — tekstas niekada neišeina iš biuro tinklo.
BDAR straipsnio 44 reikalavimai
Duomenų perdavimas į trečiąsias šalis (pvz., JAV) reikalauja papildomų apsaugos priemonių (standartinės sutarčių sąlygos, duomenų apsaugos vertinimai). Vietinis AI eliminuoja šį reikalavimą — duomenys niekada neišeina iš ES.
Komercinės paslapties apsauga
Ne visos privatumo problemos susijusios su BDAR. Verslas dažnai turi:
- Proprietary duomenys — gamybos formulės, kainų modeliai, klientų sąrašai
- Strateginiai planai — dar neskelbiami produktai, M&A derybos
- Intelektinė nuosavybė — kodas, dizainai, patentai
Cloud AI atveju šie duomenys patenka į tiekėjo serverius. Net jei tiekėjas žada nekonfidencialumo, teisinė apsauga yra ribota.
Vietinis AI šios rizikos eliminavimas — vientisas argumentas pareigūnams ir teisininkams.
Našumo realybė: greitis ir tikslumas
Lokalis modelis visada bus lėtesnis nei cloud — tai faktas. Klausimas, ar skirtumas priimtinas.
| Metrika | Gaia (Llama 3.1 8B, NPU) | OpenAI GPT-4o mini |
|---|---|---|
| Pirmo tokeno laikas | ~1,2 sek. | ~0,4 sek. |
| Generavimo greitis | ~25 tok/sek | ~80 tok/sek |
| Tikslumas (bendros žinios) | 75–80% | 90–95% |
| Dokumentų analizė | 80–85% | 88–92% |
| Kaina per milijoną tokenų | ~€0 (tik elektra) | €0,15 |
Išvada: Gaia yra ~3x lėtesnis ir šiek tiek mažiau tikslus. Tačiau kai kaina yra nulinė (po aparatūros investicijos), tai gali būti puikiai priimtina.
Agentų galimybės su Gaia 0.1.7
Gaia 0.1.7 prideda reikšmingų agentinių galimybių:
- Įrankių naudojimas (function calling) — lokaliai veikiantis agentas gali kviesti API, skaityti failus, vykdyti kodus
- Atminties valdymas — ilgos pokalbių istorijos be konteksto praradimo
- RAG integracija — vietinė vektorinė duomenų bazė (ChromaDB, pgvector) + dokumentų ekstrakcija
- Multi-agent orkestracija — keli lokalūs agentai koordinuojasi
Praktinis scenarijus: Buhalterinė sistema, kuri:
- Nuskaito sąskaitas faktūras (lokalus OCR + Gaia Vision)
- Klasifikuoja išlaidas (lokalus LLM)
- Generuoja apskaitos įrašus (lokalus agentas + buhalterinės sistemos API)
- Siunčia santrauką vadovui (el. paštas per vietinį serverį)
Visas procesas — jokio duomenų perdavimo į išorę.
Kada vietinis AI turi prasmę verslui
Jautri dokumentacija (teisinė, finansinė, medicinos)
Didelis dokumentų apdorojimo srautas (kaina svarbi)
Nuolatinis naudojimas (cloud kaina auga proporcianaliai)
Greito interneto ryšio stoka (pramonė, logistika)
Retiniai naudojimo atvejai (aparatūra neapsimoka)
Reikalingas pats galingiausias modelis (GPT-4o, Claude 3.5)
Komandinė prieiga iš daugelio vietų (serveris reikalingas)
WebEdge ir vietiniai AI sprendimai
„WebEdge" diegia lokalias AI sistemas Lietuvos verslui — nuo AMD Ryzen AI darbo stoties iki EPYC serverių su Gaia stack:
- Aparatūros parinkimas pagal jūsų apkrovą
- Modelių kalibracija jūsų dokumentų tipams
- Integracija su esamomis verslo sistemomis
- BDAR atitikties dokumentavimas
WebEdge sukuria demo per 7 dienas su jūsų verslo duomenimis. Kaina prasideda nuo €499.
Dažnai užduodami klausimai
Gaia yra optimizuotas AMD NPU, tačiau modeliai gali veikti ir NVIDIA GPU per CUDA backend. Intel aparatūroje — galima per OpenVINO, bet be oficialios palaikymo. Geriausias rezultatas — su AMD Ryzen AI arba Instinct serija.
Ryzen AI 9 nešiojamas kompiuteris — ~20–35W AI darbo metu. Serveris su EPYC + Instinct — 300–600W. Mėnesio elektros kaina serveriui: ~€30–60 (Lietuvos tarifais). Palyginimui: cloud GPU valanda — €1–3.
Taip, tai dažnas sprendimas. Neslapti duomenys → cloud (greičiau, tiksliau). Slapti duomenys → vietinis Gaia. Toks hibridinis modelis optimizuoja ir kainą, ir saugumą.
FAQ
Pagrindiniai komponentai:
Serverio aplinkoje:
Tinkamas:
Netinkamas:
Ar AMD Gaia veikia su Intel ar NVIDIA aparatūra?
Kiek elektros energijos naudoja vietinis AI serveris?
Ar galima derinti vietinį ir cloud AI?