Testování distribuovaných systémů pomocí AI agentů

Testování distribuovaných systémů je často složitý úkol, který vyžaduje důkladné porozumění nejen architektuře systému, ale také dynamice, která se v těchto systémech odehrává. Podle výzkumu na GitHubu, konkrétně v repozitáři shenli/distributed-system-testing, se ukazuje, že AI agenti mohou hrát klíčovou roli při zefektivnění procesu testování. Tento přístup se zaměřuje na schopnosti AI agentů navrhovat a provádět testy, které jsou řízené nároky produktu.

Jak AI agenti přetvářejí testování

Tradičně bylo testování distribuovaných a stavových systémů založeno na psaní několika integračních testů a na základě toho považováno za hotové. Nicméně, tento postup odhaluje pouze malou část chyb, které mohou vést k selhání systému v produkčním prostředí. Vyskytují se například problémy jako částečné oddělení sítě, nedeterministická konkurence, selhání při obnově po výpadku, a další.

AI agenti v tomto kontextu přinášejí novou metodologii, která je založena na nárocích produktu, nikoli pouze na testovacích scénářích. Tento přístup se nazývá "claim-driven testing" (testování řízené nároky). To znamená, že každý test je navržen tak, aby se pokusil vyvrátit konkrétní nárok produktu. Takovýto test je obtížnější oslabit, protože je pojmenován podle svých nároků, nikoli podle nastavení.

Dvě klíčové dovednosti AI agentů

V rámci výzkumu byly identifikovány dvě dovednosti AI agentů, které jsou zásadní pro testování distribuovaných systémů:

Dovednost návrhu testovacího plánu: Tato dovednost je zodpovědná za vytvoření strukturovaného testovacího plánu, který začíná od nároků produktu. Generuje hypotézy, které jsou s těmito nároky spojeny, a vytváří scénáře, které se snaží jednotlivé hypotézy vyvrátit. Každý scénář je přitom pojmenován podle nároku, který se snaží otestovat.
Dovednost provádění testu: Druhá dovednost se zaměřuje na provádění testovacího plánu a generování zprávy o nálezech. Tato zpráva obsahuje podrobnosti o výsledcích testů a klasifikaci chyb podle různých kategorií, jako je systém (SUT), nasazení (harness), kontrola (checker) a prostředí (environment).

Tyto dovednosti spolupracují tak, aby výsledkem byla strukturovaná zpráva o nálezech a testovací plán v Markdown formátu, což usnadňuje přehlednost a čitelnost pro další revizory.

Zajímavý detail je 9-stavová taxonomie verdiktů — nejde jen o PASS/FAIL, ale rozlišuje i INCONCLUSIVE a klasifikuje vinu na SUT/harness/checker/environment. To řeší klasický problém distribuovaného testování: test selhal, ale je to chyba systému, nebo špatně napsaného testu? Toto rozlišení mi přijde podceňované a jsem rád že ho někdo explicitně pojmenoval.

Důležitost strukturovaného testovacího plánu

Jedním z klíčových prvků testování distribuovaných systémů je strukturovaný testovací plán, který obsahuje argumenty o dostatečnosti pokrytí a konzervativní prohlášení o důvěře v provedené testy. Tento plán by měl také obsahovat seznam toho, co zůstává neověřeno, což umožňuje vývojářům a testerům lépe pochopit rizika spojená se systémem.

Důvodem pro tuto strukturovanost je, že testy distribuovaných systémů by měly být zaměřeny na identifikaci specifických slabin a problémů, které se mohou vyskytovat v produkčním prostředí. Tímto přístupem se zvyšuje pravděpodobnost, že budou odhaleny chyby, které by jinak zůstaly skryté.

Využití existujících nástrojů

Dovednost provádění testu se zaměřuje na objevování již existujících testů, provozních příruček a rámců pro injekci chyb — než by vymýšlela něco nového. Projekt má dokonce katalog 8 referenčních technik (Jepsen, chaos engineering, fuzzing, formální metody a další) které agent může využít jako základ.

Přístup byl ověřen na projektu AgentDB — to mi přijde důležité. Spoustu podobných nástrojů je čistě teoretických, tady je alespoň jeden reálný příklad kde to fungovalo.

Závěrem

Testování distribuovaných a stavových systémů je náročné, ale s pomocí AI agentů, kteří se zaměřují na nároky produktu a využívají existující nástroje, se tento proces může stát efektivnějším a cílenějším. Tímto způsobem mohou vývojáři a testeři lépe porozumět slabinám svých systémů a zabezpečit jejich spolehlivost v produkčním prostředí.

Zdroj

shenli/distributed-system-testing