Jemné ladění modelu Qwen 3:0.6B pro kategorizaci otázek

V nedávném experimentu se autor zaměřil na jemné ladění modelu Qwen 3:0.6B pro účely kategorizace otázek týkajících se domácnosti. Původně měl model přesnost pouze 10 %, když správně kategorizoval pouze 13 z 131 otázek. Tento výsledek ukázal, že model nemůže poskytnout spolehlivý výkon pouze na základě promptování.

Po prvním pokusu o jemné ladění se přesnost zvýšila na 79 %. Autor použil open-source framework Unsloth a strategii QLora pro jemné ladění. Dataset pro trénink obsahoval přibližně 850 datových položek, které byly rozděleny do tréninkových, evaluačních a testovacích dat.

Druhý pokus o jemné ladění přinesl ještě lepší výsledky, kdy model dosáhl přesnosti 92 %. Tento nárůst byl dosažen díky jednoduchému vylepšení promptu, kdy byly kategorie mapovány na dvoupísmenné kódy bez překrývajícího se významu. Tato změna pomohla modelu generovat přesnější odpovědi, protože se vyhnul problémům s kategoriemi, které měly podobný význam, jako například "water heater" a "pool".

Model stále vykazuje chyby v kategorizaci, zejména u kategorií s překrývajícím se významem. Autor plánuje dále zlepšit tréninková data, aby se tyto problémy minimalizovaly.

Celkově experiment ukazuje, že i malé modely jako Qwen 3:0.6B mohou být efektivně jemně laděny pro specifické úkoly, jako je kategorizace otázek.