Metódy adaptácie a vylepšovania veľkých jazykových modelov pre praktické aplikácie

Školitel

prof. Ing. Martin Klimo, PhD.

Školitel špecialista

Ing. Peter Tarábek, PhD.

Študijný program

Aplikovaná informatika

Študijný odbor

Informatika

Detailnejší opis problému

Veľké jazykové modely (LLM) predstavujú významný míľnik v umelej inteligencii, ale ich praktické nasadenie čelí výzvam v oblasti adaptácie, spoľahlivosti a škálovateľnosti. Výskum v tejto oblasti má potenciál významne prispieť k ich bezpečnejšiemu využitiu v praxi. V súčasnosti existujú prístupy ako parameter-efficient fine-tuning (LoRA, prompt tuning), retrieval-augmented generation (RAG) pre prácu s dokumentami, chain-of-thought reasoning pre vysvetliteľnosť a knowledge distillation pre škálovateľnosť. Napriek pokroku zostávajú výzvy v oblasti robustnosti a praktickej použiteľnosti. Výskumné smery riešenia: Prvým smerom sú adaptívne metódy učenia zamerané na efektívne prispôsobovanie modelov novým doménam. Zahŕňa vývoj nových a hybridných prístupov využívajúcich LoRA a prompt tuning, s dôrazom na optimalizáciu výpočtových zdrojov a minimalizáciu trénovacích dát. Druhým smerom je vysvetliteľnosť a spoľahlivosť, kde je potrebné zabezpečiť verifikovateľnosť výstupov. Výskum sa zameriava na systematické metódy verifikácie chain-of-thought procesov. Tretím smerom je spracovanie rozsiahlych dokumentov, ktoré sa zameriava na prekonanie limitovaného kontextového okna LLM a zlepšenie práce s rozsiahlymi zdrojmi informácií. Tento smer zahŕňa vývoj hierarchických prístupov, ktoré dokážu efektívne analyzovať a spracovávať dokumenty na rôznych úrovniach granularity. Kľúčovú úlohu zohráva výskum pokročilých retrieval stratégií, od RAG systémov až po sofistikovanejšie adaptívne prístupy. Očakávané výstupy zahŕňajú nové adaptačné metódy, systematické prístupy k verifikácii a vylepšené metódy spracovania dokumentov, merané štandardnými metrikami v daných oblastiach.

Predpokladaný vedecký prínos (algoritmy, metodológie, ...)

Očakávané výstupy môžu zahŕnať nové metódy adaptácie LLM, systematické prístupy k verifikácii a zabezpečeniu spoľahlivosti LLM, vylepšené metódy pre prácu s rozsiahlymi dokumentmi, metodiky použitia, implementácie vyvinutých metód a publikácie.

Odporučány postup vedeckého bádania

1. Analýza súčasného stavu - Systematický prehľad existujúcich metód - Identifikácia silných / slabých stránok a potencionálnych vylepšení 2. Formulácia hypotéz a výskumných otázok - Definícia konkrétnych cieľov - Návrh evaluačných metrík 3. Vývoj a implementácia navrhovaných metód - Iteratívne testovanie a vylepšovanie - Zber experimentálnych dát 4. Evaluácia a validácia výsledkov - Porovnanie s existujúcimi riešeniami - Validácia hypotéz 5. Publikácia a diseminácia výsledkov

Druh výskumu

aplikovaný výskum

Výskumná úloha, ktorej súčasťou bude riešená téma

09I05-03-V02-00029

Doterajšie výsledky riešenia na školiacom pracovisku, vrátane odkazov na dostupné zdroje

1. Tarábek, Peter, and Dávid Matis. "Exploration Degree Bias: The Hidden Influence of Node Degree in Graph Neural Network-based Reinforcement Learning." IEEE Access (2025). 2. Klimo, Martin, Jaroslav Kopčan, and L’ubomír Králik. "Explainability as a Method for Learning From Computers." IEEE Access 11 (2023): 35853-35865. 3. Klimo, Martin, Peter Lukáč, and Peter Tarábek. "Deep neural networks classification via binary error-detecting output codes." Applied Sciences 11.8 (2021): 3563. 4. Ondrašovič, Milan, and Peter Tarábek. "Siamese visual object tracking: A survey." IEEE Access 9 (2021): 110149-110172. 5. Ondrašovič, Milan, and Peter Tarábek. "Homography ranking based on multiple groups of point correspondences." Sensors 21.17 (2021): 5752. 6. Fabricius, René, Ondrej Šuch, and Peter Tarábek. "Deep neural network ensembles using class-vs-class weighting." IEEE Access (2023). 7. Cimrák, Ivan, Peter Tarábek, and František Kajánek. "Curated Dataset for Red Blood Cell Tracking from Video Sequences of Flow in Microfluidic Devices." Data 8.6 (2023): 106. 8. Klimo, Martin, Jaroslav Kopčan, and Ľubomír Králik. "Explainability as a Method for Learning from Computers." IEEE Access (2023). 9. Kajánek, František, Ivan Cimrák, and Peter Tarábek. "Automated Tracking of Red Blood Cells in Images." International Work-Conference on Bioinformatics and Biomedical Engineering. Cham: Springer International Publishing, 2020.

V prípade otázok sa obráťte na vedúceho témy:

Martin.Klimo@fri.uniza.sk
An unhandled error has occurred. Reload 🗙