Natural language models for learning assessment from unstructured data

Espasa Rosell, Jordi; Espasa Rosell, Jordi

Natural language models for learning assessment from unstructured data

Per accedir als documents amb el text complet, si us plau, seguiu el següent enllaç: https://hdl.handle.net/2117/445762

Autor/a

Espasa Rosell, Jordi

Altres autors/es

Universitat Politècnica de Catalunya. Departament de Ciències de la Computació

Sallés Rius, Anna

Data de publicació

2025-10-20

Resum

This Master's Thesis optimizes large language models (LLMs) for multiple-choice question answering (MCQA) to evaluate employee performance from spoken transcripts in personalized training platforms. Current LLMs achieve only 63% accuracy in dynamic assessments due to biases, reasoning failures, and inefficiencies. We develop a systematic framework balancing precision, cost, and execution time through iterative evaluation refinement, corpus preparation, baseline selection, and phased experiments, including single-factor screening (OFAT), multi-factor interactions, and parameter-efficient fine-tuning (PEFT). Key factors assessed include model scale, in-context learning, chain-of-thought (CoT), chain-of-density (CoD), self-correction, and agentic ensembles. Contributions encompass a replicable optimization pipeline and strategies to mitigate biases like positional and literal interpretation errors. Results show improvements from 63% to 80% accuracy and enhanced F1-scores, enabling ethical, scalable AI-driven assessments for enterprise individualized learning.

Tipus de document

Master thesis

Llengua

Anglès

Matèries i paraules clau

Àrees temàtiques de la UPC::Informàtica::Intel·ligència artificial::Aprenentatge automàtic; Deep learning (Machine learning); Questions and answers; Models de llenguatge de gran escala; Resposta a preguntes d'opció múltiple; Avaluació del rendiment d'empleats; Transcripcions orals; Plataformes de formació personalitzada; Optimització de models; Precisió en avaluacions dinàmiques; Biaixos en models d'IA; Fallades de raonament; Marc sistemàtic; Refinament iteratiu d'avaluació; Preparació de corpus; Selecció de línia base; Experiments per fases; Cribratge d'un sol factor; Large language models; Multiple-choice question answering; Employee performance evaluation; Spoken transcripts; Mersonalized training platforms; Model optimization; Accuracy in dynamic assessments; AI model biases; Reasoning failures; Systematic framework; Iterative evaluation refinement; Corpus preparation; Baseline selection; Phased experiments; One-factor-at-a-time screening; Multi-factor interactions; Parameter-efficient fine-tuning; Model scale; In-context learning; Chain-of-thought; Aprenentatge profund (Aprenentatge automàtic); Preguntes i respostes

Publicat per

Universitat Politècnica de Catalunya

Citació recomanada

Aquesta citació s'ha generat automàticament.

Exportar

DIDL MARC MARC_CCUC METS OAI_DC ORE QDC RDF

Drets

Open Access

Aquest element apareix en la col·lecció o col·leccions següent(s)

Treballs acadèmics [82549]

Natural language models for learning assessment from unstructured data

Autor/a

Altres autors/es

Data de publicació

Compartir

Resum

Tipus de document

Llengua

Matèries i paraules clau

Publicat per

Citació recomanada

Exportar

Drets

Aquest element apareix en la col·lecció o col·leccions següent(s)