Natural language models for learning assessment from unstructured data

Espasa Rosell, Jordi; Espasa Rosell, Jordi

Natural language models for learning assessment from unstructured data

Para acceder a los documentos con el texto completo, por favor, siga el siguiente enlace: https://hdl.handle.net/2117/445762

Autor/a

Espasa Rosell, Jordi

Otros/as autores/as

Universitat Politècnica de Catalunya. Departament de Ciències de la Computació

Sallés Rius, Anna

Fecha de publicación

2025-10-20

Resumen

This Master's Thesis optimizes large language models (LLMs) for multiple-choice question answering (MCQA) to evaluate employee performance from spoken transcripts in personalized training platforms. Current LLMs achieve only 63% accuracy in dynamic assessments due to biases, reasoning failures, and inefficiencies. We develop a systematic framework balancing precision, cost, and execution time through iterative evaluation refinement, corpus preparation, baseline selection, and phased experiments, including single-factor screening (OFAT), multi-factor interactions, and parameter-efficient fine-tuning (PEFT). Key factors assessed include model scale, in-context learning, chain-of-thought (CoT), chain-of-density (CoD), self-correction, and agentic ensembles. Contributions encompass a replicable optimization pipeline and strategies to mitigate biases like positional and literal interpretation errors. Results show improvements from 63% to 80% accuracy and enhanced F1-scores, enabling ethical, scalable AI-driven assessments for enterprise individualized learning.

Tipo de documento

Master thesis

Lengua

Inglés

Materias y palabras clave

Àrees temàtiques de la UPC::Informàtica::Intel·ligència artificial::Aprenentatge automàtic; Deep learning (Machine learning); Questions and answers; Models de llenguatge de gran escala; Resposta a preguntes d'opció múltiple; Avaluació del rendiment d'empleats; Transcripcions orals; Plataformes de formació personalitzada; Optimització de models; Precisió en avaluacions dinàmiques; Biaixos en models d'IA; Fallades de raonament; Marc sistemàtic; Refinament iteratiu d'avaluació; Preparació de corpus; Selecció de línia base; Experiments per fases; Cribratge d'un sol factor; Large language models; Multiple-choice question answering; Employee performance evaluation; Spoken transcripts; Mersonalized training platforms; Model optimization; Accuracy in dynamic assessments; AI model biases; Reasoning failures; Systematic framework; Iterative evaluation refinement; Corpus preparation; Baseline selection; Phased experiments; One-factor-at-a-time screening; Multi-factor interactions; Parameter-efficient fine-tuning; Model scale; In-context learning; Chain-of-thought; Aprenentatge profund (Aprenentatge automàtic); Preguntes i respostes

Publicado por

Universitat Politècnica de Catalunya

Citación recomendada

Esta citación se ha generado automáticamente.

Exportar

DIDL MARC MARC_CCUC METS OAI_DC ORE QDC RDF

Derechos

Open Access

Este ítem aparece en la(s) siguiente(s) colección(ones)

Treballs acadèmics [82545]

Natural language models for learning assessment from unstructured data

Autor/a

Otros/as autores/as

Fecha de publicación

Compartir

Resumen

Tipo de documento

Lengua

Materias y palabras clave

Publicado por

Citación recomendada

Exportar

Derechos

Este ítem aparece en la(s) siguiente(s) colección(ones)