dc.contributor
Universitat Politècnica de Catalunya. Departament de Teoria del Senyal i Comunicacions
dc.contributor
Lázaro Villa, José Antonio
dc.contributor.author
López Bermudo, Marc
dc.date.issued
2023-10-24
dc.identifier
https://hdl.handle.net/2117/407068
dc.identifier
ETSETB-230.179895
dc.description.abstract
Multi-Input Multi-Output (MIMO) radar systems have been extensively studied for their potential to enhance target tracking in complex environments. Recent advancements in the field of Artificial Intelligence (AI) and Machine Learning (ML) have significantly contributed to further improving the performance of these systems. This thesis focuses on studying a Reinforcement Learning (RL) model that employs an enhanced SARSA algorithm for MIMO tracking radar, starting from a RL approach of multi-target detection for cognitive radar (CR). A Monte Carlo method is used to generate randomness for noise, and targets are detected through a robust Wald type test statistic. We implemented a modified Double SARSA algorithm in the system model, as well as, added a new set of scenarios based on randomness in the position of the targets and their appearance in them. Finally, we evaluated the performance of both algorithms under this scenarios.
dc.description.abstract
Los sistemas de radar Multi-Input Multi-Output (MIMO) han sido ampliamente estudiados debido a su potencial para mejorar el seguimiento de objetivos en entornos complejos. Los recientes avances en el campo de la Inteligencia Artificial (IA) y el Aprendizaje Automático (AA) han contribuido significativamente a mejorar aún más el rendimiento de estos sistemas. Esta tesis se enfoca en estudiar un modelo de Aprendizaje por Refuerzo que utiliza un algoritmo SARSA mejorado para el seguimiento de radar MIMO, partiendo de un enfoque de RL para la detección de múltiples objetivos para radar cognitivo (CR). Se utiliza un método de Monte Carlo para generar aleatoriedad en el ruido, y los objetivos se detectan a través de una prueba robusta de estadística de tipo Wald. Además, se ha implementado un algoritmo Double SARSA modificado en el modelo radar, así como un nuevo conjunto de escenarios basados en la aleatoriedad en la posición de los objetivos y su aparición en ellos. Finalmente, se evalua el rendimiento de detección del radar para ambos algoritmos en estos escenarios.
dc.description.abstract
Els sistemes de radar Multi-Input Multi-Output (MIMO) han estat àmpliament estudiats a causa del seu potencial per millorar el seguiment d'objectius en entorns complexos. Els avenços recents en el camp de la Intel·ligència Artificial (IA) i l'Aprenentatge Automàtic (AA) han contribuït significativament a millorar encara més el rendiment d'aquests sistemes. Aquesta tesi s'enfoca en estudiar un model d'aprenentatge per reforç que utilitza un algorisme SARSA millorat pel seguiment de radar MIMO, el cual parteix d'un enfocament de RL per a la detecció de múltiples objectius per a radar cognitiu (CR), basats. S'utilitza un mètode de Monte Carlo per generar aleatorietat al soroll, i els objectius es detecten mitjançant una prova robusta d'estadística de tipus Wald. A més, s'ha implementat un algorisme Double SARSA modificat i un nou conjunt d'escenaris basats en l'aleatorietat en la posició dels objectius i la seva aparició. Finalment, s'avalua el rendiment de detecció del radar per a tots dos algorismes en aquests escenaris.
dc.format
application/pdf
dc.publisher
Universitat Politècnica de Catalunya
dc.rights
S'autoritza la difusió de l'obra mitjançant la llicència Creative Commons o similar 'Reconeixement-NoComercial- SenseObraDerivada'
dc.subject
Àrees temàtiques de la UPC::Enginyeria de la telecomunicació::Radiocomunicació i exploració electromagnètica::Radar
dc.subject
Monte Carlo method
dc.subject
Machine learning
dc.subject
Synthetic aperture radar
dc.subject
Intelligent agents (Computer software)
dc.subject
Agents intel·ligents (Programari)
dc.subject
Aprenentatge automàtic
dc.subject
Simuladors de radar
dc.subject
Montecarlo, Mètode de
dc.subject
Aprenentatge automàtic
dc.subject
Radar d'obertura sintètica
dc.subject
Agents intel·ligents (Programari)
dc.title
MIMO tracking radar performance analysis with reinforcement learning: SARSA and modified double SARSA approach