Games in Machine Learning: Differentiable n-Player Games and Structured Planning

Altres autors/es

Universitat Politècnica de Catalunya. Departament de Teoria del Senyal i Comunicacions

Courant Institute of Mathematical Sciences

Bruna, Joan

Pascual Iserte, Antonio

Data de publicació

2019-05-30

Resum

L'objectiu de l'estada és ampliar les capacitats actuals dels models d'exploració en entorns amb estructura aritmètica i geomètrica. L'estudiant serà exposat a l'avantguarda de la recerca en les àrees de deep learning i reinforcement learning, amb ús de biblioteques de programari com Pytorch. El primer objectiu és desenvolupar el model en entorns simulats. El segon objectiu és utilitzar el model en entorns continus. El treball serà presentat en una conferència de primer nivell de machine learning.


Outgoing

Tipus de document

Bachelor thesis

Llengua

Anglès

Publicat per

Universitat Politècnica de Catalunya

Citació recomanada

Aquesta citació s'ha generat automàticament.

Drets

http://creativecommons.org/licenses/by-nc-nd/3.0/es/

Open Access

Attribution-NonCommercial-NoDerivs 3.0 Spain

Aquest element apareix en la col·lecció o col·leccions següent(s)