Minha Dissertação de Mestrado

Posted by Ícaro Motta |04 jul 19 | 0 comments

Minha Dissertação de Mestrado

Hoje, estou postando aqui minha Dissertação de Mestrado em Computação pela UFF. O título da minha dissertação foi APRENDIZAGEM POR REFORÇO E POR IMITAÇÃO COM REDES NEURAIS APLICADA AO JOGO BOMBERMAN. Fui orientado pela professora Aline Paes e pelo professor Esteban Clua.

Resumo:

Desenvolver agentes artificiais capazes de jogar bem é um objetivo de longa data na área de IA para jogos. Recentemente, surgiram vários casos de sucesso, impulsionados principalmente por técnicas que reúnem Aprendizagem por Reforço (RL) e aprendizagem baseada em redes neurais. Entretanto, a maioria dos resultados foi obtido usando apenas as imagens gráficas da tela do jogo, com recursos físicos caros para se efetuar os cálculos e com importantes restrições pela falta de conhecimento do contexto do jogo. Nesta dissertação propomos o desenvolvimento de um Ambiente de Aprendizado aplicado ao jogo Bomberman (BLE) com o objetivo de verificar se os algoritmos de RL conseguem aprender a jogar sem informações privilegiadas. Escolhemos o jogo Bomberman por ser um jogo com regras claras e ser um jogo amplamente adotado como plataforma de testes na literatura do assunto. O BLE inclui o algoritmo de Otimização de Política Proximal (PPO) que pode ser usado com um Perceptron de Múltiplas Camadas e/ou com uma Rede de Memória de Curto Longo Prazo (LSTM), a possibilidade de treinamento por imitação, seguido ou não por PPO, e a opção de aprender com a experiência de um ou vários agentes de uma só vez. Além disso, o BLE fornece cinco maneiras diferentes de representar o espaço de estados. Foram realizadas várias experiências de treinamentos e torneios em que os agentes jogam uns contra os outros para selecionar a melhor representação e técnica de aprendizado nesse cenário. Os resultados apontaram que, usando uma representação híbrida, agregando as experiências dos vários agentes para aprender de uma só vez e utilizando PPO com LSTM, são produzidos agentes inteligentes do Bomberman que vencem mais partidas entre todos os agentes treinados.


Deixe uma resposta

Esse site utiliza o Akismet para reduzir spam. Aprenda como seus dados de comentários são processados.