Resumen:
Este trabajo es una invetsigación donde se compararon tres modelos de detección basados en transformadores visuales y redes neuronales convolucionales. Se obtuvo una métrica de comparación diferente a la clásica y el mejor modelo se utilizó en la aplicación de localización visual de un robot humanoide en un ambiente simétrico, una cancha de fútbol, utilizando filtros de partículas de monte carlo.
Descripción:
Este trabajo inicia con la introducción y marco teórico de los conceptos fundamentales en la investigación, más adelante se describen más a detalle los conceptos más importantes de manera general para después detallar su implementaci+on. Los entrenamientos y los parámetrps utilizados tanto en los modelos como en el filtro de partículas. Se finaliza con los resultados y las conclusiones.