Sistema para la medición de dimensiones de cajas a partir de imágenes monoculares

View/ Open
Date
2022-12-06Authors
Mendoza Galindo, Diego AlejandroDirectors
Parra Rodriguez, Carlos AlbertoPublisher
Pontificia Universidad Javeriana
Faculty
Facultad de Ingeniería
Program
Maestría en Inteligencia Artificial
Obtained title
Magíster en Inteligencia Artificial
Type
Tesis/Trabajo de grado - Monografía - Maestría
COAR
Tesis de maestríaShare this record
Citación
Metadata
Show full item record
PDF documents
English Title
Box dimensions measurement system using monocular imagesResumen
La detección de objetos es una técnica de visión por computadora que permite localizar objetos en fotografías o videos digitales. A diferencia de la clasificación de objetos, la detección no solo permite saber si el objeto pertenece a una clase, además, permite identificar la posición del objeto dentro de la escena.
Para determinar la posición, la detección de objetos encierra el objeto u objetos con un cuadro delimitador, para esto, muchos algoritmos de detección de objetos usan la regresión de caja envolvente. Este tipo de regresión usa redes neuronales entrenadas sobre un conjunto de imágenes etiquetadas con la posición de los objetos a identificar, a partir de esta información, la red neuronal entrenada es capaz de identificar el objeto y la posición dentro de la imagen.
Además de la detección del objeto, existe información implícita dentro del proceso de delimitación de los objetos con cuadros envolventes como el tamaño aproximado del objeto en la imagen a partir del cuadro que lo encierra.
En este artículo, se propone una técnica para calcular las dimensiones aproximadas de objetos (cajas), a partir de la identificación de dichos objetos en imágenes monoculares usando regresión de caja envolvente.
Abstract
Object detection is a computer vision technique that allows the user to locate objects in digital photographs or videos. Unlike object classification, detection not only allows us to know if the object belongs to a class, in addition, it is able to identify the position of the object within the scene.
To determine the position, usually the object or objects are enclosed within a bounding box, for this process, many object detection algorithms use the bounding box regression. This type of regression uses neural networks trained and tagged with a set of images.
In addition to the detection of the object, there is implicit information within the process of delimitation of objects with bounding boxes such as the approximate size of the object in the image calculated from the box that encloses it.
In this article, a technique to calculate the approximate dimensions of objects (boxes) is proposed, based on the identification of the objects in monocular images using bounding box regression.
Themes
Maestría en inteligencia artificial - Tesis y disertaciones académicasRedes neuronales (Computadores)
Visión por computador
Algoritmos (Computadores)
Google Analytics Statistics