ID:
7064
Sala virtual:
https://us02web.zoom.us/j/85617716228?pwd=bDl2M243eTVFK1ZIbFcvbnM5Y1kwQT09
Vídeo:
https://peertube.td.utfpr.edu.br/videos/watch/1b3cd0cc-d15f-4312-8399-6ef432f5e38f
Resumo:
Entre as áreas da visão computacional, a compreensão de contexto de imagem, que se direciona ao reconhecimento de cenas pelos seus objetos, vem sendo observada em diferentes aplicações. Entretanto, ferramentas tradicionais da visão computacional, como as Redes Neurais Convolucionais (CNNs) e Multi-Layer Perceptrons (MLPs), por operarem no domínio euclidiano são incapazes de modelarem as relações entre os objetos da imagem, consequentemente, prejudicando o reconhecimento. Desta forma, este trabalho apresenta a proposta e o desenvolvimento de um modelo capaz de determinar o contexto de uma imagem pela análise do conteúdo dos objetos (características visuais) e as suas respectivas interações. Para isso, é construída uma representação em forma de grafo do conjunto de dados MIT64, e treinada uma estrutura de Rede Neural Convolucional baseada em Grafo (GCN) capaz de abstrair ambas informações (as interações e o conteúdo dos objetos). Pelos experimentos, a abordagem proposta apresenta, em relação às ferramentas tradicionais (MLP), uma melhora de 134% na assertividade do modelo. Assim, evidenciando a importância das interações entre os objetos em conjunto com as características visuais.
Autor(es):
LUIS
GUSTAVO DE
SOUZA
Universidade Tecnológica Federal do Paraná, Cornélio Procópio, Paraná, Brasil
souza.1998@alunos.utfpr.edu.br
Priscila
Tiemi Maeda
Saito
Universidade Tecnológica Federal do Paraná, Cornélio Procópio, Paraná, Brasil
psaito@utfpr.edu.br
Modalidade:
Computação
Data:
25/11/2020
Hora:
09:00