Defesa de Dissertação de Mestrado – Juliano Emir Nunes Masson – 22/3/2021

03/03/2021 14:34
Defesa de Dissertação de Mestrado
Aluno Juliano Emir Nunes Masson
Orientador

Coorientador

Prof. Daniel Ferreira Coutinho, Dr. – DAS/UFSC

Prof. Marcelo Petry, Dr. – UFSC/Blumenau

Data 22/3/2021 (segunda-feira) – 14h

Videoconferência (https://meet.google.com/gep-dgyw-reo)

Banca Prof. Daniel Ferreira Coutinho, Dr. – DAS/UFSC (presidente);

Prof. Maurício Edgar Stivanello, Dr. – IFSC;

Prof. Marcelo Ricardo Stemmer, Dr. – DAS/UFSC;

Prof. Eric Aislan Antonelo, Dr. – DAS/UFSC.

Título Geração de Mapas de Profundidade utilizando Redes Neurais Convolucionais
Resumo: A fotogrametria é um problema clássico de visão computacional e consiste na extração de informação tridimensional a partir de imagens. Ela pode ser descrita de maneira simplificada como sendo o processo de gerar um modelo 3D, de alguma cena capturada por duas ou mais imagens, de diferentes pontos de vista. A possibilidade de extrair a geometria de uma cena através de imagens permite uma vasta gama de aplicações, como a criação de ambientes virtuais para a simulação de robôs autônomos, a virtualização de ambientes reais para venda de imóveis, análise de deformação de superfícies, cálculo do deslocamento de barragens, monitoramento de erosões, planejamento e inspeção de construções, etc. Mesmo com o uso massivo de redes neurais em problemas clássicos de visão computacional mostrando um grande avanço quando comparados aos algoritmos tradicionais (principalmente em tarefas de reconhecimento de objetos), os principais softwares comerciais e bibliotecas de fotogrametria utilizados para as aplicações citadas anteriormente ainda não fazem uso de redes neurais. A partir dessa constatação, esse trabalho tem como objetivo estudar metodologias de geração de mapas de profundidade a partir de imagens de câmeras calibradas (matriz intrínseca e extrínseca conhecidas) utilizando redes neurais convolucionais. Para alcançar o objetivo foi feita uma revisão sistemática dos trabalhos da área, e com base nas estruturas das redes encontradas, foram propostas algumas modificações na rede CasMVSNet. Como a base da fotogrametria é encontrar correspondências entre as imagens, as modificações propostas focaram na etapa de extração de features, trocando as convoluções por convoluções deformáveis e deformáveis moduladas, permitindo uma maior adaptação da rede aos dados de entrada. Para os experimentos foram escolhidos três datasets, o DTU, Tanks and Temples e o BlendedMVS. Para o treinamento foram utilizados o DTU e o BlendedMVS, e para a avaliação quantitativa dos resultados o DTU e o Tanks and Temples. Dentre as modificações propostas, a dconv_todas treinada com o dataset DTU teve uma redução de 22% no consumo de memória gráfica, melhora na completude e na média do resultado quantitativo do DTU e uma pontuação média maior no Thanks and Temples, com uma penalidade de apenas 3.75% no tempo de processamento, em comparação a rede CasMVSNet original.