SISTEMA DE MONITORAMENTO INTELIGENTE DO FLUXO DE ALUNOS NO CAMPUS GOIÂNIA UTILIZANDO SENSORES PERCEPTIVOS
Palavras-chave:
Redes neurais siamesas, Contagem de multidões, Mapas de densidadeResumo
A ideia de controle de multidões e da quantidade de pessoas em um determinado local vem sendo uma necessidade cada vez mais evidente, sobretudo para o gerenciamento de estabelecimentos e unidades que são dependentes desse fluxo em sua rotina. Nesse sentido, nossa proposta é um sistema autônomo criado a partir de duas Redes Neurais distintas, mas que operam simultaneamente, o que facilita a visualização e a contagem de indivíduos em cenas cotidianas. Com base nessa concepção, fizemos uma conexão entre duas Redes Neurais que atuam em um sistema siamês em uma única interface, a ResNet18 e a U-Net, que possuem funções específicas dentro do programa. Enquanto a ResNet18 analisa uma cena e realiza a contabilização da quantidade de pessoas, a U-Net utiliza essa mesma imagem para montar um mapa de calor formado a partir da entrada processada pela ResNet18. Além disso, nossas Redes Neurais foram modificadas para alcançar os melhores resultados possíveis para a proposta, adaptando camadas e criando novos blocos empregados na correção de erros de contagem decorrentes do processo de análise interno da Rede Neural Siamesa. Em uma visão mais clara do funcionamento do sistema, temos uma imagem de entrada a ser analisada pela ResNet18 modificada e pela U-Net. Nesse processo, a ResNet18 segmenta a imagem em diversos fragmentos menores e, com base no treinamento realizado, determina se o que está presente em cada fragmento da imagem original corresponde ou não a uma pessoa. Além disso, existe um módulo de correção de contagem, uma vez que durante o processo de segmentação da imagem original ocorre uma pequena perda no refinamento de cada parte, o que pode gerar um desvio no valor final da quantidade de pessoas em cena. A U-Net, por sua vez, é responsável pela criação de um mapa de calor da cena, fundamentado nas coordenadas das pessoas presentes na imagem; ao identificar onde a ResNet18 determina se há ou não uma pessoa, essas informações passam a ser tratadas como coordenadas de referência para a U-Net gerar o mapa termográfico da imagem de entrada. A partir desses processos internos dentro da Rede Neural Siamesa, que atuam de forma integrada, obtém-se como saída tanto a quantidade de pessoas na cena quanto o mapa termográfico gerado. Antes de colocar em prática o nosso modelo, foi necessário realizar o treinamento da rede neural com um conjunto de bases de dados, unindo o GTA Crowd Counting Dataset, que oferece cenários sintéticos altamente controláveis, e o ShanghaiTech Part A, que reúne imagens complexas de multidões reais. Essa combinação resultou em um Erro Médio Absoluto (MAE) de 76.16 no conjunto ShanghaiTech Part A, superando abordagens tradicionais de detecção em cenários de alta densidade. Com isso, ao utilizarmos imagens do IFG Campus Goiânia, obtivemos uma acurácia superior a 85% mesmo em ambientes menos densos, o que evidencia uma resposta positiva do projeto.
Downloads
Downloads
Publicado
Métricas
Visualizações do artigo: 3 PDF downloads: 1