Sistema de inteligência artificial para colocar cores em fotos subaquáticas


As imagens subaquáticas tendem a ficar embaçadas e um pouco distorcidas, pois a luz não “circula” pela água da mesma forma que pelo ar.

Esse problema é sempre sofrido pelos mergulhadores, que tiram fotografias do fundo do mar e obtêm uma falta de detalhes nas cores que impedem análises adequadas.

Pois bem, agora, pesquisadores da Universidade de Engenharia de Harbin, na China, criaram um algoritmo de aprendizado de máquina que gera imagens realistas da água, juntamente com um segundo algoritmo que treina essas imagens para restaurar a cor natural e reduzir a turbidez. Dizem que é capaz de processar mais de 125 quadros por segundo que são executados em uma única placa gráfica.

A equipe observa que a maioria dos algoritmos de aprimoramento de imagem subaquática (como aqueles que ajustam o balanço de branco) não se baseiam em modelos de imagem física, o que os torna inadequados para a tarefa. Pelo contrário, essa abordagem tira proveito de uma rede de confronto generativo (GAN), um modelo de IA que consiste em um gerador que tenta induzir um discriminador a classificar amostras sintéticas como amostras do mundo real, para produzir um conjunto de imagens do site de pesquisas específicas que se alimentam de um segundo algoritmo, chamado U-Net.

A equipe treinou GAN com 3.733 imagens e mapas de profundidade, principalmente de vieiras, pepinos do mar, ouriços do mar e outros organismos similares que vivem em fazendas marinhas cobertas. Eles também obtiveram conjuntos de dados abertos, incluindo NY Depth, que inclui milhares de fotografias subaquáticas no total.

Como resultado: restauração uniforme de cores e boa recuperação da imagem em tons de verde sem destruir a estrutura subjacente da imagem de entrada original.