Um grupo de pesquisadores da Universidade Carnegie Mellon que participam do programa Olho da Mente, patrocinado pelo Escritório de Inovação computacional da DARPA, a Agência avançada de pesquisa de projetos do Departamento de Defesa dos EUA., criaram um software inteligente que reconhece visualmente as atividades humanas em vídeos, e, em seguida, prevê o que pode acontecer a seguir.

blank

Pesquisadores da Universidade Carnegie Mellon participam do programa Mind's Eye, patrocinado pelo Departamento de Defesa dos EUA, em que eles desenvolveram software de inteligência visual capaz de reconhecer atividades humanas em um vídeo, e prever o que poderia acontecer a seguir. Este é um projeto ambicioso do qual doze equipes de pesquisa fazem parte, entre eles Carnegie Mellon University, patrocinado pelo Escritório de Inovação computacional da DARPA, agência pertencente ao Departamento de Defesa dos EUA responsável pelo desenvolvimento de novas tecnologias para uso militar.

Como o site coleta Tendencias21.net, o objetivo nada mais é do que automatizar o trabalho de assistir e interpretar vídeos, o que vai economizar tempo, melhorar o acompanhamento e fornecer novas ferramentas para a pesquisa. Na verdade, Espera-se que a tecnologia Mind's Eye seja usada em ambientes civis e militares, aplicações que vão desde a defesa até a robótica médica e de consumo. Mas reconhecer e prever a atividade humana em um vídeo não é tarefa fácil. Como o Centro Nacional de Engenharia Robótica arrecada (NREC) Universidade Carnegie Mellon em um comunicado, nem todo mundo faz a mesma ação da mesma forma; diferentes ações podem parecer muito semelhantes em uma gravação, e vídeos da mesma ação podem variar muito na aparência, dependendo da iluminação, Perspectiva, o fundo, indivíduos envolvidos e muito mais.

É por isso que, você precisa de um sistema que se aproxime da inteligência visual humana, "capaz de filtrar e generalizar o que tem sido observado para tomar decisões e agir sobre as informações adquiridas e conhecimentos prévios", como os pesquisadores afirmam em seu trabalho de apresentação. Alessandro Oltramari e Christian Lebiere, ambos do Departamento de Psicologia da Universidade Carnegie Mellon, apresentou o estudo na semana passada em uma conferência sobre segurança e defesa na Universidade George Mason.

Simule a visão humana

Assim, depois de analisar as características básicas da inteligência humana, pesquisadores focados em simular e aproximar-se deste corpo docente através de uma série de ferramentas de computador. Primeiro eles geraram modelos 3D de atividades humanas básicas para ligá-los ao movimento da pessoa no vídeo. Isso compara o movimento do vídeo com as ações para as quais o algoritmo que reconhece foi treinado (como andar, saltar ou ficar) e identificar (como pegar e tomar).

O software examina esses padrões para deduzir o que a pessoa está fazendo. Ele também faz previsões sobre o que vai acontecer a seguir, focado principalmente em atividades que podem ser escondidas ou ocorrer fora da câmera.

Este tem sido o trabalho realizado durante o 18 primeiros meses do programa, incluindo também a capacidade de descrever fenômenos observados através de mensagens de texto simples ou alertá-lo para comportamentos incomuns ou anormais. Um exemplo claro disso pode ser as câmeras de um aeroporto ou rodoviária marcando uma bolsa abandonada.

Esta pesquisa é em grande parte baseada em avanços feitos por pesquisadores de visão de máquina, que alcançaram resultados notáveis nas últimas décadas no reconhecimento de objetos fixos e móveis. É a mesma linha de trabalho que o Google seguiu com seus carros autônomos, software de reconhecimento facial usado no Facebook e Picasa, ou os eletrônicos de consumo usados no Microsoft Kinect, que permite que os usuários reprodumentem e controlem suas TVs apenas através de gestos e comandos de voz.

Quando funciona bem, visão artificial é capaz de detectar objetos e pessoas – o que os pesquisadores chamam de nomes- eles estão do outro lado da lente da câmera. Mas para entender o que eles estão fazendo, ou são autorizados a fazer, você precisa do equivalente de computador de verbos. E é aí que Oltramari e Lebiere se basearam no trabalho de outros pesquisadores da Carnegie Mellon para criar o que eles chamam de “motor cognitivo”, capaz de entender as regras pelas quais substantivos e verbos interagem.

Seu motor cognitivo incorpora pesquisa conduzida por uma equipe liderada pelo pós-doutorando Kris Kitani, que tenta entender a ação que um ser humano vai tomar calculando quais trajetórias físicas são mais prováveis. Ambos os projetos fazem parte do programa Mind's Eye. O próximo passo da pesquisa é tornar o "motor cognitivo" ainda mais inteligente. De acordo com o estudo, Autores “planejam ampliar os recursos do sistema para suportar uma gama mais ampla de verbos de ação e executar testes com vídeos mais complexos”.

Aplicativos

Câmeras tradicionais, que apenas gravar o que está acontecendo, eles só podem fornecer informações uma vez que um crime ocorreu. Investigadores podem ver como um carro foi roubado ou o funcionário de uma loja, mas depois dos fatos. A abordagem do Olho da Mente busca o oposto, visa prevenir crimes perigosos ou atos, alertando-os antes que aconteçam. Seu sistema automatizado poderia tentar os gerentes de segurança a um dia reconsiderar o controle humano das câmeras, como os comerciantes não são apenas caros para manter, mas representam riscos se eles estão distraídos ou sonolentos.

Para a rentabilidade é adicionado segurança, evitando colocar em risco soldados encarregados de missões de vigilância em áreas de alto risco. Esse é um dos principais objetivos para os quais a DARPA financia este projeto. De acordo com informações coletadas em seu site, "uma câmera inteligente seria capaz de descrever em palavras tudo o que vê e razão sobre o que não pode ver".

Esses dispositivos poderiam ser instruídos a informar apenas sobre atividades de interesse, o que aumentaria a relevância dos dados de entrada. Então, câmeras inteligentes poderia permitir que um único militar para monitorar vários postos de observação de um lugar seguro. Da mesma forma, poderia ser aplicado ao trabalho da polícia ou para analisar imagens ao vivo de drones. E você pode até ter aplicativos de segurança doméstica, alertando os proprietários de uma casa antes que os ladrões forçaram a porta.


Você gostou deste artigo?

Inscreva-se em nosso Ração RSS E você não vai perder nada.

Outros artigos sobre
Por • 2 Novembro, 2012
• Seção: Segurança do computador