Neste ano, durante o TheDevConf – São Paulo, eu palestrei sobre o tema “Autenticação via Reconhecimento Facial e de Fala”, explorando a parte técnica do uso de serviços de Inteligência Artificial, disponibilizados pela Microsoft, para desenvolver sistemas que permitam autenticar uma pessoa por meio de sua foto e voz.
Na ocasião, buscando elucidar o assunto, eu apresentei um chatbot desenvolvido por mim mesmo, que permite o cadastro de pessoas com o registro de foto e voz, e posterior autenticação, utilizando somente foto e áudio. Durante a demonstração destaquei que a utilização de autenticação facial e de fala podem ser burladas por pessoas mal-intencionadas utilizando fotos ou gravação de falas. Neste caso, é possível incorporar outras técnicas para garantir mais segurança, como análise de vídeo, em que podem ser extraídos a face e a voz da pessoa.
Como atuo no Microsoft Innovation Center Campinas (MIC), dentro do Eldorado, busquei destacar, na minha palestra, iniciativas e soluções do Instituto na área de Inteligência Artificial e, também, as ações do MIC voltadas para divulgação, engajamento e capacitação da comunidade nos temas relacionados à Inteligência Artificial (IA).
Autenticação via Reconhecimento Facial
No ato do cadastro, o usuário fornece fotos de rosto para serem utilizadas posteriormente na autenticação. Devem ser cadastradas uma ou mais fotos. Nesse momento, o serviço de IA da Microsoft extrai as características da pessoa na foto, as quais, posteriormente, permitem autenticá-lo.
Depois da autenticação, o usuário fornece uma nova foto, que é comparada com todas as fotos, de todos os usuários. Assim, o serviço de IA de reconhecimento facial identifica quem mais se parece com a foto enviada.
Case Uber:
Autenticação via Reconhecimento de Fala (Locutor)
No ato do cadastro, o usuário fornece falas diversas para serem utilizadas posteriormente na autenticação. Devem ser cadastrados pelo menos 5 segundos de fala. Nesse momento, o serviço de IA da Microsoft extrai características como o timbre de voz, que permite autenticá-lo posteriormente.
Depois, na autenticação, o usuário fornece uma nova fala, que é comparada com todas as falas, de todos os usuários. Desse modo, o serviço de IA de reconhecimento de fala identifica quem tem a voz mais parecida com a fala enviada.
Experimente o serviço:
https://azure.microsoft.com/pt-br/services/cognitive-services/speaker-recognition/
Questões de Segurança
Ambos os serviços trazem informações de grau de confiabilidade. Eles podem ser utilizados separadamente ou em conjunto. Porém, esses serviços podem ser burlados por pessoas mal-intencionadas utilizando fotos ou gravação de falas. Uma forma de minimizar isso, por exemplo, é por meio da solicitação de um vídeo em que a pessoa deve falar algo específico. O sistema pode, então, analisar tanto o rosto de quem fala, como, também, a voz, e ainda verificar o que foi dito para comparar com o que foi solicitado.
Política de Privacidade
Todas as fotos e sons armazenados no servido de IA da Microsoft são protegidos e não podem ser recuperados.
Competências do Eldorado
O Instituto de Pesquisas Eldorado, por meio do Microsoft Innovation Center Campinas, desenvolve soluções que utilizam os diversos serviços de IA da Microsoft como reconhecimento facial e de locutor. Esses sistemas podem ser incorporados em várias soluções diferentes, como chatbots e sistemas de monitoramento.