Pagina inicial

Caro Animado Visitante

Seja bem vindo! Nosso 4o. ano de alimentação contínua do nosso animado index, AdA, mantemos a equipe com os Professores doutores Carla Schn...

Mostrando postagens com marcador Processamento de imagens. Mostrar todas as postagens
Mostrando postagens com marcador Processamento de imagens. Mostrar todas as postagens

Um Sistema De Análise Facial Em Tempo Real Para a Classificação De Postura De Faces

 

Dissertação de Mestrado


Nome: Loubrys Lázaro Rojas Reinoso
Instituição: USP - Universidade de São Paulo - Escola Politécnica
Programa: Departamento de Computação e Sistemas Digitais
Orientador: Graça Bressan 
Ano: 2023
País: Brasil


Resumo
A estimativa de pose da cabeça é uma área de pesquisa ativa com uma ampla gama de aplicações, incluindo reconhecimento facial, detecção de vivacidade, animação facial e muito mais. As pesquisas mostram que sistemas relacionados a rostos geralmente funcionam bem em cenários controlados, obtendo excelentes resultados com rostos completos e quase frontais. No entanto, desafios surgem ao lidar com perfis. Propomos um sistema de análise facial multitarefa, sem treinamento, projetado para classificar poses de rosto. Após receber uma imagem, o sistema pode ser capaz de detectar rostos e seus pontos de referência, estimar a pose do rosto através do grau de liberdade da cabeça humana, calculando os ângulos resolvendo o problema de Perspective-n-Point (PnP), uma sólida alternativa para aqueles que buscam um equilíbrio entre robustez e velocidade. Alguns dos métodos mais robustos geralmente dependem de soluções de aprendizado profundo, mas geralmente são inadequados para aplicações em tempo real ou exigem computadores de alto desempenho. Após estimar os ângulos, um modelo de ML supervisionado foi treinado para determinar rostos como frontais ou não frontais. O sistema fornecerá feedback em tempo real para os usuários corrigirem a pose da cabeça. O Erro Absoluto Médio (MAE) obtido foi de 4,24, garantindo velocidade de execução em tempo real em hardware de baixa potência. Para avaliar o modelo de aprendizado de máquina treinado, foram implementados três protocolos, com o Protocolo 2 apresentando os melhores resultados, com zeros falsos positivos, tornando-o uma excelente escolha para aplicações no mundo real. Além disso, testamos a proposta em um protótipo de conceito para abertura e verificação de contas. O sistema funcionou como pré-processamento de imagens, permitindo apenas imagens que atendem a requisitos específicos - rostos frontais. Medimos o impacto da proposta em outros sistemas de análise facial; o desempenho dos sistemas de reconhecimento facial e detecção de vivacidade melhorou significativamente, aumentando de 90% para 96% e de 62% para 87%, respectivamente.

Palavras-chave: Aprendizado computacional, Face (Análise), Processamento de imagens, Dissertação.

Abstract
Head pose estimation attracts significant interest from the research community by the wide range of applications that rely on or are enhanced by a good head pose estimation system, including face recognition, liveness detection, facial animation, and more. Research has shown that face-related systems generally perform well in controlled scenarios, achieving excellent results for full and nearly frontal faces. However, the performance of face-related systems typically declines significantly for profile faces, presenting a major challenge. We propose a multi-task, training-free face analysis system designed to classify face poses. After receiving an image, the system could be capable of detecting faces and their landmarks, estimating the head pose based on the human head's degrees of freedom, and calculating the angles using the Perspective-n-Point (PnP) problem, a solid alternative for those seeking a balance between robustness and speed. Some of the more robust methods often rely on deep learning solutions but they are generally unsuitable for real-time applications or require high-performance computers. After, estimating the angles, a supervised ML model has been trained to determinate faces as either frontal or non-frontal. The system will provide users with real-time feedback, such as visual cues, to help them correct their head position. The Mean Absolute Error (MAE) obtained was 4.24, guarantying real-time running speed in low-power hardware. To evaluate the machine learning model trained, were implemented three protocols, yielding Protocol 2 the best results, with zero false positives, making it an excellent choice for real-world applications. Additionally, we tested the proposal in a proof of concept for accounts opening and verification. The system acted as an image preprocessor, allowing only images that meet specific requirements frontal faces. We measured the impact of the proposal in other face analysis systems; the performance of face recognition and liveness detection systems improved significantly, increasing from 90% to 96% and from 62% to 87%, respectively.

Keywords: Computational learning, Face (Analysis), Image processing.



Para o texto completo, clique aqui!

Aplicação da Generalização Cartográfica em Mundos Virtuais

Dissertação de Mestrado

Nome: Cledja Karina Rolim da Silva
Instituição: UFPE - Universidade Federal de Pernambuco
Programa: Programa de Pós-graduação em Ciência da Computação
Orientador: Alejandro C. Frery
Co-rientador: Evandro de Barros Costa
Ano: 2004
País: Brasil

Resumo
Este trabalho aborda o problema de transpor ferramentas e conceitos cartográficos para aplicações de realidade virtual, focando o uso da generalização cartográfica em mundos urbanos virtuais para turismo. A Generalização Cartográfica é uma área de Cartografia utilizada para se obter versões de mapas cartográficos. Em mundos virtuais este processo pode ser implementado com a geração de níıveis de detalhamento (Level of Detail LOD), mas não existem regras precisas para construir esses níveis de forma automática; grande parte dos trabalhos encontrados na literatura foca apenas na simplificação de polígonos. Para se obter versões generalizadas de mapas, a cartografia faz uso de doze operadores, aplicados pelo Cartógrafo segundo o seu conhecimento do problema. Estes operadores são: simplificar, suavizar, agregar, amalgamar, merging , colapsar, refinar, exagerar, aumentar, deslocar, classificação e simbolização. É realizada uma análise destes operadores verificando a viabilidade de sua aplicação em mundos virtuais. O conhecimento de um especialista na área de Cartografia é modelado através de regras de conhecimento, as quais alimentam um sistema especialista utilizado para selecionar os objetos de acordo com o tema, que nesta dissertação é o turismo, e para a aplicação dos operadores sobre o mundo virtual. Três dos operadores cartográficos foram escolhidos para serem implementados para mundos virtuais, pois já eram utilizados de forma isolada: simplificar, suavizar e simbolização. A partir destas informações, o SisGen3D, Sistema de Generalização para mundos virtuais construídos em VRML (Virtual Reality Modelling Language), é apresentado e validado com um mundo virtual, o Recife Antigo Virtual. Este sistema foi desenvolvido em JAVA, modelado com UML (Unified Modelling Language) e utiliza o gerenciador de banco de dados MySQL.

Palavras-chave: Generalização Cartográfica, Mundos virtuais, LODs, Mapas, Simplificação, Sistemas especialistas, JAVA, Processamento de imagens, Dissertação

Para o texto completo, clique aqui!

Algoritmo Para Reconhecimento de Características Faciais Baseado em Filtros de Correlação

Dissertação de Mestrado
 
Nome: Gabriel Matos Araujo
Instituição: Universidade Federal do Rio de Janeiro - UFRJ
Programa: Coordenação dos Programas de Pós-Graduação de Engenharia, Programa de Engenharia Elétrica
Orientador: Eduardo Antônio Barros da Silva
Ano: 2010
País: Brasil

Resumo
A detecção de características faciais é um problema que tem sido muito investigado nos últimos anos. Atualmente existem algumas soluções, inclusive comerciais, para este tipo de problema. Isto se deve, principalmente, ao fato de que pontos de controle definidos na face (também conhecidos como landmarks ou pontos fiduciais) podem ser utilizados em etapas iniciais de muitos outros sistemas, como, por exemplo, sistemas de rastreamento, sistemas de segurança, de modelagem 3D, dentre outros. Neste trabalho propomos um nova metodologia para a detecção de pontos fiduciais em faces. A principal diferença entre o sistema proposto e os outros é a utilização do DPI (Detector por Produto Interno) na etapa de classificação. O DPI é uma nova classe de detectores baseados em filtros de correlação, cuja principal vantagem é a fácil incorporação da estatística do conjunto de treinamento no projeto do detector. O resultado é um sistema capaz de reconhecer pontos fiduciais com baixo custo computacional e com taxas de acerto competitivas, principalmente para os pontos situados na região dos olhos e do nariz.

Abstract
The detection of facial features is a problem that has been given a lot of attention in recent years. There are several solutions to this problem in use today. This is so because control points defined in the face (also known as landmarks or fiducial points) can be used in initial steps in many other systems, such as tracking systems, security systems, 3D modeling, among others. In this work we propose a new methodology for fiducial point detection on faces. Our main contribution is the use of the DPI (from portuguese Detector por Produto Interno) in the classification step. The DPI is a new class of detectors based on correlation filters, whose main advantage is the easy incorporation of the training set statistics in the design of the detector. The result is a system able to recognize fiducial points with low computational cost and competitive hit rates, especially for points around the eyes and nose.

Palavras-chave: Reconhecimento de padrões, Processamento de imagens, Visão computacional, Dissertação.

Para o texto completo, clique aqui!

TOOKIMA: Um Conjunto de Ferramentas para a Descrição de Animação Modelada por Computador

Dissertação de Mestrado
(indexada pela 1ªvez em 16/12/2013)
Nome: Marcelo da Silva Hounsell
Instituição: UNICAMP - Faculdade de Engenharia Elétrica e de Computação
Programa: Engenharia de Computação e Automação Industrial
Orientador: Leo Pini Magalhães
Ano: 1992
País: Brasil

Resumo
TOOKIMA (a Tool Kit for Scripting Computer Modeled Animation) consiste num conjunto de ferramentas para facilitar a descrição e o desenvolvimento de animações cinemáticas. Vários algoritmos foram implementados para a manipulação de quaisquer dos parâmetros dos elementos tais como objetos, câmera, tonalização, fontes de luz, etc. Ele é, atualmente, uma extensão da linguagem de programação de uso geral C, sobre seus tipos de dados primitivos e sobre sua biblioteca de funções, baseado no rendering Scan-line sobre objetos representados por bordos. Características adicionais estão disponíveis para animação sobre trilhas, geometria temporal, vários comportamentos de aceleração pré-estabelecidos, estruturação hierárquica de objetos e o desenvolvimento incremental da animação. Nosso objetivo foi, principalmente, desenvolver um ambiente inicial para pesquisas em animação no nosso projeto maior em Computação de Imagens, denominado ProSIm, do que propor técnicas ou algoritmos novos.

Palavras-chave: visão por computador

Abstract
TOOKlMA (a Tool Kit for Scripting Computer Modeled Animation) consists of a set of tools that intend to help the descriptton and development of kinematics animations. Several algorithms are available for the manipulation of any parameters of elements like objects, camera, shading, light-sources, etc. These tools, nowadays, are a scanline-based renderlng extension to the C general-purpose programming language on its data types and libraries, using boundary representation of objects. Additional features are available for track animation, temporal geometry, several accelerated behavior, hierarquical structure of objects and tweaking. Our goal was, mainly, to develop an initial research enviroment for animation in our major project on computer graphics, called ProSlm, rather than propose any new techniques or algorithms.

Para o texto completo, clique aqui!

Uma Proposta de Morphing Utilizando Técnicas de Interpolação de Formas e Média Morfológica

Dissertação de Mestrado
(indexada pela 1ªvez em 16/12/2013)
Nome: Rogério Seiji Higa
Instituição: UNICAMP - Faculdade de Engenharia Elétrica e de Computação
Programa: Pós-graduação em Engenharia Elétrica
Orientador: Yuzo Iano
Ano: 2008
País: Brasil

Resumo
A animação é muito utilizada na área cinematográfica para produzir efeitos visuais ou para fazer filmes inteiros. Nessa área, a busca por novas ferramentas caminha junto com a necessidade da indústria do entretenimento de sempre mostrar novidades. Tentando suprir essa demanda, este trabalho propõe uma nova ferramenta que mistura o morphing de imagens, já muito utilizado nesta área, com a média morfológica. O uso dessas duas técnicas permite a geração de uma seqüência de imagens diferente de outras técnicas de morphing. Além disso, também é proposta a utilização de um algoritmo de interpolação de formas, que é utilizado junto ao morphing para interpolar os seus marcadores de atributos. O uso da interpolação de formas permite que dois marcadores correspondentes tenham um número diferente de pontos, e também adiciona opções de compensação de rotação entre as formas dos marcadores. Neste trabalho são mostrados os resultados obtidos com o método proposto.

Palavras-chave: animação (cinematografia), processamento de imagens, morfologia matemática, interpolação, compressão de imagens

Abstract
Animation is used in the cinema industry to produce visual effects or entire movies. In this area, the search for new tools comes along with the need of the entertainment industry to show new stuff all the time. To fulfill this need, this work proposes a new tool that blends the image morphing, a famous tool for visual effects, with the morphological median. The use of these two techniques provides an image sequence that's distinct from other similar tools. It is also proposed in this work the use of the shape interpolation which is used in the morphing algorithm to interpolate the features markers. The shape interpolation algorithm allows that the corresponding markers have a different number of points, it also includes a rotation compensation options for the interpolation of the shapes of the markers. In this work are shown the results obtained form the proposed method.

Para o texto completo, clique aqui!

Métodos para um Sistema de Animação Facial Baseado em Aquisição Estereoscópica

Dissertação de Mestrado
(indexado pela 1ªvez em 29/11/2011)

Nome: Rodrigo Assaf
Instituição: Universidade Federal de São Carlos - Centro de Ciências Exatas e de Tecnologia
Programa: Programa de Pós-Graduação em Ciência da Computação - PPGCC
Orientador: José Hiroki Sato
Ano: 2006
País: Brasil

Resumo
A animação facial tem sido amplamente utilizada em diversas áreas de  aplicação e entretenimento, apresentando altos níveis de detalhamento e  avanços tecnológicos. Contudo, sua implementação ainda exige um trabalho árduo da equipe de produção podendo desprender muito tempo nesta etapa. Com  o objetivo de adequar um sistema estereoscópico a um sistema de  animação facial de baixo custo financeiro, este trabalho trata de  assuntos da área de animação e de seus principais fundamentos para serem  aplicados em uma face. Estudos da anatomia da face, como sistema  muscular e ósseo, são fundamentais para um melhor desempenho da animação  facial, pois é notável que a face é, naturalmente, um sistema complexo. Diversos paradigmas de sistemas faciais são abordados mostrando os atuais estágios desta área da computação gráfica. Os  princípios fundamentais de um sistema estereoscópico, que utiliza duas  imagens como referência, são abordados, enfocando seu uso no  desenvolvimento de métodos para uma animação facial. Esta pesquisa  baseou-se na demarcação de pontos de controle faciais em uma face  humana real, que foi modelada em 3D utilizando a técnica de box  modeling, para a realização dos métodos de estereoscopia, associação e  interpolação obtendo uma expressão facial e de sincronismo labial. A  utilização da estereoscopia mostrou-se, neste trabalho, como sendo uma  técnica eficiente para a captação das coordenadas 3D provenientes da  face real, resultando em uma animação facial realista. Encontrou-se  o re-uso, a portabilidade, a criação de target morphings e a criação de  keyframes como as principais contribuições da estereoscopia, permitindo  sua ampla utilização.

Palavras-chave: Computação gráfica, Processamento de imagens, Animação por computador, Aquisição 3D

Abstract
Facial animation has been widely used in many areas of applications and entertainment, presenting high levels of details and technology. However, its implementation still demands lots of hard work from the producer team. Aiming at the adaptation of a stereoscopic system to a financial low cost facial animation system, this research covers animation subjects and their main principles, in order to use them on an animated face. Studies on face anatomy, such as bones and muscles, are considered important to enhance the facial animation results. Several paradigms are covered in order to demonstrate the actual stage of this computer graphic area. The main aspects of a stereoscopic system, which uses two images as reference, presented in this work, are focused on a method development for a facial animation system. This research is based on facial control points on a human face, which is 3D modeled using the box modeling technique. The 3D virtual face is used to apply an ending result of a facial expression or lip sync obtained from the methods of stereoscopy, association and interpolation. The use of the stereoscopy demonstrated to be an efficient technique to capture 3D coordinates from real faces and use them to develop a realistic facial animation. The re-use, portability, target morphing, and key frames are the main contributions of the use of the stereoscopy in a facial animation system.

Para o texto completo, clique aqui!

Morphing aplicado ao envelhecimento de imagens faciais

Dissertação de Mestrado
(indexado pela 1ªvez em 26/10/2011)


Nome: Greyce Nogueira Schroeder
Instituição: UNICAMP / Faculdade de Engenharia Elétrica e de Computação
Orientador: Leo Pini Magalhães
Ano: 2007
País: Brasil

Resumo
O morphing de imagens é uma transformação que mapeia uma imagem em  outra, alterando tanto a sua forma quanto as suas intensidades. Esta  transformação possui diversas aplicações em imagens médicas e  especialmente na indústria de entretenimento. Este trabalho objetiva,  através do uso de morphing, apresentar um protótipo para a simulação de  envelhecimento de faces frontais, utilizando um método chamado Funções  de Base Radial (RBF) juntamente com um modelo quantitativo para  expressar o processo de envelhecimento no rosto humano. O protótipo  trabalha com imagens de pessoas a partir de 20 anos e realiza o  envelhecimento até no máximo 70 anos. Além disso, o trabalho apresenta  uma revisão bibliográfica sobre as principais técnicas de morphing e  sobre o que já foi realizado sobre simulações computacionais de  envelhecimento facial por imagens.
Para o texto completo, clique aqui!

Morphing Aplicado ao Envelhecimento de Imagens Faciais

   

Dissertação de Mestrado
(indexado pela 1a. vez em 26/10/2011)


Autor(a): Greyce Nogueira Schroeder
InstituiçãoUniversidade Estadual de Campinas - UNICAMP. Faculdade de Engenharia Elétrica e de Computação
Orientador(a): Leo Pini Magalhães
Ano: 2007
PaísBrasil.

Resumo

O morphing de imagens é uma transformação que mapeia uma imagem em outra, alterando tanto a sua forma quanto as suas intensidades. Esta transformação possui diversas aplicações em imagens médicas e especialmente na indústria de entretenimento. Este trabalho objetiva, através do uso de morphing, apresentar um protótipo para a simulação de envelhecimento de faces frontais, utilizando um método chamado Funções de Base Radial (RBF) juntamente com um modelo quantitativo para expressar o processo de envelhecimento no rosto humano. O protótipo trabalha com imagens de pessoas a partir de 20 anos e realiza o envelhecimento até no máximo 70 anos. Além disso, o trabalho apresenta uma revisão bibliográfica sobre as principais técnicas de morphing e sobre o que já foi realizado sobre simulações computacionais de envelhecimento facial por imagens.

Palavras-chaveAnimação por computador, Computação gráfica, Processamento de imagens

Abstract

Image morphing is a transformation that maps one image into another, altering both its shape and intensities. These types of transformation have a wide range of applications in medical imaging and, specially, in entertainment industry. This work attempts to present a prototype for aging simulation on frontal face images, using a method of morphing called Radial Basis Functions (RBF) together with a quantitative model for expressing human aging. The prototype works with images from people with 20 years old up and performs the aging up to 70 years. Moreover, the work presents a bibliographical revision on the main techniques of morphing and on the state of the art on computational simulations of image face aging.


Para o texto completo, clique aqui!