Pagina inicial

Caro Animado Visitante

Seja bem vindo! Nosso 5o. ano de alimentação contínua do nosso animado index, AdA, mas este index existe desde 2011. Mantemos a equipe com ...

Animação Facial 2D Guiada Pela Fala Baseada em um Framework Generativo de Dois Estágios

                      

Tese de  Doutoramento


Nome: Brayan Bernardo de Souza
Instituição: Universidade Estadual de Campinas - Unicamp
Programa: Programa de Pós-Graduação em Engenharia Elétrica - Faculdade de Engenharia Elétrica e de Computação
Orientadora: Paula Dornhofer Paro Costa
Ano: 2024
País: Brasil

Resumo
A animação facial orientada por fala, uma técnica que emprega sinais de fala como entrada, tem como objetivo gerar animações realistas e expressivas de cabeças falantes. Apesar dos avanços nos métodos de síntese de falantes, persistem desafios em termos de obtenção de controle preciso, generalização robusta e adaptabilidade a vários cenários e características do locutor. Além disso, a maioria das abordagens existentes são implementadas para uma gama restrita de idiomas, sendo o inglês o idioma predominante. Este trabalho apresenta uma nova estrutura de dois estágios para a geração de animações facias 2D, combinando os pontos fortes das arquiteturas \emph{Transformers} e das Redes Adversariais Generativas (em inglês, \emph{Generative Adversarial Networks}, ou GANs). No primeiro estágio, o modelo baseado \emph{Transformer} extrai informações contextuais ricas da entrada de fala de áudio, sintetizando pontos de referência faciais. Na segunda etapa, emprega-se uma modelagem baseada em GAN para traduzir as representações faciais em quadros de vídeo fotorrealistas. Esta estrutura separa a modelagem de variações dinâmicas de forma da aparência realista, abordando parcialmente o desafio da generalização. Além disso, torna-se possível atribuir múltiplas aparências ao mesmo alto-falante ajustando os pesos treinados do segundo estágio. Métricas objetivas foram usadas para avaliar a fala facial sintetizada, mostrando que elas se aproximas das métricas de vídeos reais gravados. Esta estrutura foi projetada para ser independente de linguagem. O modelo de prova de conceito foi treinado usando um conjunto de dados audiovisuais do português brasileiro, ilustrando sua aplicação inicial. O trabalho é baseado na hipótese de que este trabalho semelhante introduz uma nova estrutura de dois estágios para geração de falantes, e a eficácia pode ser alcançada para outras linguagens quando treinada com os respectivos conjuntos de dados específicos da linguagem. Os resultados dos testes de generalização destacam o potencial do abordagem proposta para aplicações abrangentes na criação de vídeos. Ao demonstrar uma capacidade hábil de generalizar entre idiomas, géneros e velocidades de fala, a estrutura estabelece um precedente promissor para avanços futuros neste campo. Isso abre caminho para o desenvolvimento de sistemas mais flexíveis e eficientes para sintetizar vídeos de animações faciais 2D.

Palavras-chave: Inteligência artificial, Aprendizagem de máquina, Animação por computador, AvataresTese.


Para o texto completo, clique aqui! 

Geração de Gestos Expressivos Através da Fala para Agentes Virtuais

                     

Tese de  Doutoramento


Nome: Rodolfo Luis Tonoli
Instituição: Universidade Estadual de Campinas - Unicamp
Programa: Programa de Pós-Graduação em Engenharia Elétrica - Faculdade de Engenharia Elétrica e de Computação
Orientadora: Paula Dornhofer Paro Costa
Ano: 2024
País: Brasil

Resumo
Humanos virtuais já são populares em jogos e estão sendo cada vez mais utilizados em interfaces humano-computador e realidade virtual. Esses agentes são frequentemente projetados para se comportarem de maneira mais natural possível, promovendo uma comunicação efetiva e realista com o usuário. Uma grande parte da nossa comunicação é não-verbal, incluindo postura corporal, acenos de cabeça e gestos realizados enquanto falamos, que transmitem aspectos de nossas personalidades, emoções e intenções. Agentes virtuais também devem usar comportamentos não-verbais para atingir uma interação realista e dar a impressão de serem reativos e únicos. Pesquisas em geração de gestos acompanhados de fala abordaram esse desafio, buscando agentes que se comportam semelhante aos humanos durante interações. Este trabalho apresenta uma metodologia de síntese de movimento humano capaz de produzir gestos expressivos com base em áudio da fala. Uma nova base de dados com dados sincronizados de movimento e áudio em Português é introduzida. A base de dados é usada para treinar um modelo generativo baseado em difusão capaz de capturar a nuance dos gestos expressivos e produzir gestos para novos áudios. Os gestos de saída do modelo são comparados com gestos humanos reais e com um sistema da literatura em avaliações perceptuais e objetivas. Em particular, o estudo com usuários se concentrou em quatro aspectos do movimento de gestos: semelhança humana, adequação à fala, reconhecimento de personalidade e reconhecimento do estilo de comunicação. Uma nova representação para sequências de movimento de gestos também é introduzida juntamente com métricas objetivas para comparação entre sequências. Em uma primeira etapa, a representação e as métricas são aplicadas para quantificar a expressividade dos gestos em uma base de dados pública, e sua potencial correlação com a percepção de naturalidade e adequação à fala são investigadas em dois estudos com usuários de larga escala da literatura. Por fim, as métricas são aplicadas aos resultados do modelo proposto e comparadas com o sistema estado-da-arte e com os dados de gestos reais.

Palavras-chave:  Animação por computador, Aprendizado profundo, Computação gráfica, Movimento corporal, Análise de movimento, Tese.


Para o texto completo, clique aqui! 

Joker: Um realizador de desenhos animados para linguagens formais

Dissertação de Mestrado

Nome: Diego Henrique Oliveira de Souza
Instituição: UFRN - Universidade Federal do Rio Grande do Norte
Programa: Programa de Pós-Graduação em Sistemas e Computação
Orientador: Marcel Vinicius Medeiros Oliveira
Ano: 2011
País: Brasil

Resumo
Usando métodos formais, o desenvolvedor pode aumentar a confiabilidade e corretude do software. Além disso, o desenvolvedor pode concentrar-se mais nos requisitos funcionais. Porém há muita resistência em se adotar essa abordagem de desenvolvimento de software. A razão principal e a escassez de suporte ferramental adequado, útil e de fácil utilização. Os desenvolvedores normalmente escrevem o código e o testam. Estes testes geralmente consistem em checar se as saídas estão de acordo com os requisitos. Isto, contudo, nem sempre e possível de maneira exaustiva. Por outro lado, usando Métodos Formais um desenvolvedor e capaz de investigar profundamente as propriedades do sistema. Infelizmente, linguagens de especificação formal nem sempre possuem ferramentas como animador ou simulador e às vezes não há interfaces gráficas amigáveis. Porém, algumas dessas ferramentas possuem um compilador, que gera um Sistema de Transições Rotuladas (LTS). A proposta deste trabalho é desenvolver um aplicativo que fornece animação gráfica para especificações formais usando o LTS como entrada. O aplicativo inicialmente suporta as as linguagens B, CSP e Z. Usando o LTS em um formato XML especificado é possível animar outras linguagens formais. Adicionalmente a ferramenta disponibiliza visualização de traces, escolhas feitas pelo usuário, em um formato de árvore gráfica. A intenção é melhorar a compreensão de uma especificação, fornecendo informações sobre erros e animando-a, como os desenvolvedores fazem com linguagens de programação como Java e C++.

Palavras-chave: Interface Gráfica, Animação, Java, Especificação formal, Métodos formais

Para o texto completo, clique aqui!

O Futuro do Presente: A mídia audiovisual e a sociedade contemporânea na ficção científica do cinema de animação

Dissertação de Mestrado

Nome: Theresa Chistina Barbosa de Medeiros
Instituição: UFRN - Universidade Federal do Rio Grande do Norte
Programa: Programa de Pós-Graduação em Estudos de Mídia
Orientador: Josimey Costa da Silva
Ano: 2011
País: Brasil

Resumo
Essa pesquisa apresenta um estudo que objetiva analisar as imagens do futuro em obras de ficção científica do cinema de animação explorando a temática específica da representação das mídias de comunicação audiovisuais em seu diálogo com as sociedades retratadas nos filmes escolhidos para análise. A discussão proposta busca aproximações para responder à pergunta que deu início a esta pesquisa: como, nos dias de hoje, estamos pensando o futuro? Pretende também, pautada nas discussões propostas por Morin (1997), compreender aspectos da sociedade contemporânea com a ajuda do cinema e, ao mesmo tempo, compreender o cinema, auxiliada por uma análise social

Palavras-chave: Ficção científica, Cinema, Filmes de ficção científica, Comunicação de massa e cultura

Para o texto completo, clique aqui!

Bricolagem e Magia das Imagens em Movimento: O cinema de Moustapha Alassane

Tese de Doutorado

Nome:
Cristina dos Santos Ferreira
Instituição: UFRN - Universidade Federal do Rio Grande do Norte
Programa: Programa de Pós-graduação em Ciências Sociais
Orientadora: Lisabete Coradini
Ano: 2014
País: Brasil

Resumo
No contexto de pós-independência dos países da região norte ocidental do continente africano e do posicionamento crítico e discursivo dos sujeitos frente às imagens eurocêntricas que culminou com a constituição das cinematografias africanas, destaca-se a obra do realizador Moustapha Alassane. Com uma prática voltada para uma concepção particular das imagens em movimento, o autor nigerino reconstrói o trajeto do encanto pela imagem à magia do movimento, criando sua lanterna mágica, animando figuras e impressões de seu cotidiano, a partir do simples traço do desenho à modelagem e criação de marionetes tridimensionais. Um discurso que se faz gesto pela bricolagem de elementos que estão a seu alcance. E o gesto irônico do realizador transforma o cenário de um vilarejo no interior do Níger em um filme de faroeste, uma oportunidade para se apropriar do mito que é associado ao da criação do cinema no Ocidente. Este trabalho toma como referência os estudos de autores da diáspora, da crítica pós-colonial e de teóricos africanos. Dessa forma analiso a obra cinematográfica e a trajetória fílmica do realizador nigerino pela via de acesso da chegada das cinematografias africanas ao Brasil, levando em conta o caráter transnacional dos processos sociais contemporâneos, (re)aproximando-nos do continente africano e da reflexão de combate ao racismo como um sistema-mundo

Palavras-chave: Bricolagem, Cinema africano, Cinema de animação

Para o texto completo, clique aqui!