Pesquisas

Pesquisador Tema e Resumo
Carlos Henrique Aguena Higa Tema: Inferência de redes de regulação gênica a partir do transcriptoma de Panicum maximum

 

Resumo: Com o avanço das tecnologias de sequenciamento de DNA, temos hoje o que conhecemos por Sequenciadores de Nova Geração. Hoje é possível obter uma quantidade maior de dados biológicos a um custo mais baixo do que há 15 anos. Sendo assim, metodologias matemáticas e computacionais se tornaram essenciais para analisar e processar esse grande volume de dados com o objetivo de gerar conhecimento. Um problema importante estudado em Biologia Sistêmica e Bioinformática é o da inferência de redes de regulação gênica a partir de dados biológicos. Inferir redes nos leva a gerar hipóteses de regulação presentes em um determinado fenômeno biológico em questão. Neste projeto, apresentamos uma proposta de estudo no contexto do déficit hídrico de Panicum maximum, uma importante espécie forrageira utilizada no Brasil. Os principais objetivos deste projeto são: (1) o desenvolvimento de uma metodologia para a inferência de redes; (2) aplicar a metodologia no estudo de P. maximum em resposta ao déficit hídrico.

Eraldo Luís Rezende Fernandes Tema: Identificação Automática de Relações de Sinonímia e Hiperonímia entre Verbos usando Aprendizado Semissupervisionado

Resumo: A área de Processamento de Linguagem Natural (PLN) visa criar modelos e algoritmos para permitir a interpretação automática de textos escritos em língua natural, humana. Os desafios desta área estão ligados à complexidade da língua natural, que é ambígua, muito dependente de contexto e de conhecimento prévio. Isto torna bastante difícil para um algoritmo extrair informações a partir de um texto. De forma bem geral, o objetivo do PLN é, a partir de um texto qualquer, gerar uma representação semântica da informação contida neste texto, de tal forma que outros algoritmos possam usar esta informação facilmente.

Existem diversos problemas específicos que surgem no caminho para alcançar este objetivo geral. Um destes problemas é conseguir identificar qual o conceito semântico de um verbo em um determinado contexto (uma frase específica). É comum que verbos tenham mais de um significado (conceito semântico). Identificar qual dos conceitos possíveis é o correto em uma determinada frase é um problema da área de PLN. Existe um recurso, chamado WordNet.Br, que agrupa verbos em conjuntos de conceitos chamados synsets. Portanto, um synset é um conjunto de verbos sinônimos. A WordNet.Br também representa outras relações existentes entre dois synsets. Uma relação bastante relevante é a relação de hiperonímia. Quando um determinado synset A é um tipo específico de um synset B, dizemos que B é um hiperônimo de A. Por exemplo, comunicar faz parte de um synset que é hiperônimo de um synset que tem o verbo falar como membro. O synset de comunicar também é hiperônimo de um synset que inclui o verbo cantar como membro.

Esta proposta de tema de mestrado consiste na exploração da WordNet.Br como fonte de supervisão para o treinamento semissupervisionado de um modelo de agrupamento hierárquico de verbos. O objetivo é obter um modelo capaz de processar um conjunto de documentos e agrupar os verbos presentes ali em uma hierarquia de conceitos (synsets) usando relações de sinonímia e hiperonímia. Para isto, serão exploradas técnicas de aprendizado de representações distribuídas de palavras (word vectors), que são bastante adequadas para treinamento semissupervisionado.

 

Fábio Henrique Viduani Martinez Tema: Medidas de rearranjo de genomas usando operações DCJ livres de
famílias gênicas
Resumo: O principal objetivo desta proposta é investigar a área de genômica comparativa à luz do modelo livre de famílias de genes. As
famílias de genes são geralmente preestabelecidas computacionalmente e servem como base para uma grande variedade de estudos atuais em genômica comparativa. Como a predição de famílias de genes pode não ser consistente com as reais famílias de genes biológicas, atribuições incorretas podem deteriorar consideravelmente análises subsequentes.
Dessa forma, métodos livres de famílias têm potencial para aprimorar
as análises correntes atualmente realizadas. Consequentemente, essa
proposta engloba a investigação, sob o modelo livre de famílias de
genes DCJ de operações de rearranjo de genomas. Essa investigação
possui um forte apelo computacional, já que os resultados esperados
incluem a classificação da complexidade computacional dos problemas envolvidos, o desenvolvimento de algoritmos para solução desses problemas (algoritmos exatos, algoritmos de aproximação, heurísticas e a formulação de programas lineares) e a implementação e realização de
experimentos desses algoritmos sobre dados biológicos reais. Um método
assim estabelecido tem potencial efetivo de redução do custo
computacional na busca por soluções ótimas. Além disso, esse princípio
pode ser particularmente útil no estudo de genomas parcialmente
sequenciados ou montados, já que os métodos de predição de famílias de
genes tendem a ser suscetíveis à omissão de genes. Dessa forma, o
princípio livre de famílias pode apresentar melhorias na inferência de
distâncias filogenéticas de genomas incompletos, e também na detecção
de estruturas conservadas. E, finalmente, é importante destacar que,
enquanto a similaridade das sequências de genes é uma medida clara e razoável na construção de um grafo de similaridades de genes, as
similaridades em si podem também fornecer informação adicional, tal
como a similaridade funcional, que pode ser obtida em diversos bancos
de dados disponíveis e pode proporcionar outras visões sobre a
organização funcional do genoma.
Hemerson Pistori Desenvolvimento de novos algoritmos e técnicas de visão computacional e aprendizagem de máquina voltados para a análise e extração de informação a partir imagens capturadas por veículos aéres não tripulados (VANTs) para aplicação na agropecuária. Em particular, deverão ser estudadas e aprimoradas técnicas de extração de pontos de interesse, reconhecimento sintático de padrões, aprendizado profundo e geração de superpixels, entre outras
Marco Aurélio Stefanes Tema: Problemas de Biologia Computacional e Otimização Combinatória usando Computação Paralela Híbrida.

Nos anos recentes a Computação Paralela tem atuado com duas abordagens complementares. A primeira é a computação paralela cujo alvo são os ambientes em clusters, aglomerados de computadores conectados por uma rede dedicada de alta velocidade, obtendo alto desempenho. A segunda abordagem tem como alvo a programação paralela em GPUs, placas gráficas multiprocessadas que tem obtido performance cada vez melhores a baixo custo.  Este projeto visa  a Programação Paralela Híbrida que adro-docente-credenciamento-e-linhas-de-pesquisaconverge as duas abordagens em um ambiente com várias placas gráficas conectadas a redes de alta velocidade. Neste projeto tratamos de utilizar estas tecnologias em duas áreas da computação que tem demandado cada vez mais recursos computacionais. A saber, a Biologia Computacional com problema em redes biológicas, RNA-Seq e outros. Além disso, vários problemas em Otimização Combinatória, como problemas em grafos, tem exigido mais poder computacional na solução estes problemas.  Neste projeto atacaremos estes problemas usando a Computação Paralela Híbrida.

Maria Istela Cagnin Machado Tema: Uma Abordagem apoiada Computacionalmente para a Construção, Instanciação e Validação de Linhas de Processos de Negócios

Resumo: O entendimento dos processos de negócios de uma empresa pelos seus colaboradores e por engenheiros de software colabora, respectivamente, para o sucesso do negócio e para o desenvolvimento de sistemas de software que atendam às necessidades dos seus interessados. Isso é facilitado pela modelagem de processos de negócios, a qual apoia a análise de requisitos no contexto de Engenharia de Software; e também auxilia a compreensão e a otimização de processos de negócios existentes nas organizações sob a perspectiva de Gestão de Processos de Negócios. Em ambos os contextos, o reúso de modelos de processos de negócios é relevante por propiciar economia de tempo, esforço e custos durante a elaboração de tais modelos. Diante disso, a Engenharia de Linha de Produto de Software (ELPS), tem sido aplicada no contexto de Processos de Negócios, culminando no desdobramento de outras áreas de pesquisa como é o caso de Linhas de Processos de Negócios (LPN). Nesse contexto, este projeto de pesquisa pretende contribuir para que interessados realizem atividades de modelagem de processos de negócios e de Engenharia de Requisitos com menos tempo, esforço e custos associados com o apoio de reutilização. Para isso, uma ferramenta computacional denominada BPL-Framework e associada a um repositório de ativos está sendo construída no contexto deste projeto de pesquisa para apoiar as fases (construção, instanciação e validação de LPNs) de uma abordagem existente de linhas de processos de negócios, denominada GLPN (Gestão de Linhas de Processos de Negócio). Adicionalmente, para atender as atividades da Engenharia de Requisitos com menos tempo e esforço propõe-se extrair requisitos funcionais e não funcionais de LPNs para que fiquem disponíveis para serem reutilizados. Assim os interessados podem reusar tanto modelos de processos de negócio como requisitos de software a partir da instanciação de LPNs, as quais estarão disponíveis no repositório do BPL-Framework.

Coordenadora: Profa. Dra. Maria Istela Cagnin Machado

 

Tema: Investigando acessibilidade web em diferentes países

Resumo: Este projeto tem como objetivo investigar e analisar acessibilidade web em sites de diferentes instituições públicas (universidades, portais do governo, bancos, etc) de diversos países nos seis continentes. Serão utilizadas diferentes técnicas de avaliação de acessibilidade e serão gerados dados comparativos, gráficos e relatórios. Será desenvolvida uma ferramenta web que apresente as informações de acessibilidade de cada país considerado no estudo e os dados comparativos.

Coordenadora: Profa. Dra. Débora Maria Barroso Paiva

 

 

Renato Porfirio Ishii Tema: Redes neurais profundas e convolucionais em ambientes de alto desempenho para aplicações Big Data.

Resumo: A informação em suas diferentes formas, meios de acesso e divulgação está presente em todas as áreas do conhecimento. Organizações públicas e privadas acessam e manipulam volumes crescentes de dados transacionais, capturando trilhões de bytes de informações a partir de fornecedores, clientes e colaboradores. Por outro lado, milhares de sensores embarcados estão sendo acoplados a dispositivos específicos tais como celulares, medidores de temperatura, automóveis, máquinas industriais e agrícolas, que geram, analisam e transmitem dados no que se denomina “Internet das Coisas”. As redes sociais, os smartphones e outros aparelhos pessoais, incluindo PCs e laptops, permitem que bilhões de indivíduos ao redor do mundo contribuam para geração de dados em larga escala, o que muitos especialistas têm denominado de era Big Data. Neste projeto de mestrado pretende-se analisar e manipular dados oriundos de aplicações Big Data por meio da investigação de abordagens das áreas de Aprendizado de Máquina (AM) e Computação em Nuvem. Em Aprendizado de Máquina, redes neurais profundas e redes convolucionais (ou deep learning) devem ser o foco do estudo. Muitos trabalhos tem apontado que a principal infraestrutura para lidar com problemas Big Data é a computação em nuvem, portanto, neste projeto, um ambiente de cloud computing deve ser proposto para fins de validação dos algoritmos de AM.

 

Tema: Séries temporais aplicadas em ambientes de nuvem para lidar com problemas Big Data.

Resumo: A informação em suas diferentes formas, meios de acesso e divulgação está presente em todas as áreas do conhecimento. Organizações públicas e privadas acessam e manipulam volumes crescentes de dados transacionais, capturando trilhões de bytes de informações a partir de fornecedores, clientes e colaboradores. Por outro lado, milhares de sensores embarcados estão sendo acoplados a dispositivos específicos tais como celulares, medidores de temperatura, automóveis, máquinas industriais e agrícolas, que geram, analisam e transmitem dados no que se denomina “Internet das Coisas”. As redes sociais, os smartphones e outros aparelhos pessoais, incluindo PCs e laptops, permitem que bilhões de indivíduos ao redor do mundo contribuam para geração de dados em larga escala, o que muitos especialistas têm denominado de era Big Data. Neste projeto de mestrado pretende-se analisar e manipular dados com características Big Data por meio da investigação de Séries Temporais e Computação em Nuvem. Em Séries Temporais (ST), técnicas de gráficos de recorrência (ou recurrence plot), decomposição em modo empírico (ou EMD), análise de níveis de estocasticidade, de linearidade e de estacionariedade deverão ser exploradas. Muitos estudos tem apontado que a principal infraestrutura para lidar com problemas Big Data é a computação em nuvem, portanto, neste projeto, um ambiente de cloud computing deve ser proposto para fins de validação dos algoritmos baseados em séries temporais.

Ricardo Marcondes Marcacini Tema: Aprendizado de Máquina para Extração de Websensors

A integração de plataformas online com diversos setores da sociedade (e.g. indústrias, universidades, governo e cidadãos em geral) tem permitido o uso da web como um grande e poderoso sensor. Nesse contexto, novas pesquisas e aplicações têm sido desenvolvidas para extração de conhecimento da web para identificação de tendências (de cunho social, político e comercial), monitoramento de desastres naturais (terremotos e inundações), predição de epidemias, análise de sentimentos e a extração inteligente de indicadores a partir de notícias sobre temas específicos (e.g. agricultura e medicina). Os modelos computacionais que permitem processar esses dados e monitorar a evolução de determinados tópicos e fenômenos na web são chamados de “websensors”. Os trabalhos existentes na área necessitam de especialistas de domínio para definir os parâmetros do modelo de um websensor, o que limita seu uso em muitas aplicações. Neste projeto, são investigados métodos de aprendizado não supervisionado, como agrupamento de dados, para apoiar a extração de websensors e ajuste de seus parâmetros de forma automática. A metodologia adotada é baseada em dois tipos de modelos: descritivos e preditivos. Em modelos descritivos, os websensors são explorados para explicar um determinado fenômeno que ocorreu no passado, bem como a extração automática de eventos e fatos relacionados ao fenômeno. Em modelos preditivos, os websensors são empregados como informação adicional para melhorar a detecção de eventos e/ou valores futuros.

 

Wesley Nunes Gonçalves Tema: Detecção de Doenças em Lavouras de Soja usando Análise de Textura em Imagens

Resumo: A produção de soja é um dos principais segmentos da economia brasileira, destacando-se por sua representatividade na composição do PIB. Todavia a cultura da soja está exposta a uma série de desafios que podem reduzir drasticamente a produtividade e os ganhos econômicos, como doenças e ataques de pragas. Para aumentar a produtividade, torna-se necessário o desenvolvimento de novas tecnologias para auxiliar o manejo atual, por exemplo, tecnologias para minimizar a atuação de doenças na lavoura. A partir desse direcionamento, o objetivo deste projeto é a construção de um sistema de visão computacional para automatizar a identificação de doenças de soja por meio da análise de imagens de folhas. A utilização do sistema proposto pode reduzir as perdas de investimentos na lavoura causadas por doenças através de tomadas de decisões em tempo real, ampliando o potencial produtivo e a receita do estado de Mato Grosso do Sul.

 

Tema: Visão computacional para estimar automaticamente o peso vivo e o escore da condição corporal de bovinos de corte e leite

Resumo: A pecuária de corte e de leite constituem importantes segmentos da economia brasileira. Apesar dos números elevados, o sistema de produção ainda apresenta índices produtivos abaixo da média comparada a outros países. De acordo com o Plano Mais Pecuária, o objetivo para os próximos 10 anos é dobrar a lotação animal por área e produção de leite por animal. Para a obtenção destes níveis satisfatórios de produtividade na pecuária de corte e leite, alguns manejos necessitam ser realizados de forma constante, entre eles, a aferição do peso vivo e o escore corporal. Para tanto, a incorporação de novas tecnologias torna-se essencial. A partir desse direcionamento, o objetivo deste projeto é a construção de um sistema de visão computacional para automatizar a medição do escore da condição corporal e o peso de bovinos de corte e leite por meio de imagens. Atualmente, ambas as medidas são realizadas manualmente e, portanto, suscetíveis a erros humanos, subjetividade além de serem custosas, lentas e, em sua maioria, causarem estresse o animal. Com a aferição automática, as medidas podem auxiliar na tomada de decisões, em tempo real, de várias estratégias de manejo em todo o sistema de produção, entre elas, o crescimento e o estado nutricional, estabelecer o valor de venda do animal e ajustar o arraçoamento. Assim, o projeto proposto visa aumentar a produtividade através de tomadas de decisões em tempo real, ampliando o potencial produtivo e a receita do estado de Mato Grosso do Sul.