Eventos
Palestrante: Cássia Trojahn dos Santos
Data: 17/12/2009
Horário: 14h00m
Local: 513 - Prédio 32, FACIN, PUCRS.
Título: A Cooperative Approach for Composite Ontology Matching
Abstract: An important issue of ontology matching is to find effective ways of choosing among many techniques and their variations, and then combining their results. For this, an innovative and promising option is to formalise the combination of matching techniques using agent-based approaches, such as cooperative negotiation and argumentation. Following such perspective, different agents work on the basis of particular approaches arriving to distinct matching results that must be shared, compared, chosen and agreed. Such approaches allow to combine matching approaches in a more effective way. First, the final result of negotiation and argumentation represent a consensus between different views. Second, solving conflicts, the individual results can be improved. Third, agents can be aggregated and replaced in order to represent more interesting approaches according to the specific case, allowing to adapt the configuration of the matching solution. This thesis aims to formalise the problem of combination of ontology matching approaches using a cooperative agent-based approach.
Short bio: Possui graduação em Ciência da Computação pela Universidade de Santa Cruz do Sul (2000), Brasil, mestrado em Computação Aplicada pela Universidade do Vale do Rio dos Sinos (2004), Brasil, e doutorado em Informatica pela Universidade de Evora, Portugal. Tem experiência na área de Ciência da Computação, com ênfase em Ciência da Computação, atuando principalmente nos seguintes temas: ambientes virtuais inteligentes, web semantica e ontologies, e frameworks de argumentação.
Palestrante: Cássia Trojahn dos Santos
Data: 15/12/2009
Horário: 14h00m
Local: 513 - Prédio 32, FACIN, PUCRS.
Título: Ontology Matching and Evaluation. Apresentação
Abstract: Ontology matching is seen as the solution to data heterogeneity in ontology-based applications, enabling the interoperability between them. Matching ontologies consists of finding corresponding entities (i.e., classes, properties, or instances) in different ontologies (usually one source ontology and one target ontology). Many different techniques implementing this process have been proposed, which are surveyed from different perspectives. The distinction between them is accentuated by the manner in which they exploit the features within an ontology. Whereas syntactic techniques consider measures of string similarity; semantic ones consider semantic relations usually on the basis of lexical oriented linguistic resources; while structural techniques consider term positions in the ontology hierarchy. In this presentation, an introduction to the matching process and the different approaches for alignment will be presented. Evaluation of ontology matching systems and algorithms will be also discussed, what includes semantic precision and recall. Finally, the SEALS project, that aims the evaluation of semantic tools in large scale and the Ontology Alignment Evaluation Initiative (OEAI) will be discussed.
Short bio: Possui graduação em Ciência da Computação pela Universidade de Santa Cruz do Sul (2000), Brasil, mestrado em Computação Aplicada pela Universidade do Vale do Rio dos Sinos (2004), Brasil, e doutorado em Informatica pela Universidade de Evora, Portugal. Tem experiência na área de Ciência da Computação, com ênfase em Ciência da Computação, atuando principalmente nos seguintes temas: ambientes virtuais inteligentes, web semantica e ontologies, e frameworks de argumentação.
Palestrante: Luiz Augusto Pizzato
Data: 27/05/2009
Horário: 9h50m
Local: Sala a confirmar - FACIN PUCRS
Título: Using linguistically motivated features in Information Retrieval for Question Answering
Abstract: Esta palestra será dividida em duas partes. Na primeira parte apresentarei o meu trabalho de doutorado que foi desenvolvido na Macquarie University em Sydney na Austrália (veja o resumo em inglês abaixo). Na segunda parte falarei de minha experiência no doutorado da Austrália e sobre oportunidades que lá existem.
In this talk I will present the work conducted for my thesis where I investigated the impact of using linguistic features in the Information Retrieval (IR) stage of Question Answering (QA) systems. We hypothesise that techniques that are commonly used in the final answer extraction stage can improve the overall results of a QA system when adopted in the earlier IR stage. In particular, we study the use of the following information: i) named entities in a pseudo-relevance feedback process; and ii) semantic relations between words of questions and text sentences.
The study of the use of named entities is inspired by the common practice of filtering out sentences that do not contain the expected answer type. We consequently introduce a pseudo-relevance feedback that inserts entities of the correct answer type in the original query. Our experiments show that this technique leads to a query drift and the final results do not improve with respect to a query without additional feedback.
To study the use of relational information, we design an IR framework that is more efficient (in both speed and memory consumption) than standard approaches based on relational databases and on the concatenation of word pairs at the indexing stage. The resulting framework allows a multi-layer index that uses an extension to the standard vector space model as a ranking strategy. The resulting ranking strategy improves precision, without compromising the overall recall, by including linguistic word relations.
We present the Question Prediction Language Model (QPLM), a model of relational information that borrows concepts from Semantic Role Labelling (SRL) but is designed for the fast generation of annotation and its use for indexing and retrieval. The results are of quality comparable to SRL and indicate that linguistic information encoded in the form of semantic relations does enhance the retrieval quality of text and the final accuracy of QA systems.
Short bio: Pós doutorando na Universidade de Sydney. Luiz graduou-se em Ciência da Computação na PUCRS em 2000, no mesmo ano se juntou ao grupo de pesquisa do HP/PUCRS Centro de Processamento de Alto Desempenho (CPAD). Também na PUCRS, em 2003 ele recebeu o título de Mestre em Ciência da Computação, sob orientação da Prof. Vera Strube de Lima. Depois do mestrado Luiz juntou-se ao grupo docente da Universidade de Passo Fundo e ao participar do projeto DIRPI visitou a Universidade de Évora para a integração de seu trabalho de mestrado ao sistema de busca de documentos da procuradoria geral da república de Portugal. Entre os anos de 2004 e 2008 Luiz desenvolveu seu doutorado no Centre for Language Technology na Macquarie University em Sydney na Austrália. Em 2009 juntou-se ao grupo ao grupo acadêmico da Universidade de Sydney, sendo vinculado ao projeto de personalização de sistemas do Smart Services CRC, uma cooperação entre indústria e universidade do governo australiano.
Palestrante: Larissa Freitas e Tatiane Moraes (1); Anderson Bestteti (2) Data: 30/04/2009 (quinta-feira)
Horário: 15h00
Local: Sala 513, FACIN PUCRS.
Título: Experiência do intercâmbio USP (1); Introdução a SPARQL (2). Apresentação
Abstract: Experiência do intercâmbio USP (1); Introdução á linguagem de consulta SPARQL, destinada a recuperar informações de arquivos RDF e OWL (2).
Palestrante: Marcelo Blois e alunos
Data: 28/04/2009 (terça-feira)
Horário: 14h00
Local: Auditório 516, FACIN PUCRS.
Título: Interação entre grupos. Programação
Abstract: Apresentação das pesquisas desenvolvidas no Grupo de Pesquisa ISEG.
Palestrante: Rafael H Bordini
Data: 27/04/2009 (segunda-feira)
Horário: 17h - 18h15m
Local: Auditório 516, FACIN PUCRS.
Título: Programação Orientada a Agentes Usando Jason
Abstract: Rafael H Bordini, autor: http://jason.sourceforge.net/jBook/jBookWebSite/Home.php.
As técnicas de sistemas multi-agentes facilitam o desenvolvimento de sistemas computacionais que operam em ambientes dinâmicos e imprevisíveis, nos quais atuam um numero indeterminado de entidades de software que se comportam de forma autônoma. Nesta palestra será dado um breve tutorial sobre a plataforma de desenvolvimento de sistemas multi-agentes chamada Jason. Esta plataforma oferece o uso de uma linguagem de programação orientada a agentes que e' uma extensão da linguagem AgentSpeak. A programação orientada a agentes permite o uso de abstrações como "objetivos" e "planos" que facilitam a implementação de sistemas projetados utilizando esses conceitos típicos da área de sistemas multi-agentes.
Palestrante: Leandro Henrique Mendonça de Oliveira
Data: 24/04/2009 (sexta-feira)
Horário: 14:00h
Local: Auditório 516, Prédio 32 - FACIN PUCRS
Título: Extração automática de candidatos a termos: uma visão geral sobre os termos e a extração automática. Apresentação
Abstract: Nesta palestra iremos apresentar uma visão geral sobre os termos sob a luz da Terminologia e as dificuldades do reconhecimento terminológico automático, bem como os principais aspectos, características, vantagens, desvantagens e métodos mais utilizados e aplicados nas ferramentas de extração automática de candidatos a termos. Adicionalmente, será apresentado também alguns exercícios práticos de extração automática utilizado a ferramenta NSP -- N-gram Statistics Package, desenvolvida por Ted Pedersen, da Carnegie Mellow University, e colaboradores.
Short bio: Orientando de doutorado da Profa. Dra. Sandra Maria Aluísio do ICMC-USP em visita à PUC pelo projeto FAROL, CAPES - PROCAD.
Palestrante: Leandro Henrique Mendonça de Oliveira
Data: 23/04/2009 (quinta-feira)
Horário: 14:00h
Local: Auditório 516, Prédio 32 - FACIN PUCRS
Título: e-Termos: Um Ambiente Colaborativo Web para Criação de Produtos Terminológicos. Apresentação
Abstract: Nesta palestra iremos apresentar o Sistema e-Termos, um ambiente web baseado nos princípios do CSCW (Computer Supported Colaborative Work) voltado, principalmente, para as tarefas relacionadas ao processo de criação de produtos terminológicos, tais como glossários, dicionários e vocabulários especializados. Serão apresentados o histórico do trabalho, os objetivos, a interface com a Terminologia, o suporte teórico, a arquitetura computacional, o status atual de desenvolvimento, as ferramentas disponibilizadas e algumas funcionalidades.
Short bio: Orientando de doutorado da Profa. Dra. Sandra Maria Aluísio do ICMC-USP em visita à PUC pelo projeto FAROL, CAPES - PROCAD.
Palestrante: Sandro Fiorini
Data: 16/04/2009 (quinta-feira)
Horário: 15h
Local: Sala 516, Prédio 32, FACIN, PUCRS.
Título: Interpretação semântica de imagens. Apresentação
Abstract: Sandro Fiorini, mestre pelo PPGC da UFRGS, orientando da Prof. Mara Abel irá apresentar palestra sobre interpretação semântica de imagens.
Palestrante: Helena de Medeiros Caseli
Data: 23/01/2009
Horário: 14:30h às 15:30h
Local: Sala 517 5º andar - FACIN PUCRS
Título: Construção de ferramentas e recursos para o Processamento da Língua Natural - ênfase na tradução automática envolvendo o português do Brasil
Abstract: Nessa palestra serão apresentados, brevemente, alguns recursos e ferramentas construídos para o Processamento da Língua Natural, em especial para a tradução automática envolvendo o Português do Brasil. Serão abordados temas como alinhamento (sentencial e lexical) de textos paralelos e indução automática de recursos (léxicos bilíngues e regras de tradução) para a tradução automática.
Short bio: A Prof. Dra. Helena de Medeiros Caseli é bacharel em Ciência da Computação pela Universidade Federal de Uberlândia (UFU), mestre e doutora em Ciência da Computação e Matemática Computacional pela Universidade de São Paulo (USP). Vem atuando nos últimos anos nas áreas de Inteligência Artificial, Processamento de Língua Natural e Tradução Automática. Durante seu doutorado estagiou por 1 ano na Universidad de Alicante, Espanha, onde retornou após o doutorado para um estágio pós-doutoral de 3 meses. Atualmente é professora adjunta da Universidade Federal de São Carlos (UFSCar).
Palestrante: Prof. António Horta Branco, da Univ. de Lisboa
Data: 21-22/01/2009
Horário: 8h30 às 12h
Local: Sala 517 5º andar - FACIN PUCRS
Título: Desambiguação da Flexão Verbal
Abstract: Poderemos algum dia falar com as máquinas como falamos entre nós? A resposta a esta pergunta depende de inúmeras outras questões cuja resposta será preciso conhecer. Entre elas encontra-se a pergunta sobre a complexidade das linguagens naturais do ponto de vista do seu processamento computacional.
Este curso tem por objetivo apresentar, no estado atual do avanço da pesquisa, os resultados disponíveis sobre a complexidade computacional da linguagem natural e discutir as suas repercussões não só em termos das condições de possibilidade da disciplina de Processamento de Linguagem Natural, mas também em termos dos fundamentos e viabilidade do projeto da Ciência Cognitiva.
Começaremos por considerar os diferentes ângulos de abordagem da linguagem natural e correspondentes disciplinas científicas que os promovem, para se explicitar qual a abordagem que assumimos e que ângulo estamos a isolar. No quadro dessa abordagem, elucidaremos as diferentes dimensões da linguagem natural.
De entre essas dimensões, concentrar-nos-emos naquelas a partir da quais foram obtidos resultados de relevo em termos de complexidade computacional. Estes resultados serão apresentados em pormenor. A sua interpretação será discutida e ponderada, com especial enfoque para o seu contributo para a questão de partida deste curso, acerca da complexidade computacional da linguagem natural, e para o seu papel chave em termos das fundações da Ciência Cognitiva.
Serão ainda apresentados desenvolvimentos recentes em que se tem procurado explorar estes resultados de complexidade computacional no sentido de neles basear critérios de determinação de funções cognitivas de nível superior em espécies animais diferentes da espécie humana.
Palestrante: Prof. António Horta Branco, da Univ. de Lisboa
Data: 20/01/2009
Horário: 10h
Local: Sala 517 5º andar - FACIN PUCRS
Título: Desambiguação da Flexão Verbal
Mini-bio: O Prof. António Branco, docente da Faculdade de Ciências da Universidade de Lisboa, é mestre em Lingüística Computacional e doutor em Informática pela mesma universidade. Tem conduzido projetos de pesquisa em âmbito nacional e europeu, contando com relevante produção nessa área. Está entre nós custeado pelo projeto PONTO (Portuguese Ontologies) de cooperação internacional com financiamento CNPq-GRICES.
Palestrante: Rosa del Gaudio
Data: 15/01/2009
Horário: 10h
Local: Sala 517 5º andar - FACIN PUCRS
Título: Extração automática de definições em língua portuguesa
Abstract: A doutoranda Rosa del Gaudio, do Departamento de Informática da Faculdade de Ciências, Universidade de Lisboa, está desenvolvendo trabalho junto ao grupo de pesquisas em Processamento da Linguagem Natural do PPGCC financiada pelo projeto PONTO (Portuguese Ontologies - Cooperação Internacional CNPq-GRICES) e fará apresentação sobre suas pesquisas.
Palestrante: Jean-Luc Minel
Data: 19/12/2008
Horário: 14:30h
Local: Sala 515 5º andar - FACIN PUCRS
Título: Navegação Textual
Abstract: O termo Navegação Textual recebe múltiplas interpretações. A mais comum leva inevitavelmente ao processo realizado pelas ferramentas de navegação hipertextual, o que dá a possibilidade de ativar uma ligação e assim deslocar o ponto de leitura; ese deslocamento podendo ser intra ou intertextual. A concepção de navegação textual do grupo do Prof. Minel destaca-se desta abordagem, pois considera que circular ou navegar em um texto é um proceso cognitivo que convoca conhecimentos que são próprios à finalidade da navegação. Formula-se a hipótese de que o trajeto do leitor pode ser assistido pela exploração desses conhecimentos que podem ser, em parte, modelados. Em conseqüência, foi desenvolvida pelo grupo do Prof. Minel em colaboração com o Instituto de Computação da Universidad de la Republica del Uruguay a linguagem SEXTANT para expressar conhecimentos e a mesma foi implantada na plataforma NaviTexte. Ilustraremos o interesse nessa plataforma apresentando diferentes aplicações, fruto de colaboração com equipes francesas e estrangeiras.
Palestrante: Dr. Florence Amardeilh
Data: 04/12/2008
Horário: 14h30 às 15h30
Local: Mini-auditório 307 3º andar - FACIN PUCRS
Título: Semantic Annotation & Ontology Population : examples of applications
Abstract: This presentation deals with issues related to semantic annotation and ontology population within the framework defined by the Semantic Web (SW). The vision of the Semantic Web initiated in 1998 by Sir Tim Berners-Lee aims to structure the information available on the Web. To achieve that goal, the resources, textual or multimedias, must be semantically tagged by metadata so that software agents can exploit them. The idea developed here is to combine the information extraction (IE) tools with knowledge representation tools from the SW for the achievement of the two parallel tasks of semantic annotation and ontology population. Despite all integration efforts, there is currently a gap between the representation formats of the linguistic tools used to extract information and those of the knowledge representation tools used to model the ontology and store the instances or the semantic annotations. The stake consists in proposing a methodological reflexion on the interoperability of these technologies as well as designing operational solutions for companies and, on a broader scale, for the Web. We will also illustrate this presentation with a set of applications, from research to industrial solutions.
Short bio: Dr. Florence Amardeilh leads the R&D Department of Mondeca since 2007, working on knowledge acquisition and semantic annotation since 2002. In 2001, she graduated as a Research Engineer in the fields of Information Systems and Knowledge Management, specialised on Text Mining solutions. From 2003 to 2007, she did a PhD in Language Processing at the University of Paris 10, sponsored by Mondeca. The thesis dealt with combining Natural Language Processing and Semantic Web methods and tools to create domain-oriented applications for ontology population and semantic annotation. She gave lectures in semantics, knowledge representation and semantic web at the universities of Paris 4 (Sorbonne) and Paris 10. Her current research interests include ontologies modelling, semantic knowledge bases, linguistic tools and especially the ontology-based information extraction engines, automatic knowledge acquisition and semantic annotation.
Palestrante: Caroline Gasperin
Data: 04/12/2008
Horário: 16h às 17h
Local: Mini-auditório 307 3º andar - FACIN PUCRS
Título: Statistical anaphora resolution in biomedical texts
Abstract: Caroline will present her PhD work on anaphora resolution in biomedical texts. Biomedical literature has been the focus of relevant information extraction projects, and resolving anaphora is an important step in the identification of mentions of biomedical entities about which information could be extracted. She proposes a probabilistic model for the resolution of anaphora in biomedical texts. The model results from a simple decomposition process and independence assumptions applied to a conditional probability that involves several parameters (features). The model seeks to find the antecedents of anaphoric expressions, both coreferent and associative ones, and also to identify discourse-new expressions. Caroline has created a corpus of full-text biomedical articles to train and evaluate the model. The corpus is annotated with anaphoric links between noun phrases referring to the biomedical entities of interest. Such noun phrases are typed according to a scheme that is based on the Sequence Ontology. This corpus is publicly available.
Short bio: Caroline Gasperin has just finished her PhD studies at the University of Cambridge, her thesis focus on anaphora resolution and BioNLP. She has been working in the field of natural language processing since 2000. In 2001 Caroline got a MSc degree from PUC-RS, when she worked on syntax-based lexical acquisition for Portuguese. Her research interests are anaphora resolution, automatic lexical acquisition and corpus annotation. She is particularly interested in statistical methods for NL.
Palestrante: Ariani Di Felippo
Data: 15/08/2008
Horário: 16h
Local: Sala 517 5º andar - FACIN PUCRS
Título: O Alinhamento Léxico-Conceitual e o Desenvolvimento de Recursos Bilíngües para o Processamento Computacional do Português do Brasil
Abstract: O PLN no Brasil, isto é, o processamento computacional do português do Brasil (PB), apesar de apresentar considerável avanço na última década, ainda é carente de recursos lingüísticos, principalmente os recursos léxico-semânticos bilíngües. Com o objetivo de minimizar tal carência, dois recursos em desenvolvimento podem ser destacados. O primeiro deles é a base bilíngüe resultante do alinhamento léxico-conceitual da base da wordnet do PB, a WordNet.Br, e da wordnet do inglês norte-americano, a WordNet de Princeton, e o segundo é a base bilíngüe REBECA, também desenvolvida para o par de línguas português brasileiro/inglês norte-americano. Ambos os recursos têm sido desenvolvidos com base em uma concepção lingüisticamente motivada de PLN e por meio do trabalho colaborativo entre os cientistas da linguagem (lingüistas) e os engenheiros da linguagem (cientistas da computação). Assim, objetiva-se apresentar essas bases bilíngües, destacando principalmente o método de alinhamento ou indexação léxico-conceitual e suas principais vantagens e desvantagens.
Short bio: Ariani concluiu seu doutorado em Lingüística recentemente pela UNESP-Araraquara.
Palestrante: Thiago Pardo
Data: 18/08/2008
Horário: 10:30h
Local: Sala 517 5º andar - FACIN PUCRS
Título: O Alinhamento Léxico-Conceitual e o Desenvolvimento de Recursos Bilíngües para o Processamento Computacional do Português do Brasil
Abstract: Nesta palestra, será apresentado e discutido o tópico Simplificação Textual, que consiste em uma subárea de pesquisa relativamente recente em Processamento de Línguas Naturais. Simplificação Textual é a tarefa de criar uma versão mais simples de um texto para fins e usuários pré-determinados, levando-se em conta questões como escolaridade do público-alvo e presença de deficiências cognitivas, assim como o impacto que a simplificação tem em tarefas posteriores de processamento da língua. Em particular, serão relatados os esforços para a construção de ferramentas de simplificação textual para a língua portuguesa.
Short bio: O professor Thiago Pardo é pesquisador no Instituto de Ciências Matemáticas e de Computação da USP/São Carlos e membro do NILC (Núcleo Interinstitucional de Lingüística Computacional), tem trabalhado com Processamento de Línguas Naturais por aproximadamente 10 anos, com especial interesse em Sumarização, Tradução e Análise Discursiva Automática.
Integração PLN
Data: 09/01/2008
Horário: 14:30h às 15:30h
Local: Sala 517 5º andar - FACIN PUCRS
PUCRS
Sílvia Moraes - Categorização de textos baseada em Conceitos
Miriam Sayão e Carlos Prolo - Aplicação de Técnicas de PLN para a Qualidade de Software
Thyago Borges - Aplicação de uma Técnica Tradicional de Expansão de Consulta ao Modelo TR+
Josiane Fontoura - Aplicação de Novas Abordagens para o Cálculo da Similaridade Intrínseca e Extrínseca entre Ontologias
Universidade de Lisboa
António Branco - Da Forma Ortográfica à Forma Lógica, Processamento Superficial, Processamento Profundo
UNISINOS
Luiz Carlos Ribeiro Jr. - OntoLP: Construção Semi-automática de ontologias a partir de textos da Língua Portuguesa
Patrícia Gonçalves - CORREFSUM: Revisão de Coesão Referencial em Sumários Extrativos
Paulo Roberto Pasqualotti - WordNet Affect BR: Base Lexical de Emoções para a Língua Portuguesa
Anderson Bertoldi - A Semântica dos Adjetivos: Como e Por Que Incluí-la em uma Ontologia de Domínio Jurídico
Rove Chishman - FrameCorp: Uma Proposta de Aplicação da Semântica de Frames para a Anotação de Corpus
UCPEL
Stanley Loh - Apresentação do Grupo
UFRGS
Aline Villavicencio - Apresentação do Grupo, Modelagem de Linguagens Naturais para a Captura de Relacionamentos Sintático-Semânticos, Verificação Automática de Substantivos Compostos Através de Reconhecimento de Padrões Sintáticos
Otávio Acosta - Identificação e Tratamento de Expressões Multipalavras Aplicado à Recuperação de Informação
Paulo Schreiner - Aquisição Léxica de Verbos-Partícula Utilizando Corpora Paralelos
Mário Machado - A Verb Learning Model Driven By Syntatic Constructions
Data: 17/12/2009
Horário: 14h00m
Local: 513 - Prédio 32, FACIN, PUCRS.
Título: A Cooperative Approach for Composite Ontology Matching
Abstract: An important issue of ontology matching is to find effective ways of choosing among many techniques and their variations, and then combining their results. For this, an innovative and promising option is to formalise the combination of matching techniques using agent-based approaches, such as cooperative negotiation and argumentation. Following such perspective, different agents work on the basis of particular approaches arriving to distinct matching results that must be shared, compared, chosen and agreed. Such approaches allow to combine matching approaches in a more effective way. First, the final result of negotiation and argumentation represent a consensus between different views. Second, solving conflicts, the individual results can be improved. Third, agents can be aggregated and replaced in order to represent more interesting approaches according to the specific case, allowing to adapt the configuration of the matching solution. This thesis aims to formalise the problem of combination of ontology matching approaches using a cooperative agent-based approach.
Short bio: Possui graduação em Ciência da Computação pela Universidade de Santa Cruz do Sul (2000), Brasil, mestrado em Computação Aplicada pela Universidade do Vale do Rio dos Sinos (2004), Brasil, e doutorado em Informatica pela Universidade de Evora, Portugal. Tem experiência na área de Ciência da Computação, com ênfase em Ciência da Computação, atuando principalmente nos seguintes temas: ambientes virtuais inteligentes, web semantica e ontologies, e frameworks de argumentação.
Palestrante: Cássia Trojahn dos Santos
Data: 15/12/2009
Horário: 14h00m
Local: 513 - Prédio 32, FACIN, PUCRS.
Título: Ontology Matching and Evaluation. Apresentação
Abstract: Ontology matching is seen as the solution to data heterogeneity in ontology-based applications, enabling the interoperability between them. Matching ontologies consists of finding corresponding entities (i.e., classes, properties, or instances) in different ontologies (usually one source ontology and one target ontology). Many different techniques implementing this process have been proposed, which are surveyed from different perspectives. The distinction between them is accentuated by the manner in which they exploit the features within an ontology. Whereas syntactic techniques consider measures of string similarity; semantic ones consider semantic relations usually on the basis of lexical oriented linguistic resources; while structural techniques consider term positions in the ontology hierarchy. In this presentation, an introduction to the matching process and the different approaches for alignment will be presented. Evaluation of ontology matching systems and algorithms will be also discussed, what includes semantic precision and recall. Finally, the SEALS project, that aims the evaluation of semantic tools in large scale and the Ontology Alignment Evaluation Initiative (OEAI) will be discussed.
Short bio: Possui graduação em Ciência da Computação pela Universidade de Santa Cruz do Sul (2000), Brasil, mestrado em Computação Aplicada pela Universidade do Vale do Rio dos Sinos (2004), Brasil, e doutorado em Informatica pela Universidade de Evora, Portugal. Tem experiência na área de Ciência da Computação, com ênfase em Ciência da Computação, atuando principalmente nos seguintes temas: ambientes virtuais inteligentes, web semantica e ontologies, e frameworks de argumentação.
Palestrante: Luiz Augusto Pizzato
Data: 27/05/2009
Horário: 9h50m
Local: Sala a confirmar - FACIN PUCRS
Título: Using linguistically motivated features in Information Retrieval for Question Answering
Abstract: Esta palestra será dividida em duas partes. Na primeira parte apresentarei o meu trabalho de doutorado que foi desenvolvido na Macquarie University em Sydney na Austrália (veja o resumo em inglês abaixo). Na segunda parte falarei de minha experiência no doutorado da Austrália e sobre oportunidades que lá existem.
In this talk I will present the work conducted for my thesis where I investigated the impact of using linguistic features in the Information Retrieval (IR) stage of Question Answering (QA) systems. We hypothesise that techniques that are commonly used in the final answer extraction stage can improve the overall results of a QA system when adopted in the earlier IR stage. In particular, we study the use of the following information: i) named entities in a pseudo-relevance feedback process; and ii) semantic relations between words of questions and text sentences.
The study of the use of named entities is inspired by the common practice of filtering out sentences that do not contain the expected answer type. We consequently introduce a pseudo-relevance feedback that inserts entities of the correct answer type in the original query. Our experiments show that this technique leads to a query drift and the final results do not improve with respect to a query without additional feedback.
To study the use of relational information, we design an IR framework that is more efficient (in both speed and memory consumption) than standard approaches based on relational databases and on the concatenation of word pairs at the indexing stage. The resulting framework allows a multi-layer index that uses an extension to the standard vector space model as a ranking strategy. The resulting ranking strategy improves precision, without compromising the overall recall, by including linguistic word relations.
We present the Question Prediction Language Model (QPLM), a model of relational information that borrows concepts from Semantic Role Labelling (SRL) but is designed for the fast generation of annotation and its use for indexing and retrieval. The results are of quality comparable to SRL and indicate that linguistic information encoded in the form of semantic relations does enhance the retrieval quality of text and the final accuracy of QA systems.
Short bio: Pós doutorando na Universidade de Sydney. Luiz graduou-se em Ciência da Computação na PUCRS em 2000, no mesmo ano se juntou ao grupo de pesquisa do HP/PUCRS Centro de Processamento de Alto Desempenho (CPAD). Também na PUCRS, em 2003 ele recebeu o título de Mestre em Ciência da Computação, sob orientação da Prof. Vera Strube de Lima. Depois do mestrado Luiz juntou-se ao grupo docente da Universidade de Passo Fundo e ao participar do projeto DIRPI visitou a Universidade de Évora para a integração de seu trabalho de mestrado ao sistema de busca de documentos da procuradoria geral da república de Portugal. Entre os anos de 2004 e 2008 Luiz desenvolveu seu doutorado no Centre for Language Technology na Macquarie University em Sydney na Austrália. Em 2009 juntou-se ao grupo ao grupo acadêmico da Universidade de Sydney, sendo vinculado ao projeto de personalização de sistemas do Smart Services CRC, uma cooperação entre indústria e universidade do governo australiano.
Palestrante: Larissa Freitas e Tatiane Moraes (1); Anderson Bestteti (2) Data: 30/04/2009 (quinta-feira)
Horário: 15h00
Local: Sala 513, FACIN PUCRS.
Título: Experiência do intercâmbio USP (1); Introdução a SPARQL (2). Apresentação
Abstract: Experiência do intercâmbio USP (1); Introdução á linguagem de consulta SPARQL, destinada a recuperar informações de arquivos RDF e OWL (2).
Palestrante: Marcelo Blois e alunos
Data: 28/04/2009 (terça-feira)
Horário: 14h00
Local: Auditório 516, FACIN PUCRS.
Título: Interação entre grupos. Programação
Abstract: Apresentação das pesquisas desenvolvidas no Grupo de Pesquisa ISEG.
Palestrante: Rafael H Bordini
Data: 27/04/2009 (segunda-feira)
Horário: 17h - 18h15m
Local: Auditório 516, FACIN PUCRS.
Título: Programação Orientada a Agentes Usando Jason
Abstract: Rafael H Bordini, autor: http://jason.sourceforge.net/jBook/jBookWebSite/Home.php.
As técnicas de sistemas multi-agentes facilitam o desenvolvimento de sistemas computacionais que operam em ambientes dinâmicos e imprevisíveis, nos quais atuam um numero indeterminado de entidades de software que se comportam de forma autônoma. Nesta palestra será dado um breve tutorial sobre a plataforma de desenvolvimento de sistemas multi-agentes chamada Jason. Esta plataforma oferece o uso de uma linguagem de programação orientada a agentes que e' uma extensão da linguagem AgentSpeak. A programação orientada a agentes permite o uso de abstrações como "objetivos" e "planos" que facilitam a implementação de sistemas projetados utilizando esses conceitos típicos da área de sistemas multi-agentes.
Palestrante: Leandro Henrique Mendonça de Oliveira
Data: 24/04/2009 (sexta-feira)
Horário: 14:00h
Local: Auditório 516, Prédio 32 - FACIN PUCRS
Título: Extração automática de candidatos a termos: uma visão geral sobre os termos e a extração automática. Apresentação
Abstract: Nesta palestra iremos apresentar uma visão geral sobre os termos sob a luz da Terminologia e as dificuldades do reconhecimento terminológico automático, bem como os principais aspectos, características, vantagens, desvantagens e métodos mais utilizados e aplicados nas ferramentas de extração automática de candidatos a termos. Adicionalmente, será apresentado também alguns exercícios práticos de extração automática utilizado a ferramenta NSP -- N-gram Statistics Package, desenvolvida por Ted Pedersen, da Carnegie Mellow University, e colaboradores.
Short bio: Orientando de doutorado da Profa. Dra. Sandra Maria Aluísio do ICMC-USP em visita à PUC pelo projeto FAROL, CAPES - PROCAD.
Palestrante: Leandro Henrique Mendonça de Oliveira
Data: 23/04/2009 (quinta-feira)
Horário: 14:00h
Local: Auditório 516, Prédio 32 - FACIN PUCRS
Título: e-Termos: Um Ambiente Colaborativo Web para Criação de Produtos Terminológicos. Apresentação
Abstract: Nesta palestra iremos apresentar o Sistema e-Termos, um ambiente web baseado nos princípios do CSCW (Computer Supported Colaborative Work) voltado, principalmente, para as tarefas relacionadas ao processo de criação de produtos terminológicos, tais como glossários, dicionários e vocabulários especializados. Serão apresentados o histórico do trabalho, os objetivos, a interface com a Terminologia, o suporte teórico, a arquitetura computacional, o status atual de desenvolvimento, as ferramentas disponibilizadas e algumas funcionalidades.
Short bio: Orientando de doutorado da Profa. Dra. Sandra Maria Aluísio do ICMC-USP em visita à PUC pelo projeto FAROL, CAPES - PROCAD.
Palestrante: Sandro Fiorini
Data: 16/04/2009 (quinta-feira)
Horário: 15h
Local: Sala 516, Prédio 32, FACIN, PUCRS.
Título: Interpretação semântica de imagens. Apresentação
Abstract: Sandro Fiorini, mestre pelo PPGC da UFRGS, orientando da Prof. Mara Abel irá apresentar palestra sobre interpretação semântica de imagens.
Palestrante: Helena de Medeiros Caseli
Data: 23/01/2009
Horário: 14:30h às 15:30h
Local: Sala 517 5º andar - FACIN PUCRS
Título: Construção de ferramentas e recursos para o Processamento da Língua Natural - ênfase na tradução automática envolvendo o português do Brasil
Abstract: Nessa palestra serão apresentados, brevemente, alguns recursos e ferramentas construídos para o Processamento da Língua Natural, em especial para a tradução automática envolvendo o Português do Brasil. Serão abordados temas como alinhamento (sentencial e lexical) de textos paralelos e indução automática de recursos (léxicos bilíngues e regras de tradução) para a tradução automática.
Short bio: A Prof. Dra. Helena de Medeiros Caseli é bacharel em Ciência da Computação pela Universidade Federal de Uberlândia (UFU), mestre e doutora em Ciência da Computação e Matemática Computacional pela Universidade de São Paulo (USP). Vem atuando nos últimos anos nas áreas de Inteligência Artificial, Processamento de Língua Natural e Tradução Automática. Durante seu doutorado estagiou por 1 ano na Universidad de Alicante, Espanha, onde retornou após o doutorado para um estágio pós-doutoral de 3 meses. Atualmente é professora adjunta da Universidade Federal de São Carlos (UFSCar).
Palestrante: Prof. António Horta Branco, da Univ. de Lisboa
Data: 21-22/01/2009
Horário: 8h30 às 12h
Local: Sala 517 5º andar - FACIN PUCRS
Título: Desambiguação da Flexão Verbal
Abstract: Poderemos algum dia falar com as máquinas como falamos entre nós? A resposta a esta pergunta depende de inúmeras outras questões cuja resposta será preciso conhecer. Entre elas encontra-se a pergunta sobre a complexidade das linguagens naturais do ponto de vista do seu processamento computacional.
Este curso tem por objetivo apresentar, no estado atual do avanço da pesquisa, os resultados disponíveis sobre a complexidade computacional da linguagem natural e discutir as suas repercussões não só em termos das condições de possibilidade da disciplina de Processamento de Linguagem Natural, mas também em termos dos fundamentos e viabilidade do projeto da Ciência Cognitiva.
Começaremos por considerar os diferentes ângulos de abordagem da linguagem natural e correspondentes disciplinas científicas que os promovem, para se explicitar qual a abordagem que assumimos e que ângulo estamos a isolar. No quadro dessa abordagem, elucidaremos as diferentes dimensões da linguagem natural.
De entre essas dimensões, concentrar-nos-emos naquelas a partir da quais foram obtidos resultados de relevo em termos de complexidade computacional. Estes resultados serão apresentados em pormenor. A sua interpretação será discutida e ponderada, com especial enfoque para o seu contributo para a questão de partida deste curso, acerca da complexidade computacional da linguagem natural, e para o seu papel chave em termos das fundações da Ciência Cognitiva.
Serão ainda apresentados desenvolvimentos recentes em que se tem procurado explorar estes resultados de complexidade computacional no sentido de neles basear critérios de determinação de funções cognitivas de nível superior em espécies animais diferentes da espécie humana.


Palestrante: Prof. António Horta Branco, da Univ. de Lisboa
Data: 20/01/2009
Horário: 10h
Local: Sala 517 5º andar - FACIN PUCRS
Título: Desambiguação da Flexão Verbal
Mini-bio: O Prof. António Branco, docente da Faculdade de Ciências da Universidade de Lisboa, é mestre em Lingüística Computacional e doutor em Informática pela mesma universidade. Tem conduzido projetos de pesquisa em âmbito nacional e europeu, contando com relevante produção nessa área. Está entre nós custeado pelo projeto PONTO (Portuguese Ontologies) de cooperação internacional com financiamento CNPq-GRICES.
Palestrante: Rosa del Gaudio
Data: 15/01/2009
Horário: 10h
Local: Sala 517 5º andar - FACIN PUCRS
Título: Extração automática de definições em língua portuguesa
Abstract: A doutoranda Rosa del Gaudio, do Departamento de Informática da Faculdade de Ciências, Universidade de Lisboa, está desenvolvendo trabalho junto ao grupo de pesquisas em Processamento da Linguagem Natural do PPGCC financiada pelo projeto PONTO (Portuguese Ontologies - Cooperação Internacional CNPq-GRICES) e fará apresentação sobre suas pesquisas.
Palestrante: Jean-Luc Minel
Data: 19/12/2008
Horário: 14:30h
Local: Sala 515 5º andar - FACIN PUCRS
Título: Navegação Textual
Abstract: O termo Navegação Textual recebe múltiplas interpretações. A mais comum leva inevitavelmente ao processo realizado pelas ferramentas de navegação hipertextual, o que dá a possibilidade de ativar uma ligação e assim deslocar o ponto de leitura; ese deslocamento podendo ser intra ou intertextual. A concepção de navegação textual do grupo do Prof. Minel destaca-se desta abordagem, pois considera que circular ou navegar em um texto é um proceso cognitivo que convoca conhecimentos que são próprios à finalidade da navegação. Formula-se a hipótese de que o trajeto do leitor pode ser assistido pela exploração desses conhecimentos que podem ser, em parte, modelados. Em conseqüência, foi desenvolvida pelo grupo do Prof. Minel em colaboração com o Instituto de Computação da Universidad de la Republica del Uruguay a linguagem SEXTANT para expressar conhecimentos e a mesma foi implantada na plataforma NaviTexte. Ilustraremos o interesse nessa plataforma apresentando diferentes aplicações, fruto de colaboração com equipes francesas e estrangeiras.
Palestrante: Dr. Florence Amardeilh
Data: 04/12/2008
Horário: 14h30 às 15h30
Local: Mini-auditório 307 3º andar - FACIN PUCRS
Título: Semantic Annotation & Ontology Population : examples of applications
Abstract: This presentation deals with issues related to semantic annotation and ontology population within the framework defined by the Semantic Web (SW). The vision of the Semantic Web initiated in 1998 by Sir Tim Berners-Lee aims to structure the information available on the Web. To achieve that goal, the resources, textual or multimedias, must be semantically tagged by metadata so that software agents can exploit them. The idea developed here is to combine the information extraction (IE) tools with knowledge representation tools from the SW for the achievement of the two parallel tasks of semantic annotation and ontology population. Despite all integration efforts, there is currently a gap between the representation formats of the linguistic tools used to extract information and those of the knowledge representation tools used to model the ontology and store the instances or the semantic annotations. The stake consists in proposing a methodological reflexion on the interoperability of these technologies as well as designing operational solutions for companies and, on a broader scale, for the Web. We will also illustrate this presentation with a set of applications, from research to industrial solutions.
Short bio: Dr. Florence Amardeilh leads the R&D Department of Mondeca since 2007, working on knowledge acquisition and semantic annotation since 2002. In 2001, she graduated as a Research Engineer in the fields of Information Systems and Knowledge Management, specialised on Text Mining solutions. From 2003 to 2007, she did a PhD in Language Processing at the University of Paris 10, sponsored by Mondeca. The thesis dealt with combining Natural Language Processing and Semantic Web methods and tools to create domain-oriented applications for ontology population and semantic annotation. She gave lectures in semantics, knowledge representation and semantic web at the universities of Paris 4 (Sorbonne) and Paris 10. Her current research interests include ontologies modelling, semantic knowledge bases, linguistic tools and especially the ontology-based information extraction engines, automatic knowledge acquisition and semantic annotation.
Palestrante: Caroline Gasperin
Data: 04/12/2008
Horário: 16h às 17h
Local: Mini-auditório 307 3º andar - FACIN PUCRS
Título: Statistical anaphora resolution in biomedical texts
Abstract: Caroline will present her PhD work on anaphora resolution in biomedical texts. Biomedical literature has been the focus of relevant information extraction projects, and resolving anaphora is an important step in the identification of mentions of biomedical entities about which information could be extracted. She proposes a probabilistic model for the resolution of anaphora in biomedical texts. The model results from a simple decomposition process and independence assumptions applied to a conditional probability that involves several parameters (features). The model seeks to find the antecedents of anaphoric expressions, both coreferent and associative ones, and also to identify discourse-new expressions. Caroline has created a corpus of full-text biomedical articles to train and evaluate the model. The corpus is annotated with anaphoric links between noun phrases referring to the biomedical entities of interest. Such noun phrases are typed according to a scheme that is based on the Sequence Ontology. This corpus is publicly available.
Short bio: Caroline Gasperin has just finished her PhD studies at the University of Cambridge, her thesis focus on anaphora resolution and BioNLP. She has been working in the field of natural language processing since 2000. In 2001 Caroline got a MSc degree from PUC-RS, when she worked on syntax-based lexical acquisition for Portuguese. Her research interests are anaphora resolution, automatic lexical acquisition and corpus annotation. She is particularly interested in statistical methods for NL.
Palestrante: Ariani Di Felippo
Data: 15/08/2008
Horário: 16h
Local: Sala 517 5º andar - FACIN PUCRS
Título: O Alinhamento Léxico-Conceitual e o Desenvolvimento de Recursos Bilíngües para o Processamento Computacional do Português do Brasil
Abstract: O PLN no Brasil, isto é, o processamento computacional do português do Brasil (PB), apesar de apresentar considerável avanço na última década, ainda é carente de recursos lingüísticos, principalmente os recursos léxico-semânticos bilíngües. Com o objetivo de minimizar tal carência, dois recursos em desenvolvimento podem ser destacados. O primeiro deles é a base bilíngüe resultante do alinhamento léxico-conceitual da base da wordnet do PB, a WordNet.Br, e da wordnet do inglês norte-americano, a WordNet de Princeton, e o segundo é a base bilíngüe REBECA, também desenvolvida para o par de línguas português brasileiro/inglês norte-americano. Ambos os recursos têm sido desenvolvidos com base em uma concepção lingüisticamente motivada de PLN e por meio do trabalho colaborativo entre os cientistas da linguagem (lingüistas) e os engenheiros da linguagem (cientistas da computação). Assim, objetiva-se apresentar essas bases bilíngües, destacando principalmente o método de alinhamento ou indexação léxico-conceitual e suas principais vantagens e desvantagens.
Short bio: Ariani concluiu seu doutorado em Lingüística recentemente pela UNESP-Araraquara.
Palestrante: Thiago Pardo
Data: 18/08/2008
Horário: 10:30h
Local: Sala 517 5º andar - FACIN PUCRS
Título: O Alinhamento Léxico-Conceitual e o Desenvolvimento de Recursos Bilíngües para o Processamento Computacional do Português do Brasil
Abstract: Nesta palestra, será apresentado e discutido o tópico Simplificação Textual, que consiste em uma subárea de pesquisa relativamente recente em Processamento de Línguas Naturais. Simplificação Textual é a tarefa de criar uma versão mais simples de um texto para fins e usuários pré-determinados, levando-se em conta questões como escolaridade do público-alvo e presença de deficiências cognitivas, assim como o impacto que a simplificação tem em tarefas posteriores de processamento da língua. Em particular, serão relatados os esforços para a construção de ferramentas de simplificação textual para a língua portuguesa.
Short bio: O professor Thiago Pardo é pesquisador no Instituto de Ciências Matemáticas e de Computação da USP/São Carlos e membro do NILC (Núcleo Interinstitucional de Lingüística Computacional), tem trabalhado com Processamento de Línguas Naturais por aproximadamente 10 anos, com especial interesse em Sumarização, Tradução e Análise Discursiva Automática.
Integração PLN
Data: 09/01/2008
Horário: 14:30h às 15:30h
Local: Sala 517 5º andar - FACIN PUCRS
PUCRS