Recursos e Ferramentas

Nesta página disponibilizamos recursos e ferramentas desenvolvidos pelo nosso laboratório de pesquisa. Uma visão geral dos recursos linguísticos disponíveis relacionados à pesquisa em Extração de Informações e Computação Semântica é apresentada em:

 

Vieira et al. Language resources for information extraction and semantic computing – NLP at PUCRS. Workshop on Corpora and Tools for Processing Corpora, 2016, Tomar, Portugal. p. 17-25. [Paper][Slides]

RECURSOS ONLINE

Reconhecimento de Entidades Nomeadas

Reconhecimento de Entidades Nomeadas para a área de Geologia em textos em Português, denominadas Entidades Geológicas.

Sistema de Reconhecimento de Entidades Nomeadas.

Extração de Relações Abertas entre Entidades Nomeadas

Extração de Relações abertas que ocorrem entre pares de Entidades Nomeadas do domínio de Organizações para o Português.

Resolução de Correferências

Corpora contendo a anotação de correferência para o Português.

CORP para resolução automática de correferências para o Português,  CorrefVisual para visualização e dição de cadeias geradas pelo CORP.

Extração de Termos

Corpora envolvendo os seguintes domínios: Pediatria, Geologia, Modelagem Estocástica, Mineração de Dados e Processamento Paralelo. Lista de conceitos e termos relevantes para cada destes domínios.

Dicionário bilíngue Inglês-Português para domínios específicos  e corpora paralelo.

Identificação de Relações Semânticas entre Pares de Palavras

Lista de 65 pares de palavras traduzidos para o francês e para o português, contendo cada par sua respectiva pontuação.

Extração de Relações Taxonomicas

  • Ferramenta:  HREx

Ferramenta para a extração de relações taxonomicas (i.e., relações “é um tipo de”) entre termos.

Análise de Sentimentos

Recursos:

Léxico de sentimento para a língua portuguesa (OpLexicon).

Reviews em Português de 10 hotéis do TripAdvisor anotados manualmente com a polaridade de cada feature.

Base lexical de palavras de emoções para a língua portuguesa.

Ontologias

Ferramentas:

Ambiente Web para visualizar, manipular e avaliar múltiplos alinhamentos de ontologias.

 

Portal de Ontologias.

Ontologia sobre sistemas multi-agentes para auxiliar na modelagem e programação de software orientado a agentes.

 

Eclipse plug-in para auxiliar a programação em JaCaMo com base em modelos definidos usando OntoMAS

Corpus não anotado

Coleção de 5 milhões de postagens retiradas de blogs na plataforma Blogspot escritas por usuários brasileiros.

Dicionários de Palavras Médicas

Coleção de 64 mil palavras com relação semântica e sintática extraídas de 21 milhões de sentenças médicas.