Title

Evaluating resource acquisition tools for Information Extraction

Authors

Thierry Poibeau (THALES RESEARCH AND TECHNOLOGY and LIPN, Domaine de Corbeville, 91 404 Orsay, France)

Dominique Dutoit (MEMODATA and CRISCO 17, rue Dumont d’Urville, 14 000 Caen, France)

Sophie Bizouard (CRIM/INALCO 2, rue de Lille, 75007 Paris, France)

Session

EO1: Information Retrieval & Information Extraction Evaluation

Abstract

This paper evaluates two different approaches for the elaboration of semantic classes. The framework is an Information Extraction, which needs large amount of domain-dependent resources. An endogenous approach (corpus-based learning) is contrasted with a heterogeneous one (the use of a large semantic network). The two techniques are evaluated. Cet article vise à évaluer deux approches différentes pour la constitution de classes sémantiques. Nous nous plaçons dans la perspective d’une application d’extraction d’information, pour laquelle la notion de classe sémantique est primordiale. Une approche endogène (acquisition à partir d’un corpus) est contrastée  avec une approche exogène (à travers un réseau sémantique riche). L’article présente une évaluation fine de ces deux techniques et leur complémentarité possible. 

Keywords

Semantic classes, Evaluation, Information extraction, Resources, Semantic network

Full Paper

90.pdf