Construction et interrogation de la structure informationnelle d'une base documentaire en français [Texte imprimé] / Bernard Jacquemin ; sous la dir. de Benoît Habert, Monographie imprimée

Main Author: Jacquemin, Bernard, 1974-....Secondary Author: Habert, BenoîtCorporate Author (Secondary): Université de la Sorbonne nouvelle, ParisLanguage: français ; of summary, français ; of summary, anglais ; of contents page, français ; of title page, français.Country: France.Publication : [S.l.] : [s.n.], 2003Description: 276 p. ; 30 cmAbstract: Cette thèse présente une méthode originale pour identifier et structurer l'information de documents et pour l'interroger. Comme les méthodes linguistiques améliorent les résultats des systèmes actuels, cette approche se base sur des analyses linguistiques et des ressources lexicales. Une analyse grammaticale de haut niveau (morphologique, syntaxique et sémantique) identifie d'abord les éléments d'information et les lie entre eux. Les textes sont analysés à cause du faible contexte des requêtes. Puis le contenu des ressources confère aux informations de nombreuses actualisations grâce à des transformations contextuelles~: synonymie simple et complexe, dérivations avec adaptation du contexte syntaxique, adjonction de traits sémantiques... Enfin, l'interrogation des textes a été testée. Une analyse morpho-syntaxique de la question en identifie les éléments d'information et choisit le type de la réponse attendue. Le fragment de texte contenant ces données constitue la réponse à la question.; This thesis presents an original methodology to identify and structure the information of a French textual base in order to question it. Linguistic techniques in current methods makes it possible to improve results. So we propose a methodology using linguistic high-level analysis (morphology, syntax and word sense disambiguation) to identify each piece of information and to connect each of them. The texts are analysed because of the lack of context in queries. Then, the information from lexico-semantic resources is used to transform each piece of information in many realizations: simple and complex synonymy, derivation with adaptation to the syntactic context, addition of semantic features and categories... We finally tested an questioning method using a morpho-syntactic analysis to identify each piece of information in the question and to determine the semantic type of the required answer; the passage of text containing these data is the answer to the question..Bibliography: Bibliogr. p. 241-251.Thesis: .Subject - Topical Name: Recherche documentaire automatisée Thèses et écrits académiques | Langage naturel, Traitement du (informatique) Thèses et écrits académiques
Item type Home library Collection Call number Status Date due Barcode Item holds
Prêt normal CeRLA
CeRLA
Linguistique CRTT JACQ (Browse shelf (Opens below)) Available 0377702204
Total holds:

Publication autorisée par le jury

Bibliogr. p. 241-251

Thèse doctorat Sciences du langage. Linguistique et informatique Paris 3 2003

Cette thèse présente une méthode originale pour identifier et structurer l'information de documents et pour l'interroger. Comme les méthodes linguistiques améliorent les résultats des systèmes actuels, cette approche se base sur des analyses linguistiques et des ressources lexicales. Une analyse grammaticale de haut niveau (morphologique, syntaxique et sémantique) identifie d'abord les éléments d'information et les lie entre eux. Les textes sont analysés à cause du faible contexte des requêtes. Puis le contenu des ressources confère aux informations de nombreuses actualisations grâce à des transformations contextuelles~: synonymie simple et complexe, dérivations avec adaptation du contexte syntaxique, adjonction de traits sémantiques... Enfin, l'interrogation des textes a été testée. Une analyse morpho-syntaxique de la question en identifie les éléments d'information et choisit le type de la réponse attendue. Le fragment de texte contenant ces données constitue la réponse à la question.

This thesis presents an original methodology to identify and structure the information of a French textual base in order to question it. Linguistic techniques in current methods makes it possible to improve results. So we propose a methodology using linguistic high-level analysis (morphology, syntax and word sense disambiguation) to identify each piece of information and to connect each of them. The texts are analysed because of the lack of context in queries. Then, the information from lexico-semantic resources is used to transform each piece of information in many realizations: simple and complex synonymy, derivation with adaptation to the syntactic context, addition of semantic features and categories... We finally tested an questioning method using a morpho-syntactic analysis to identify each piece of information in the question and to determine the semantic type of the required answer; the passage of text containing these data is the answer to the question.

Lyon 2 est membre fondateur de l'Université de Lyon
Université de Lyon

Powered by Koha