Construction et interrogation de la structure informationnelle d'une base documentaire en français [Texte imprimé] / Bernard Jacquemin ; sous la dir. de Benoît Habert, Monographie imprimée
Language: français ; of summary, français ; of summary, anglais ; of contents page, français ; of title page, français.Country: France.Publication : [S.l.] : [s.n.], 2003Description: 276 p. ; 30 cmAbstract: Cette thèse présente une méthode originale pour identifier et structurer l'information de documents et pour l'interroger. Comme les méthodes linguistiques améliorent les résultats des systèmes actuels, cette approche se base sur des analyses linguistiques et des ressources lexicales. Une analyse grammaticale de haut niveau (morphologique, syntaxique et sémantique) identifie d'abord les éléments d'information et les lie entre eux. Les textes sont analysés à cause du faible contexte des requêtes. Puis le contenu des ressources confère aux informations de nombreuses actualisations grâce à des transformations contextuelles~: synonymie simple et complexe, dérivations avec adaptation du contexte syntaxique, adjonction de traits sémantiques... Enfin, l'interrogation des textes a été testée. Une analyse morpho-syntaxique de la question en identifie les éléments d'information et choisit le type de la réponse attendue. Le fragment de texte contenant ces données constitue la réponse à la question.; This thesis presents an original methodology to identify and structure the information of a French textual base in order to question it. Linguistic techniques in current methods makes it possible to improve results. So we propose a methodology using linguistic high-level analysis (morphology, syntax and word sense disambiguation) to identify each piece of information and to connect each of them. The texts are analysed because of the lack of context in queries. Then, the information from lexico-semantic resources is used to transform each piece of information in many realizations: simple and complex synonymy, derivation with adaptation to the syntactic context, addition of semantic features and categories... We finally tested an questioning method using a morpho-syntactic analysis to identify each piece of information in the question and to determine the semantic type of the required answer; the passage of text containing these data is the answer to the question..Bibliography: Bibliogr. p. 241-251.Thesis: .Subject - Topical Name: Recherche documentaire automatisée Thèses et écrits académiques | Langage naturel, Traitement du (informatique) Thèses et écrits académiquesItem type | Home library | Collection | Call number | Status | Date due | Barcode | Item holds |
---|---|---|---|---|---|---|---|
Prêt normal | CeRLA CeRLA | Linguistique | CRTT JACQ (Browse shelf (Opens below)) | Available | 0377702204 |
Publication autorisée par le jury
Bibliogr. p. 241-251
Thèse doctorat Sciences du langage. Linguistique et informatique Paris 3 2003
Cette thèse présente une méthode originale pour identifier et structurer l'information de documents et pour l'interroger. Comme les méthodes linguistiques améliorent les résultats des systèmes actuels, cette approche se base sur des analyses linguistiques et des ressources lexicales. Une analyse grammaticale de haut niveau (morphologique, syntaxique et sémantique) identifie d'abord les éléments d'information et les lie entre eux. Les textes sont analysés à cause du faible contexte des requêtes. Puis le contenu des ressources confère aux informations de nombreuses actualisations grâce à des transformations contextuelles~: synonymie simple et complexe, dérivations avec adaptation du contexte syntaxique, adjonction de traits sémantiques... Enfin, l'interrogation des textes a été testée. Une analyse morpho-syntaxique de la question en identifie les éléments d'information et choisit le type de la réponse attendue. Le fragment de texte contenant ces données constitue la réponse à la question.
This thesis presents an original methodology to identify and structure the information of a French textual base in order to question it. Linguistic techniques in current methods makes it possible to improve results. So we propose a methodology using linguistic high-level analysis (morphology, syntax and word sense disambiguation) to identify each piece of information and to connect each of them. The texts are analysed because of the lack of context in queries. Then, the information from lexico-semantic resources is used to transform each piece of information in many realizations: simple and complex synonymy, derivation with adaptation to the syntactic context, addition of semantic features and categories... We finally tested an questioning method using a morpho-syntactic analysis to identify each piece of information in the question and to determine the semantic type of the required answer; the passage of text containing these data is the answer to the question.