Centre de Linguistique Théorique et Appliquée

Laboratoire CELTA

Présentation générale

http://celta.paris-sorbonne.fr/


Le CELTA « Centre de Linguistique Théorique et Appliquée » (EA 3553) a été créé en 2002 suite au regroupement de plusieurs équipes de linguistique des langues vivantes ; il réunit 23 enseignants-chercheurs docteurs en linguistique de l’Université Paris-Sorbonne et d’autres universités françaises, entretenant des liens étroits avec des instituts de recherche d’autres pays de l’Union Européenne (les anciens et nouveaux membres) et du monde (Japon, Russie, USA).

Sept directeurs de recherche accueillent et encadrent les travaux d’une vingtaine de jeunes chercheurs inscrits en doctorat à l’Université Paris-Sorbonne, travaillant sur les langues ou familles de langues suivantes : anglais, néerlandais, slaves (croate, serbe, bosniaque, monténégrin, polonais, russe), japonais.

Au CELTA, l’approche interdisciplinaire entre logique, linguistique, sémiotique et théories de l’information prend la forme d’une coopération entre les recherches pointues sur des langues diverses et la formalisation assistée par ordinateur qui se réalise par une adaptation spécifique des outils informatiques à la recherche en linguistique. L’informatique fournit une aide à la conception et à la formalisation des théories linguistiques sur différents domaines en utilisant des outils de découverte (méthodes d'exploration mises au point en intelligence articificielle) sur des bases de données révisables utilisant des paramètres définis par le linguiste lui-même (qui n’a pas besoin que de compétences de base en informatique) et révisables au fur et à mesure que la recherche progresse. L'informatique est ici d'une part un outil heuristique pour le linguiste et d'autre part un moyen de stocker des données sous une forme réutilisable et transmissible.

Mais les approches assistées par ordinateur sont inséparables des approches descriptives : l'érudition et la compétence linguistique des spécialistes de nombreuses langues sont indispensables pour soumettre à la critique les a priori grammaticaux (anciens ou récents) et produire des théories linguistiques dont la cohérence interne et l’adéquation peuvent être vérifiées (validées) par des méthodes formelles.

Le CELTA a été admis en mars 2008 comme membre de l'initiative pan-européenne CLARIN (Common Language Resources and Technology infrastructure) grâce au projet CASK et au logiciel de recherche sémantique assistée par ordinateur SEMANA (accessible sur le site du CELTA après inscription). En utilisant ce logiciel, nous lançons une recherche sur les catégories et la terminologie grammaticales des langues européennes (thème Métalangages). En effet, comme toutes les langues étudiées au CELTA ont une riche tradition de réflexion grammaticale et linguistique, la formalisation doit intégrer cet héritage tout en systématisant les connaissances aussi bien théoriques que terminologiques.

L’étude des formes des langues (de la phonologie à la syntaxe) vise à mettre au jour les processus cognitifs qui sous-tendent la construction des énoncés et des discours. Le but est de construire une théorie linguistique prenant ses racines dans le courant analytique de la linguistique européenne. Les théories formelles de la sémantique associative (AS) et du centrage métainformatif (MIC) élaborées au CELTA modifient de manière cohérente et unifient les deux genres de théories actuellement en vigueur en linguistique: les théories des structures prédicat-arguments (conçues comme modèles des relations sémantiques telles qu’elles sont exprimées dans les langues naturelles, mais souvent avec une certaine confusion entre la sémantique proprement dite et la syntaxe) et les théories de la structure informative de l'énoncé (qui concernent, en fait, la présentation du contenu informatif tel qu’il est transmis dans les énoncés linguistiques mais qui ont le défaut de laisser de côté une part importante des moyens métainformatifs des langues, considérés d'habitude comme de la syntaxe « pure »).

Les théories AS & MIC se fondent sur l’ontologie, mais en distinguant clairement entre une ontologie universelle et la sémantique propre à chaque langue. C’est pourquoi ces théories peuvent servir de base de comparaison et de contraste permettant d’identifier des contenus informatifs et métainformatifs semblables et opposés, exprimés par des formes morpho-syntaxiques variées dans des langues différentes.