Section 16 : Projets en cours ; ressources et outils nouveaux

Agresti Giovanni [Université de Teramo], Bernissan Fabrice [Université Paris-Sorbonne].

Projet Tramontana 2012-2013 : recueil et description du discours.

Poster vendredi 19 juillet 15h00-16h00

Tramontana est le seul projet de recherche retenu par l’Union européenne au titre du programme Cultura 2012. Il rassemble sept associations travaillant depuis plusieurs années sur le terrain en lien étroit avec les communautés habitant dans les territoires ruraux et/ou urbains en Italie, au Portugal et en France. L’objectif général de notre projet est de mettre en place des actions concrètes afin de veiller au respect de la diversité et de l’intégrité des territoires, à la sauvegarde de la mémoire et à la promotion de l’identité et des patrimoines immatériels. Il s’agit de préserver la mémoire du paysage et de la communauté et d’utiliser les matériaux collectés comme outils pour l'éducation, la valorisation du sujet et le développement des territoires. Dans cette perspective, le projet Tramontana vise plus spécifiquement à définir et à mettre en place les conditions de la collecte, de la numérisation, de l’organisation et de la diffusion d’une partie importante du patrimoine immatériel des territoires partenaires. Le réseau que nous avons constitué mène actuellement 800 enquêtes de terrain auprès des habitants. Les faits de langue sont au centre de nos préoccupations et figurent parmi les thèmes que nous avons retenus. Nous nous proposons de recueillir des matériaux neufs afin de mieux observer et étudier (i) la narrativité en matière de toponymie (où l’approche diachronique traditionnelle croise de manière systématique l’observation en synchronie du rapport liant le sujet – son vécu et son imaginaire – au nom des lieux) et, (ii) la variation diatopique dans une optique d’intercompréhension dialectale. Nous souhaitons par ailleurs (iii) mettre en évidence les modes de pénétration ainsi que l’aire de diffusion du lexique exogène, notamment pour ce qui est du lexique des outils de la culture matérielle traditionnelle des zones rurales de montagne.
Résumé long
Aguilera Vanderci, Altino Fabiane Cristina [Universidade Estadual de Londrina].

Léxico Histórico do Português Brasileiro: estágio atual

samedi 20 juillet, 10h00-10h30, B 205

O Léxico Histórico do Português Brasileiro – LHisPB está sendo construído a partir do material manuscrito coletado e transcrito (edição semidiplomática) pelas equipes regionais que hoje integram o Projeto Histórico do Português Brasileiro, projeto de pesquisa interinstitucional coordenado pelo professor Dr. Ataliba Teixeira de Castilho. O objetivo do Léxico Histórico do Português Brasileiro é apresentar, sob tratamento lexicográfico, todo o conteúdo lexical dos documentos manuscritos, datados dos séculos XVII a XIX, que foram coletados, transcritos e editados pelas equipes regionais dos estados do Rio de Janeiro, da Bahia, de Minas Gerais, da Paraíba e do Paraná. Como objetivos específicos, propomos: (i) oferecer, sob a forma de banco de dados informatizado, um vasto material lexicográfico para estudos sincrônicos e diacrônicos do léxico registrado em documentos manuscritos durante os três séculos mencionados; (ii) proporcionar um instrumento de consulta rápida do uso de vocábulos vigentes na época e em várias regiões do Brasil Colônia e Brasil Império; (iii) apresentar, com a frequência de uso, os itens lexicais e suas variantes gráficas registrados em cerca de 2500 documentos emanados das então províncias e vilas sediadas nos atuais estados da Bahia, Rio de Janeiro, São Paulo, Paraná, Minas Gerais, Paraíba, Ceará, Pernambuco e Rio Grande do Sul.
Résumé long
Aldea Maria, Leucuţa Daniel-Corneliu, Vremir Lilla-Marta, Cristea Vasilica Eugenia, Podaru Adrian Aurel [Université "Babeş-Bolyai" de Cluj-Napoca].

L’édition informatisée du Lexicon de Buda (1825)

Poster vendredi 19 juillet 15h00-16h00

Le but de notre article est la présentation de notre projet lexicographique développé au sein de l’Université « Babeş-Bolyai » de Cluj-Napoca, financé par l’Autorité Nationale Roumaine pour la Recherche Scientifique, CNCS-UEFISCDI, et intitulé Lexiconul de la Buda (1825). Ediţie emendată şi prelucrată electronic pentru consultare on-line (PN-II-RU-TE-2011-3-0170). Dans notre article nous allons mettre en évidence les défis d’ordre linguistique et informatique de l’édition informatisée d’une œuvre lexicographique d’exception de l’Ecole Latiniste de Transylvanie, le Lexicon de Buda (1825).
Résumé long
Andronache Marta [ATILF (CNRS et Université de Lorraine)].

Les étapes dans le travail rédactionnel du DÉRom

mardi 16 juillet, 14h00-14h30, B 205

Le Dictionnaire Étymologique Roman (DÉRom), entreprise lexicologique franco-allemande lancée lors du CILPR 2010 à Innsbruck (Buchi \& Schweickard 2009 et 2010), mobilise aujourd’hui une importante communauté de romanistes : plus d’une cinquantaine de linguistes originaires de douze pays européens et qui représentent tous les domaines linguistiques de la Romania. Devant la diversité des collaborateurs, un des grands soucis des directeurs du dictionnaire est de donner des règles de rédaction qui assurent une cohérence interne propre à tous les articles du dictionnaire. Le but de notre communication est de présenter les étapes de rédaction d’un article du DÉRom, dont la rédaction à proprement parler est complètement informatisée : 1. travaux préparatoires ; 2. rédaction de la bibliographie ; 3. rédaction des matériaux ; 4. rédaction du commentaire ; 5. révision par domaines géographiques ; 6. révision générale ; 7. révision finale) et de les illustrer par un exemple concret, l’article */ti'tion e/ (http://www.atilf.fr/DERom). Les objectifs stratégiques de cette communication sont au nombre de trois: (1) dans l’immédiat, faire découvrir la méthode de travail du DÉRom aux romanistes intéressés ; (2) dans une perspective à court terme, former la base d’un module d’enseignement pour la deuxième École d’été franco-allemande en étymologie romane, qui aura lieu en juillet 2014 à l’ATILF ; (3) dans une perspective à long terme, donner une idée aux futures générations de lexicologues et d’étymologistes de la manière de travailler au début du XXIe siècle.
Résumé long
Antonelli Roberto [“Sapienza” Università di Roma].

Il Lessico europeo dell'affettività e il metamotore della lirica romanza medievale

mardi 16 juillet, 16h30-17h00, B 205

Sarà illustrato il progetto di ricerca tuttora in corso nelle università di Roma “Sapienza”, Cosenza, Siena per la realizzazione di un lessico unitario dei termini attinenti alla sfera dell’affettività presenti nella lirica romanza medievale. Il progetto ha già realizzato le concordanze di tutta la lirica romanza medievale (italiana, francese, provenzale, galego-portoghese), inserendole in un “metamotore” dal quale è possibile consultare contemporaneamente lemmi e campi semantici delle emozioni. Se ne presenteranno gli ulteriori sviluppi e le ricerche finora realizzate a partire dalle concordanze e dal metamotore già realizzato.
Résumé long
Araújo Sílvia, Sacadura Sílvia, Correia Ana [Université du Minho, Portugal].

Le corpus Per-Fide et ses applications: une étude de cas sur les expressions idiomatiques

mercredi 17 juillet, 10h30-11h00, B 205

Le projet Per-Fide vise la compilation d’un corpus parallèle multilingue entre le portugais et six autres langues avec des textes appartenant à différents domaines. Après une brève présentation de ce corpus multilingue qui met en valeur ce qui le distingue d’autres corpus, nous tâcherons de montrer son utilité dans l’étude du langage et de la traduction sur la base d’un exemple concret, celui des expressions idiomatiques dans une perspective contrastive français/portugais/anglais. L’intégration des corpus et des outils d’analyse de corpus dans l’enseignement de la traduction (outre celui de la linguistique et des langues) se révèle essentielle car le recours à ce type de ressources améliore la qualité des traductions par rapport à la seule utilisation de dictionnaires, notamment au niveau du choix des termes et de l’utilisation d’expressions idiomatiques.
Résumé long
Aresti Alessandro [Sapienza Università di Roma].

Presentazione del Tesoro dei Lessici degli Antichi Volgari Italiani (TLAVI)

mardi 16 juillet, 17h00-17h30, B 205

L’intervento intende illustrare i risultati del lavoro di allestimento del "Glossario dei glossari degli antichi volgari italiani", un repertorio onomasiologico di volgarismi estratti da varie raccolte lessicali di epoca medievale e umanistica. Del nostro "Glossario" esiste una versione cartacea e una elettronica. Per quanto riguarda la versione elettronica, è stato realizzato uno strumento informatico per l’interrogazione del corpus lessicale; è in corso di realizzazione un sito web di presentazione al progetto in cui verrà messo a disposizione degli studiosi lo strumento informatico.
Résumé long
Barbieri Beatrice [Université de Göttingen], Morend Jaquet Gaëlle [Université de Genève], Halgrain Mohan [Université de Neuchâtel].

Présentation du projet : Lire en contexte à l’époque prémoderne. Enquête sur les manuscrits de fabliaux

mercredi 17 juillet, 14h30-15h00, B 205

Le projet Lire en contexte à l’époque prémoderne. Enquête sur les manuscrits de fabliaux se propose d'étudier le corpus des manuscrits de langue française contenant un ou des fabliaux: 43 recueils de nature, origine et époque très différentes. À partir de l'étude matérielle de ces manuscrits, on envisage de mieux comprendre leur typologie et leurs critères d'agencement et, dans le même temps, de jeter une nouvelle lumière sur les fabliaux, en les étudiant dans leur contexte de lecture originel. Le projet, mené par une équipe internationale, aboutira à la constitution d'une grande base de données contenant les descriptions codicologiques des manuscrits ainsi qu’à la rédaction d’études de nature monographique.
Résumé long
Bazin-Tacchella Sylvie, Souvay Gilles [ATILF (CNRS et Université de Lorraine)].

Avec la version 2012, la fin d’un projet ou de nouveaux défis pour le DMF ?

mardi 16 juillet, 14h30-15h00, B 205

Après avoir évoqué les nouveautés de la version 2012 touchant le Dictionnaire du Moyen Français (1330-1500), nous aimerions montrer qu’en rendant visible sur le site, dans un nouveau menu "Compléments au DMF", les différents projets d’enrichissement en cours, les utilisateurs intéressés peuvent être appelés à participer activement à cet enrichissement. Le développement de "l'outil glossaire" a entraîné de multiples collaborations, qui ont permis d’améliorer l’outil, en l'adaptant aux besoins des divers utilisateurs. Tout particulièrement la lemmatisation des textes et leur adossement au Dictionnaire et à ses différentes Bases contribue à son élargissement et au développement des outils eux-mêmes.
Résumé long
Bernissan Fabrice [Paris-Sorbonne], Agresti Giovanni [Teramo].

Projet Tramontana 2012-2013 : recueil et description du discours

Poster vendredi 19 juillet 15h00-16h00

Nous nous proposons de recueillir au sein du projet Tramontana (France-Italie-Portugal)des matériaux neufs afin de mieux observer et étudier (i) la narrativité en matière de toponymie (où l’approche diachronique traditionnelle croise de manière systématique l’observation en synchronie du rapport liant le sujet – son vécu et son imaginaire – au nom des lieux) et, (ii) la variation diatopique dans une optique d’intercompréhension dialectale. Nous souhaitons par ailleurs (iii) mettre en évidence les modes de pénétration ainsi que l’aire de diffusion du lexique exogène, notamment pour ce qui est du lexique des outils de la culture matérielle traditionnelle des zones rurales de montagne. L'objet de ce poster sera de communiquer sur les premiers résultats obtenus auprès des habitants des territoires d'enquêtes.
Résumé long
Buendía-Castro Miriam, León-Aráuz Pilar, Sánchez-Cárdenas Beatriz [Universidad de Granada].

Categorías semánticas para describir estructuras argumentales en un ámbito de especialidad

Poster vendredi 19 juillet 15h00-16h00

Los estudios sobre tipologías nominales de sustantivos no abundan en las lenguas de especialidad. Esto resulta sorprendente si tenemos en cuenta el poder descriptivo que una tipología nominal de clases semánticas puede tener en un ámbito de especialidad, donde existe una mayor restricción del significado de las unidades lingüísticas y de sus combinaciones léxicas. En este artículo exponemos, por un parte, los primeros pasos de una tipología nominal en el ámbito de especialidad del medio ambiente y en el subdominio de los desastres naturales. Por otro lado, desarrollamos la hipótesis según la cuál si los términos que aparecen en los argumentos de los verbos de un ámbito de especialidad se clasifican y describen según los roles semánticos que suelen ocupar – según un estudio de corpus– es posible predecir los verbos asociados con una estructura argumental dada. Esta idea cobra especial interés en el ámbito de la traducción, ya que estas predicciones tienen un alcance interlingüístico.
Résumé long
Chabrolle-Cerretini Anne-Marie [ATILF (Université de Lorraine)].

Vers une nouvelle histoire de la linguistique romane: le projet d'un Dictionnaire HIstorique des COncepts Descriptifs de l'Entité Romane

Poster vendredi 19 juillet 15h00-16h00

D.HI.CO.D.E.R. est un travail en histoire de la linguistique romane qui s'est donné pour objectif de recenser les concepts qui ont permis de décrire l'entité romane et de constituer la linguistique romane depuis le XIXe siècle jusqu'à aujourd'hui. Les parties du dictionnaire sont celles de l'histoire de la linguistique romane revisitée à partir des concepts théoriques et méthodologiques attestés et présentés dans leurs contextes historiques et textuels. Toutes les aires linguistiques romanes sont objet de l'étude.
Résumé long
Clim Marius-Radu, Tamba Elena, Catană-Spenchiu Ana, Pătraşcu Mădălin [L'Académie Roumaine, Filiale d'Iasi, Département de Lexicologie – Lexicographie de l'Institut de Philologie Roumaine «A. Philippide»].

CLRE. Corpus lexicographique roumain essentiel. 100 dictionnaires de la langue roumaine alignés au niveau de l’entrée et, partiellement, au niveau du sens

mardi 16 juillet, 09h30-10h00, B 205

Ce travail porte sur l'accomplissement d'un projet qui s'est proposé de réaliser un corpus lexicographique qui inclut eDTLR (la version informatisée du Dictionnaire «Trésor» de la Langue Roumaine) et les autres dictionnaires essentiels de la langue roumaine (dictionnaires anciens et nouveaux, dictionnaires généraux ou «spéciaux», etc.), alignés au niveau de l’entrée et, partiellement, au niveau du sens. Ce projet s'inscrit dans toute une série de projets interdisciplinaires de recherche linguistique, ayant pour but, d’une part, de valoriser les ressources existantes par leur acquisition en format électronique et, d’autre part, la création de nouvelles ressources et de nouveaux instruments pour l’étude de la langue (des dictionnaires informatisés, des corpus de textes écrits / parlés). Le corpus lexicographique roumain essentiel facilitera l'accès des spécialistes de Roumanie et de tous les romanistes à un instrument de travail indispensable pour les études comparatives.
Résumé long
Corradini Maria Sofia [Università di Pisa].

La realizzazione del « Dictionnaire de Termes Médico-botaniques de L’Ancien Occitan » (DiTMAO): problemi di organizzazione della conoscenza medico-farmaceutica attestata nei manoscritti occitani medievali. Esempi di ambito anatomico e patologico

mardi 16 juillet, 17h30-18h00, B 205

Come ho illustrato nei precedenti convegni CILPR in collaborazione con il collega Guido Mensching della Freie Universitaet di Berlino, al lavoro di carattere critico-editoriale delle fonti manoscritte in occitano medievale che trattano argomenti medico-farmaceutico si è di recente affiancata un'attività che, mediante un'opportuna organizzazione dei dati, ne arricchisce le modalità di interrogazione. Se, infatti, il lemma mantiene il consueto ruolo per consultare l'archivio testuale, si aggiunge, come ulteriore chiave di accesso, anche il valore semantico, opportunamente strutturato. Nel presente contributo si mostreranno entrambi questi approcci.
Résumé long
Diego Hernández Elena [Universidad de Salamanca (Espagne)].

Estudio lexicográfico para el tratamiento automático de la lengua: diccionario bilingüe francés-español de los sustantivos predicativos de las <ayudas económicas>.

vendredi 19 juillet, 14h30-15h00, B 205

El tratamiento automático de las lenguas naturales necesita un trabajo lexicográfico adaptado a las especificidades del autómata. Para que estos sean capaces de interpretar textos en la lengua de origen y generarlos en la lengua de destino, hay que proporcionarles una descripción sistemática y exhaustiva de las características morfológicas, sintácticas y semánticas de cada unidad léxica. Este es el tipo de trabajo que proponemos. Hemos elaborado un estudio sintáctico-semántico de los sustantivos predicativos de las <ayudas económicas> (beca, subsidio, patrocinio...) en francés y en español, presentado bajo la forma de dos diccionarios electrónicos monolingües coordinados.
Résumé long
Dotto Diego, Lorenzi Cristiano [Opera del Vocabolario Italiano, CNR; Scuola Normale Superiore, Pisa].

Il DiVo (Dizionario dei Volgarizzamenti). Nuovi strumenti per lo studio delle traduzioni dal latino nell'italiano delle origini

vendredi 19 juillet, 09h00-09h30, B 205

Si presenta il progetto DiVo (Dizionario dei volgarizzamenti), attualmente in corso presso l’Istituto Opera del Vocabolario Italiano (CNR Firenze) e la Scuola Normale Superiore di Pisa. Esso propone uno studio complessivo del "lessico di traduzione" medievale e comprende tutti i volgarizzamenti di testi classici e tardo-antichi eseguiti entro la fine del Trecento. Il DiVo si articola in tre punti: - compilazione di una bibliografia filologica secondo il modello TLIon; - costituzione di un corpus bilingue lemmatizzato; - studio lessicale.
Résumé long
Dugas Edwige [Université Charles de Gaulle - Lille 3].

Détection, extraction automatique et analyse des lexèmes construits par la préfixation en non- en français

Poster vendredi 19 juillet 15h00-16h00

Ce poster présente un travail en cours qui vise à mettre à contribution linguistique théorique et Traitement Automatique des Langues (TAL), dans le cadre d’une thèse consacrée à l’étude synchronique et diachronique du préfixe de négation non- et sa relation aux autres préfixes composant le paradigme de la préfixation négative : a-, anti-, contre-, dé(s)-, dis-, in-, mal-, mé(s)-, non-. J’expose ici la méthodologie employée pour comparer les lexèmes construits sur base nominale et adjectivale à l’aide de non- (p.ex. NON VIOLENCE, NON VOYANT, NON REMBOURSABLE) attestés dans le Trésor de la Langue Française informatisé (TLFi), et les formes attestées en corpus ouvert (les pages indexées par le moteur de recherche GoogleTM). L’hypothèse sous-jacente est que les dictionnaires ne reflètent que très partiellement l’état actuel du français (cf. Dal et Namer 2012). Mon objectif est, à terme, de créer un outil d’extraction automatique des mots construits à l’aide du préfixe non- et à ceux construits avec les autres préfixes de négation.
Résumé long
Gaiffe Bertrand, Stumpf Béatrice [ATILF (CNRS et Université de Lorraine)].

Une édition au format TEI de la première traduction française de La Cité de Dieu

mardi 16 juillet, 15h00-15h30, B 205

L'édition de La Cité de Dieu traduite par Raoul de Presle de 1371 à 1375 sera publiée sous une forme papier classique. Pour autant, le projet ERC responsable de cette édition a fait le choix d'un encodage en TEI, c'est à dire d'un encodage abstrait de la forme papier visée, nécessitant de ce fait le développement d'outils destinés à produire la forme imprimable. Nous justifions ce choix en montrant : 1) que l'encodage, par les contraintes qu'il impose améliore la qualité de l'édition produite ; 2) que cet encodage permet l'emploi d'outils d'aide à l'édition tels que LGeRM (mis au point pour le DMF) ; 3) que la forme visée, pour autant qu'on soit un peu exigeant, ne pourrait pas être éditée directement.
Résumé long
Gala Nuria [Aix Marseille Université], Barbu Mititelu Verginica [Romanian Academy Research Institute for Artificial Intelligence].

LexROM : un réseau lexical pour des familles de mots dans des langues romanes

lundi 15 juillet, 15h30-16h00, B 205

Dans cette communication, nous présenterons une ressource -en cours de construction- fondée sur la notion de famille de mots interlangue. La structuration du lexique des langues sous forme de familles nous a semblé une propriété intéressante à explorer d'un point de vue multilingue dans le cadre de quelques langues romanes (à ce stade, français, roumain, catalan et espagnol). Ainsi, notre objectif à terme est de proposer un réseau lexical offrant des possibilités de recherche élargies (morphologie, sémantique, etc.) pour différentes langues romanes. Exploiter les ressemblances formelles au niveau interlangue présente un intérêt aussi bien dans des applications humaines -études contrastives, apprentissage du vocabulaire ou aide à l'écriture dans une langue étrangère- qu'en traitement automatique des langues. Enfin, le développement et l'enrichissement d'un réseau multilingue soulève de nombreuses questions scientifiques et méthodologiques auxquelles nous apporterons des nouveaux éléments de réponse dans le cadre de notre communication.
Résumé long
Galves Charlotte [Université de Campinas, Brésil].

Construction et exploitation d'un grand corpus historique annoté du portugais: Le Corpus Tycho Brahe

mardi 16 juillet, 10h00-10h30, B 205

Je présenterai le Corpus annoté du portugais historique Tycho Brahe, librement accessible sur la toile mondiale, construit sur le modèle des Penn Corpora of Historical English dirigés par Anthony Kroch et ses collaborateurs. Le schéma d’annotation syntaxique de ces corpus s’inspire de la théorie de la grammaire générative. Les représentations suivent une version simplifiée de la théorie X-barre et contiennent des éléments abstraits comme catégories vides et indices référentiels. La philosophie de ce genre de Corpus, qui consiste à mettre à disposition des chercheurs les textes dans leur intégralité, permet également de travailler de façon très productive sur la relation syntaxe/texte, notamment la relation entre les phénomènes d’ordre et l’organisation de l’information, domaine très actif de recherche actuellement.
Résumé long
Giannini Gabriele [Université de Montréal].

Les "petits" recueils : présence, composition, perspectives

mercredi 17 juillet, 15h00-15h30, B 205

Dans le cadre du projet international "Lire les fabliaux en contexte", nous nous sommes aperçus rapidement que les manuscrits, complets ou fragmentaires, contenant à présent un ou quelques fabliaux sont parmi les plus négligés, tant par les éditeurs que par ceux qui s'intéressent aux différents aspects de la transmission du genre. On a, et on exploite, une image partielle, voire biaisée de la composition de ces témoins, ainsi que de leur structure d’origine et du réseau au centre duquel ils ont évolué. En passant en revue une demi-douzaine de cas éclairants, seront mis au jour, d'un côté, les dangers que cette méconnaissance engendre et, d'un autre côté, les perspectives de recherche qu'un travail de fond renouvelé ouvre.
Résumé long
Glessgen Martin-Dietrich [Zürich], Tittel Sabine [Heidelberg].

Bases de données textuelles et lexicographie historique: comment réunir les Plus anciens documents linguistiques de la France et le DEAF?

mercredi 17 juillet, 14h00-14h30, B 205

Le projet présent réunit deux entreprises lexicologiques et philologiques de longue haleine: le Dictionnaire Etymologique de l'Ancien français (DEAF), rédigé depuis quatre décennies à Heidelberg, et les Plus anciens documents linguistiques de la France (DocLing), poursuivis également depuis les années 1970. Dans les deux cas, les années 2000 ont donné lieu à une informatisation systématique qui permet un rapprochement réciproque. En synthèse, notre idée est d'intégrer les données lexicales des DocLing dans les nouveaux ‘articles courts’ du DEAF. Cela permettra de renforcer la part des sources documentaires dans le DEAF, mais aussi de créer une interface entre ce dictionnaire et une base textuelle de référence. En même temps, le vocabulaire des DocLing serait placé dans le cadre naturel de l'ancienne langue française par une harmonisation des lemmes.
Résumé long
González Orellana Karen [ATILF (CNRS et Université de Lorraine)].

Ailleurs et partout : statut et traitement de leurs équivalents lexicographiques dans le Réseau Lexical de l'Espagnol

lundi 15 juillet, 15h00-15h30, B 205

Nous aborderons la problématique des équivalents lexicographiques non isomorphes à travers l'analyse de deux adverbes du français et de leurs équivalents en espagnol : ailleurs et partout. Cette étude est menée dans le contexte du développement d'une base de données lexicale relationnelle, le Réseau Lexical de l'Espagnol (RLE), fondée sur les principes et la méthodologie postulés par la Lexicologie Explicative et Combinatoire. Nous réaliserons un état des lieux concernant le statut des équivalents espagnols des adverbes en question dans des ouvrages lexicographiques monolingues et bilingues de référence. De même, nous présenterons une proposition pour le traitement de ces équivalents, en vue de leur inclusion dans des bases de données relationnelles coordonnées.
Résumé long
Iacobini Claudio, Voghera Miriam, Cutugno Francesco, Iacobini Claudio, Savy Renata [Università di Salerno].

Il VoLIP: una risorsa per lo studio della variazione nel parlato della lingua italiana

samedi 20 juillet, 10h30-11h00, B 205

Il VoLIP (Voce del LIP) è una risorsa linguistica liberamente disponibile sul portale www.parlaritaliano.it, realizzata presso l’università di Salerno. Il VoLIP permette di ascoltare e scaricare i segnali audio da cui sono tratte le trascrizioni del Corpus LIP, e permette la ricerca nel corpus sia secondo criteri sociolinguistici sia secondo criteri lessicali e morfo-sintattici. Il Corpus LIP (500.000 parole, 60 ore di registrazione), raccolto nei primi anni ’90, rispetta criteri di variazione diafasici, diatopici e diamesici (T. De Mauro, F. Mancini, M., Vedovelli, M. Voghera, Lessico di frequenza dell’italiano parlato, Milano, Etaslibri, 1993), ed è a tutt’oggi il corpus di Italiano parlato spontaneo più ampio. Nel VoLIP l’audio del corpus è correlato con metadati testuali e sociolinguistici in formato IMDI, e la trascrizione ortografica è integrata con la lemmatizzazione. Il VoLIP permette due strategie di interrogazione eventualmente incrociate: i) per variabili di testo e di registro, in base ad una annotazione in metadati più articolata rispetto al LIP; ii) per criteri lessicali e morfosintattici, in base al lessico (distinto in tipi e forme) e all’analisi in parti del discorso. L’interrogazione restituisce porzioni di audio allineate al relativo testo.
Résumé long
Iriarte Sanromán Álvaro, Soares Ana Paula, Simões Alberto, Almeida José João, Comesaña Montserrat, Costa Ana, Machado João, França Patrícia [Universidade do Minho, Braga, Portugal].

Procura-PALavras (P-PAL): Uma aplicação web para uma base de dados lexical do português europeu

mercredi 17 juillet, 10h00-10h30, B 205

O Procura-PALavras (P-PAL) é uma aplicação web que permite a obtenção de uma grande diversidade de métricas lexicais e sublexicais extraídas de um corpus com mais de 227 milhões de palavras do português europeu contemporâneo. O P-PAL pretende ser um instrumento de âmbito multidisciplinar, incluindo outros índices não contemplados em ferramentas congéneres bem como uma dupla possibilidade de utilização: (i) obter palavras que obedeçam a determinados requisitos; ou (ii) analisar palavras num conjunto requisitos. Nesta comunicação, faremos uma breve descrição da nossa aplicação, aberta e disponível em http://p-pal.di.uminho.pt/tools.
Résumé long
Kraif Olivier, Diwersy Sascha [Université Stendhal Grenoble 3].

Extraction automatique et préparation lexicographique d'unités polylexicales étendues

mercredi 17 juillet, 09h00-09h30, B 205

Nous présentons une méthode permettant l'extraction automatique des unités polylexicales caractérisant le profil collocationnel d'un pivot donné. A partir d'un corpus de textes journalistiques et littéraires d'environ 120 millions de mots, analysés syntaxiquement grâce au parseur Connexor, nous montrons comment constituer un réseau d'expressions hiérarchisées autour d'un pivot occupant une fonction syntaxique déterminé. Les unités extraites sont ensuite présentées de manière à faciliter leur exploitation lexicographique : affichage de l'arbre syntaxique, contextes d'occurrence, regroupement des expressions en fonction de leur réalisations morphosyntaxiques et indication du paradigme étendu auquel appartient le pivot dans le contexte de ses collocations. Nous chercherons enfin à relier ces extractions automatiques avec les codages syntaxiques et sémantiques du champ lexical des émotions réalisés par nos collègues du projet Emolex.
Résumé long
Kunstmann Pierre [Université d'Ottawa], Souvay Gilles [ATILF (CNRS et Université de Lorraine)].

Dictionnaire Électronique de Chrétien de Troyes (DÉCT) : fin et suite...

mardi 16 juillet, 15h30-16h00, B 205

Après neuf ans de travail l'oeuvre sera achevée pour l'été 2013 (DÉCT1), de la lettre A (aaisement) à la lettre Y (Ysoré) ; cette première base sera élargie dans les prochaines années pour constituer le DÉCT2. Le DÉCT1 se limite à la définition des mots dans la copie du scribe. L'achèvement de cette phase permet la multiplication des renvois d'un article à l'autre et l'introduction de fonctions nouvelles (essentiellement des données statistiques portant sur l'ensemble). Il sera fait durant cette présentation une démonstration des principales fonctionnalités du DÉCT1 terminé. Le DÉCT2 se caractérisera par l'ajout des mots grammaticaux, des variantes des autres manuscrits, et des axes de synonymie et d'antonymie. Ce dictionnaire est un ouvrage en progression que nous voulons garder ouvert même après l'achèvement de ce second volet.
Résumé long
Luzzi Damiana [Fondazione Rinascimento Digitale].

Un’ontologia per il DiTMAO (Dictionnaire de Termes Médico-botaniques de l’Ancien Occitan)

mardi 16 juillet, 18h00-18h30, B 205

Il Progetto DiTMAO ha fra gli obiettivi quello di organizzare e rendere accessibili sul Web i testi relativi all’antica terminologia medico-farmaceutica in occitano per la redazione di un dizionario terminologico. Le voci entrano in un duplice sistema di classificazione logico-semantica: quello aderente al periodo medievale ove furono usate e quello coerente all’uso attuale. Per raggiungere tali scopi si adoperano le tecnologie del Semantic Web (ontologie) e una suite di applicazioni software di ultima generazione dedicata al trattamento di testi, immagini e lessici (Reperio). In questo contributo, si prende in esame la metodologia che ha portato alla scelta dell’ontologia, intesa in senso informatico e la descrizione dell’ontologia risultante. Rispetto alla consultazione di concordanze lemmatizzate di impianto tradizionale, la classificazione utilizzata apporta notevoli benefici: maggiore precisione, accuratezza, ricchezza di informazioni e recall nelle operazioni di IR/IE necessarie agli studi linguistici e filologici relativi alla terminologia attestata dal corpus.
Résumé long
Magri-Mourgues Véronique [Université de Nice].

Statistiques et motifs séquentiels. Le cas des suites Nom Préposition Nom, mot à mot, pétale par pétale

vendredi 19 juillet, 14h00-14h30, B 205

La communication se propose d’évaluer l’outil statistique pour identifier et analyser les suites Nom préposition Nom, avec pour critère restrictif que les deux substantifs sont identiques. L’enjeu essentiel de cette recherche est de montrer que ce type de structures peut être utilisé à des fins de classifications. La base qui sert de corpus exploratoire à cette recherche est constituée par un extrait de Frantext catégorisé : il comprend quatre groupes génériques répertoriés dans Frantext : d’une part deux ensembles narratifs, le roman et les mémoires, d’autre part la poésie et le théâtre afin que les genres principaux soient tous représentés. Le repérage des unités NpN permet une réflexion sur le statut de la préposition, à la fois sur le plan lexical et sémantique, et permet de réfléchir au partage entre structures figées et innovations lexicales, entre langue et discours. Ces unités peuvent être proposées comme indices d’un style d’auteur ou même comme marqueur générique.
Résumé long
Manea Lucia, Montémont Véronique [ATILF (Université de Lorraine)].

L’évolution de Frantext : quelles modifications et quels usages pour Frantext 2 ?

Poster vendredi 19 juillet 15h00-16h00

Le poster sera structuré autour de Frantext, base de données textuelles développée à l’ATILF. Tout d’abord, nous exposerons l’historique de Frantext et son fonctionnement, pour pointer ensuite les transformations envisagées de la base, dont le but est la création d’un outil plus performant. Les objectifs visent notamment à l’enrichissement des corpus et à l’amélioration des procédés d’interrogation. Frantext 2 sera une base de données équipée d’un moteur de recherche perfectionné, assortie d’un portail bibliographique dans lequel les œuvres seront équipées de métadonnées, et qui autorisera des enquêtes sur de grands corpus échantillonnés et proposera l’implémentation d’outils statistiques. Permettant de faire des interrogations sur les états anciens de langue, facilitant la conservation, la valorisation et la connaissance d’un état de la langue, l’étude des genres du discours ou des genres littéraires, Frantext 2 sera exploitable en linguistique et en littérature mais ouvrira également vers d’autres domaines.
Résumé long
Maître Raphaël [Université de Neuchâtel (Suisse)].

Dictionnaire du patois de Bagnes: un projet – une base

vendredi 19 juillet, 10h30-11h00, B 205

Le but de la communication est de présenter le projet «Dictionnaire du patois de Bagnes (Valais)», et tout spécialement sa base de données, qui sert notamment d'outil de rédaction. Le patois de Bagnes, dialecte francoprovençal des Alpes suisses, est documenté par 50'000 fiches manuscrites au fichier central du Glossaire des patois de la Suisse romande. Sur la base de ces matériaux est élaboré un dictionnaire, qui, par ailleurs, rattache chaque mot bagnard à ses correspondants romands par un renvoi au Glossaire, et galloromans par un renvoi au FEW. Une base de données FileMaker est le principal outil de gestion et de transformation du corpus. Sa mission est de prêter assistance aux lexicographes dans l'accomplissement intuitif de leurs tâches. Elle recherche, présente, ordonne ou regroupe les matériaux selon les besoins, affiche des synopsis, sert à rédiger, vérifie la rédaction, et exporte les articles.
Résumé long
Medori Stella [CESIT Corsica].

Une base de données au service de la toponymie Corse (CESIT Corsica)

Poster vendredi 19 juillet 15h00-16h00

Le poster présentera la base de données du CESIT Corsica dédiée à la toponymie de la Corse.
Résumé long
Nádvorníková Olga [Université Charles, Prague].

InterCorp - projet de corpus parallèle

mardi 16 juillet, 10h30-11h00, B 205

La communication présente le corpus parallèle InterCorp, créé par l’Institut du Corpus National Tchèque (www.korpus.cz/intercorp). Composé des originaux et de leurs traductions respectives en 27 langues (y compris le français, le portugais, l’italien et l’espagnol), InterCorp contient actuellement plus de 90 millions de mots dans la section littéraire, et plus que 450 millions de mots dans les sections juridique (Acquis communautaire) et journalistique (Presseurop et SYNDICATE). Grâce aux possibilités de requête avancées, le corpus sert depuis plusieurs années à des recherches contrastives ainsi qu’au large public de traducteurs, enseignants et étudiants. Toutefois, l’utilisation systématique d’InterCorp soulève d’importantes questions méthodologiques concernant non seulement ses limites de taille, mais en particulier les spécificités de la langue de traduction.
Résumé long
Pesini Luca [Scuola Normale Superiore, Pisa], Del Grosso Angelo Mario, Bozzi Andrea [Istituto di Linguistica Computazionale « A. Zampolli » del CNR, Pisa].

F. de Saussure e la linguistica romanza. Un’applicazione web per l’edizione elettronica dei manoscritti

lundi 15 juillet, 14h00-14h30, B 205

Se il ruolo di F. de Saussure nella linguistica indoeuropea e nella linguistica generale è ben noto, il suo interesse nell’ambito della linguistica romanza è stato quasi del tutto trascurato dagli studiosi. Fino ad oggi è stato difficile valutare il contributo di Saussure alla romanistica, dato che i suoi lavori (riguardanti soprattutto i patois francesi e la toponomastica) restano in gran parte inediti.Soltanto nel quadro di una nuova edizione critica digitale di tutte le opere di Saussure sarà possibile apprezzare il suo profondo interesse per la filologia romanza e far luce sul ruolo che lo studio dell’evoluzione delle lingue neolatine ebbe nella riflessione generale di questo linguista, sia comparatista che romanista.
Résumé long
Piccini Silvia, Giovannetti Emiliano, Ruimy Nilda [Istituto di Linguistica Computazionale 'Antonio Zampolli' - Consiglio Nazionale delle Ricerche -Pise].

Le lexique électronique de la terminologie de Ferdinand de Saussure : une première

Poster vendredi 19 juillet 15h00-16h00

Le Projet italien intitulé « Per un'edizione digitale dei manoscritti di Ferdinand de Saussure » a pour objectif la création d’un prototype d’édition numérique des textes du grand linguiste genevois, réalisé à partir d’une sélection de ses documents autographes. Dans ce projet, l’un des volets novateurs est la création du premier thésaurus-lexique électronique de la terminologie linguistique saussurienne. Afin de réaliser cette base de connaissance, nous nous sommes inspirés du modèle lexical SIMPLE qui a permis le développement de vastes lexiques sémantiques informatisés, et l’avons adapté aux exigences de notre domaine de la connaissance. Le lexique réalisé a été conçu dans le but d’offrir un outil performant pour les études saussuriennes. Il fournit en effet une représentation structurée de la terminologie de Saussure, une définition du contenu sémantique de chacun des termes ainsi qu’un cadre explicite de la nature et de l’importance des liens qui les unissent. Ce faisceau d’informations devrait donc contribuer de manière significative à mieux maîtriser le vocabulaire saussurien et, partant, à éclairer certains aspects originaux de la pensée du père de la linguistique moderne.
Résumé long
Polguère Alain [ATILF (CNRS et Université de Lorraine)].

Tissage du Réseau Lexical du Français (RLF) : buts et méthodes

lundi 15 juillet, 14h30-15h00, B 205

Le projet RELIEF a débuté au laboratoire ATILF de Nancy au printemps 2011. Sa finalité première est l’élaboration d’un nouveau type de ressource lexicographique pour le français contemporain : le Réseau Lexical du Français ou RLF. Le projet RELIEF peut être vu comme une phase initiale de trois ans d’un programme conçu sur le long terme, qui vise l’élaboration de nouveaux modèles lexicographiques, distincts des dictionnaires traditionnels : ils sont non textuels et possèdent une structure de graphes ; ils englobent le contenu informationnel des dictionnaires traditionnels ; ils sont « calculables ». Dans notre présentation, nous nous focaliserons sur (i) le positionnement du travail sur le RLF dans le contexte de la lexicographie contemporaine et du développement de ressources lexicales informatisées du type graphe, (ii) les caractéristiques formelles et la couverture du RLF et (iii) la méthodologie de construction de la ressource.
Résumé long
Posmyk Olaf [Georg-August-Universität Göttingen].

Le recueil Paris, BnF, fr. 24432 et ses copistes

mercredi 17 juillet, 15h30-16h00, B 205

Le manuscrit BnF fr. 24432, est un recueil imposant qui renferme un grand nombre de dits, un seul fabliau, des chansons pieuses et des œuvres didactiques en prose. Dans presque toutes les préfaces et descriptions des éditeurs du XIXe et du XXe siècle, on lit que le manuscrit a été copié par une seule main, ou bien par deux mains. En préparant l’édition des textes encore inédits, je me suis aperçu que le recueil est beaucoup moins homogène que ne l’ ont supposé jusqu’ici la plupart des éditeurs. À mon avis, l’idée selon laquelle le manuscrit a été copié par un seul scribe est à écarter.
Résumé long
Renders Pascale [Université de Liège].

Mise en ligne, mise à jour et mise en réseau du Französisches Etymologisches Wörterbuch

vendredi 19 juillet, 10h00-10h30, B 205

La mise en ligne et la mise en réseau des ressources lexicographiques constituent un chantier actuellement très important en Europe. Il est temps que le Französisches Etymologisches Wörterbuch (FEW), "dizionario-tetto", soit informatisé et intégré dans ces réseaux. La faisabilité de son informatisation est désormais prouvée: il existe un logiciel capable d'insérer de façon automatisée, dans tout article du dictionnaire, un balisage XML qui permet d'accéder facilement à son contenu. Dès lors, une question se pose: pourquoi le FEW n'est-il pas encore sur Internet? Cette communication fait le point sur l'état du projet d'informatisation des 25 volumes du FEW et présente un nouveau projet, qui étudie les modalités de mise à jour et de mise en réseau de l'ouvrage avec d'autres ressources lexicographiques pour lesquelles il constitue une référence obligée.
Résumé long
Roth Veronika [Universität zu Köln], Weingart Anja, Zwink Julia [Freie Universität Berlin].

Termes romans en graphie hébraïque pour le DiTMAO (Dictionnaire de Termes Médico-botaniques de l’Ancien Occitan)

Poster vendredi 19 juillet 15h00-16h00

Le poster démontre quelques aspects lexicographiques problématiques auxquels les éditeurs du DiTMAO sont confrontés. Le corpus du DiTMAO se nourrit, entre autres, des textes écrits en caractères hébreux. Ce sont pour la plupart des listes de synonymes, qui comprennent des termes médico-botaniques an ancien occitan avec leurs équivalents en arabe, hébreu et latin. Les termes occitans que l’on y trouve présentent, p.ex., les difficultés suivants : la graphie hébraïque suggère une variante différente de celles des textes en graphie latine ; le terme médical occitan est une première documentation ou même un hapax legomenon ; un terme prend une signification divergente du lemme, à déduire de la signification des synonymes. Le poster mettra en évidence lesdits problèmes et d’autres, en proposant à la fois les solutions.
Résumé long
Silvestre João Paulo, Villalva Alina [Universidade de Lisboa].

As traduções da Regra de S. Bento em Português – glossário comparativo e documentação para um dicionário histórico

vendredi 19 juillet, 09h30-10h00, B 205

O corpus textual constituído pelas diferentes versões em português da Regra de São Bento (séculos XIV a XVI) permite a elaboração de um glossário comparativo com informação linguística diacrónica, que oferece dados inéditos para a descrição semântica e morfológica do léxico português. Tratando-se de cópias de uma versão portuguesa anterior, os textos ilustram etapas da evolução da língua medieval e clássica. O método desenvolvido para a construção deste glossário pode ser aplicado ao estudo das versões da Regula Benedicti em outras línguas românicas.
Résumé long
Simões Alberto, Iriarte Sanromán Álvaro, Almeida José João [Universidade do Minho, Braga, Portugal].

Dicionário-Aberto: Construção semiautomática de uma funcionalidade codificadora

mercredi 17 juillet, 09h30-10h00, B 205

O nosso projeto visa transformar o Dicionário Aberto (DA, http://www.dicionario-aberto.net) num avançado dicionário de produção. O que se pretende é que, utilizando as funcionalidades de pesquisa reversa do Dicionário Aberto, o utilizador possa procurar unidades lexicais relacionadas (sinónimos, quase-sinónimos, hiperónimos, hipónimos, merónimos, holónimos, co-ocorrentes, etc.) a partir de uma ou de várias palavras. Para que isto seja possível, será necessário que o sistema de pesquisa não use apenas os termos introduzidos pelo utilizador e as respectivas ocorrências nas definições, mas também uma estrutura semântica, que providencie relações léxico-conceptuais com os termos introduzidos. Estas relações serão cruzadas e serão calculadas medidas de proximidade, sendo deste modo possível apresentar um conjunto de resultados ordenados por relevância.
Résumé long
Ungureanu Cristina Violeta [Universite de Pitesti, Roumanie].

Le projet SOCIODIC : un premier dictionnaire roumain de terminologie sociolinguistique

Poster vendredi 19 juillet 15h00-16h00

Le projet en cours que nous désirons présenter a été développé par l’Université de Piteşti (Roumanie), en collaboration avec l’Université Neuchâtel (Suisse) ; il est financé par le programme SCIEX helvétique, qui favorise les échanges scientifiques entre la Suisse et les pays de l’Est européen . Notre projet se propose de réaliser pour la première fois en Roumanie et en langue roumaine une vision d’ensemble de la recherche sociolinguistique à travers l'élaboration d'un dictionnaire terminologique de la sociolinguistique. Il vise à créer un instrument de travail pour les chercheurs et les étudiants roumains, qui leur facilitera l’accès aux connaissances actuelles en sociolinguistique et qui contribuera en même temps à créer en roumain le métalangage – la terminologie – nécessaire au développement de la recherche, au potentiel de la création scientifique en roumain.
Résumé long