Section 16 : Projets en cours ; ressources et outils nouveaux Agresti Giovanni [Université de Teramo], Bernissan Fabrice [Université Paris-Sorbonne].
Projet Tramontana 2012-2013 : recueil et description du discours. Poster vendredi 19 juillet 15h00-16h00
Tramontana est le seul projet de recherche retenu par l’Union européenne au titre du programme Cultura 2012. Il rassemble
sept associations travaillant depuis plusieurs années sur le terrain en lien étroit avec les communautés habitant dans les
territoires ruraux et/ou urbains en Italie, au Portugal et en France. L’objectif général de notre projet est de mettre en
place des actions concrètes afin de veiller au respect de la diversité et de l’intégrité des territoires, à la sauvegarde
de la mémoire et à la promotion de l’identité et des patrimoines immatériels. Il s’agit de préserver la mémoire du paysage
et de la communauté et d’utiliser les matériaux collectés comme outils pour l'éducation, la valorisation du sujet et le développement
des territoires. Dans cette perspective, le projet Tramontana vise plus spécifiquement à définir et à mettre en place les
conditions de la collecte, de la numérisation, de l’organisation et de la diffusion d’une partie importante du patrimoine
immatériel des territoires partenaires. Le réseau que nous avons constitué mène actuellement 800 enquêtes de terrain auprès
des habitants. Les faits de langue sont au centre de nos préoccupations et figurent parmi les thèmes que nous avons retenus.
Nous nous proposons de recueillir des matériaux neufs afin de mieux observer et étudier (i) la narrativité en matière de toponymie
(où l’approche diachronique traditionnelle croise de manière systématique l’observation en synchronie du rapport liant le
sujet – son vécu et son imaginaire – au nom des lieux) et, (ii) la variation diatopique dans une optique d’intercompréhension
dialectale. Nous souhaitons par ailleurs (iii) mettre en évidence les modes de pénétration ainsi que l’aire de diffusion du
lexique exogène, notamment pour ce qui est du lexique des outils de la culture matérielle traditionnelle des zones rurales
de montagne.
Résumé longAguilera Vanderci, Altino Fabiane Cristina [Universidade Estadual de Londrina].
Léxico Histórico do Português Brasileiro: estágio atual samedi 20 juillet, 10h00-10h30, B 205
O Léxico Histórico do Português Brasileiro – LHisPB está sendo construído a partir do material manuscrito coletado e transcrito (edição semidiplomática) pelas equipes regionais
que hoje integram o Projeto Histórico do Português Brasileiro, projeto de pesquisa interinstitucional coordenado pelo professor Dr. Ataliba Teixeira de Castilho. O objetivo do Léxico Histórico do Português Brasileiro é apresentar, sob tratamento lexicográfico, todo o conteúdo lexical dos documentos manuscritos, datados dos séculos XVII
a XIX, que foram coletados, transcritos e editados pelas equipes regionais dos estados do Rio de Janeiro, da Bahia, de Minas
Gerais, da Paraíba e do Paraná. Como objetivos específicos, propomos: (i) oferecer, sob a forma de banco de dados informatizado,
um vasto material lexicográfico para estudos sincrônicos e diacrônicos do léxico registrado em documentos manuscritos durante
os três séculos mencionados; (ii) proporcionar um instrumento de consulta rápida do uso de vocábulos vigentes na época e em
várias regiões do Brasil Colônia e Brasil Império; (iii) apresentar, com a frequência de uso, os itens lexicais e suas variantes
gráficas registrados em cerca de 2500 documentos emanados das então províncias e vilas sediadas nos atuais estados da Bahia,
Rio de Janeiro, São Paulo, Paraná, Minas Gerais, Paraíba, Ceará, Pernambuco e Rio Grande do Sul.
Résumé longAldea Maria, Leucuţa Daniel-Corneliu, Vremir Lilla-Marta, Cristea Vasilica Eugenia, Podaru Adrian Aurel [Université "Babeş-Bolyai" de Cluj-Napoca].
L’édition informatisée du Lexicon de Buda (1825) Poster vendredi 19 juillet 15h00-16h00
Le but de notre article est la présentation de notre projet lexicographique développé au sein de l’Université « Babeş-Bolyai
» de Cluj-Napoca, financé par l’Autorité Nationale Roumaine pour la Recherche Scientifique, CNCS-UEFISCDI, et intitulé Lexiconul de la Buda (1825). Ediţie emendată şi prelucrată electronic pentru consultare on-line (PN-II-RU-TE-2011-3-0170). Dans notre article nous allons mettre en évidence les défis d’ordre linguistique et informatique de l’édition informatisée
d’une œuvre lexicographique d’exception de l’Ecole Latiniste de Transylvanie, le Lexicon de Buda (1825).
Résumé longAndronache Marta [ATILF (CNRS et Université de Lorraine)].
Les étapes dans le travail rédactionnel du DÉRom mardi 16 juillet, 14h00-14h30, B 205
Le Dictionnaire Étymologique Roman (DÉRom), entreprise lexicologique franco-allemande lancée lors du CILPR 2010 à Innsbruck (Buchi \& Schweickard 2009 et 2010),
mobilise aujourd’hui une importante communauté de romanistes : plus d’une cinquantaine de linguistes originaires de douze
pays européens et qui représentent tous les domaines linguistiques de la Romania. Devant la diversité des collaborateurs,
un des grands soucis des directeurs du dictionnaire est de donner des règles de rédaction qui assurent une cohérence interne
propre à tous les articles du dictionnaire. Le but de notre communication est de présenter les étapes de rédaction d’un article
du DÉRom, dont la rédaction à proprement parler est complètement informatisée : 1. travaux préparatoires ; 2. rédaction de
la bibliographie ; 3. rédaction des matériaux ; 4. rédaction du commentaire ; 5. révision par domaines géographiques ; 6.
révision générale ; 7. révision finale) et de les illustrer par un exemple concret, l’article */ti'tion e/ (http://www.atilf.fr/DERom).
Les objectifs stratégiques de cette communication sont au nombre de trois: (1) dans l’immédiat, faire découvrir la méthode
de travail du DÉRom aux romanistes intéressés ; (2) dans une perspective à court terme, former la base d’un module d’enseignement
pour la deuxième École d’été franco-allemande en étymologie romane, qui aura lieu en juillet 2014 à l’ATILF ; (3) dans une
perspective à long terme, donner une idée aux futures générations de lexicologues et d’étymologistes de la manière de travailler
au début du XXIe siècle.
Résumé longAntonelli Roberto [“Sapienza” Università di Roma].
Il Lessico europeo dell'affettività e il metamotore della lirica romanza medievale mardi 16 juillet, 16h30-17h00, B 205
Sarà illustrato il progetto di ricerca tuttora in corso nelle università di Roma “Sapienza”, Cosenza, Siena per la realizzazione
di un lessico unitario dei termini attinenti alla sfera dell’affettività presenti nella lirica romanza medievale. Il progetto
ha già realizzato le concordanze di tutta la lirica romanza medievale (italiana, francese, provenzale, galego-portoghese),
inserendole in un “metamotore” dal quale è possibile consultare contemporaneamente lemmi e campi semantici delle emozioni.
Se ne presenteranno gli ulteriori sviluppi e le ricerche finora realizzate a partire dalle concordanze e dal metamotore già
realizzato.
Résumé longAraújo Sílvia, Sacadura Sílvia, Correia Ana [Université du Minho, Portugal].
Le corpus Per-Fide et ses applications: une étude de cas sur les expressions idiomatiques mercredi 17 juillet, 10h30-11h00, B 205
Le projet Per-Fide vise la compilation d’un corpus parallèle multilingue entre le portugais et six autres langues avec des
textes appartenant à différents domaines. Après une brève présentation de ce corpus multilingue qui met en valeur ce qui le
distingue d’autres corpus, nous tâcherons de montrer son utilité dans l’étude du langage et de la traduction sur la base d’un
exemple concret, celui des expressions idiomatiques dans une perspective contrastive français/portugais/anglais. L’intégration
des corpus et des outils d’analyse de corpus dans l’enseignement de la traduction (outre celui de la linguistique et des langues)
se révèle essentielle car le recours à ce type de ressources améliore la qualité des traductions par rapport à la seule utilisation
de dictionnaires, notamment au niveau du choix des termes et de l’utilisation d’expressions idiomatiques.
Résumé longAresti Alessandro [Sapienza Università di Roma].
Presentazione del Tesoro dei Lessici degli Antichi Volgari Italiani (TLAVI) mardi 16 juillet, 17h00-17h30, B 205
L’intervento intende illustrare i risultati del lavoro di allestimento del "Glossario dei glossari degli antichi volgari italiani",
un repertorio onomasiologico di volgarismi estratti da varie raccolte lessicali di epoca medievale e umanistica. Del nostro
"Glossario" esiste una versione cartacea e una elettronica. Per quanto riguarda la versione elettronica, è stato realizzato
uno strumento informatico per l’interrogazione del corpus lessicale; è in corso di realizzazione un sito web di presentazione
al progetto in cui verrà messo a disposizione degli studiosi lo strumento informatico.
Résumé longBarbieri Beatrice [Université de Göttingen], Morend Jaquet Gaëlle [Université de Genève], Halgrain Mohan [Université de Neuchâtel].
Présentation du projet : Lire en contexte à l’époque prémoderne. Enquête sur les manuscrits de fabliaux mercredi 17 juillet, 14h30-15h00, B 205
Le projet Lire en contexte à l’époque prémoderne. Enquête sur les manuscrits de fabliaux se propose d'étudier le corpus des manuscrits de langue française contenant un ou des fabliaux: 43 recueils de nature, origine
et époque très différentes. À partir de l'étude matérielle de ces manuscrits, on envisage de mieux comprendre leur typologie
et leurs critères d'agencement et, dans le même temps, de jeter une nouvelle lumière sur les fabliaux, en les étudiant dans
leur contexte de lecture originel. Le projet, mené par une équipe internationale, aboutira à la constitution d'une grande
base de données contenant les descriptions codicologiques des manuscrits ainsi qu’à la rédaction d’études de nature monographique.
Résumé longBazin-Tacchella Sylvie, Souvay Gilles [ATILF (CNRS et Université de Lorraine)].
Avec la version 2012, la fin d’un projet ou de nouveaux défis pour le DMF ? mardi 16 juillet, 14h30-15h00, B 205
Après avoir évoqué les nouveautés de la version 2012 touchant le Dictionnaire du Moyen Français (1330-1500), nous aimerions montrer qu’en rendant visible sur le site, dans un nouveau menu "Compléments au DMF", les différents projets
d’enrichissement en cours, les utilisateurs intéressés peuvent être appelés à participer activement à cet enrichissement.
Le développement de "l'outil glossaire" a entraîné de multiples collaborations, qui ont permis d’améliorer l’outil, en l'adaptant
aux besoins des divers utilisateurs. Tout particulièrement la lemmatisation des textes et leur adossement au Dictionnaire et à ses différentes Bases contribue à son élargissement et au développement des outils eux-mêmes.
Résumé longBernissan Fabrice [Paris-Sorbonne], Agresti Giovanni [Teramo].
Projet Tramontana 2012-2013 : recueil et description du discours Poster vendredi 19 juillet 15h00-16h00
Nous nous proposons de recueillir au sein du projet Tramontana (France-Italie-Portugal)des matériaux neufs afin de mieux observer
et étudier (i) la narrativité en matière de toponymie (où l’approche diachronique traditionnelle croise de manière systématique
l’observation en synchronie du rapport liant le sujet – son vécu et son imaginaire – au nom des lieux) et, (ii) la variation
diatopique dans une optique d’intercompréhension dialectale. Nous souhaitons par ailleurs (iii) mettre en évidence les modes
de pénétration ainsi que l’aire de diffusion du lexique exogène, notamment pour ce qui est du lexique des outils de la culture
matérielle traditionnelle des zones rurales de montagne. L'objet de ce poster sera de communiquer sur les premiers résultats
obtenus auprès des habitants des territoires d'enquêtes.
Résumé longBuendía-Castro Miriam, León-Aráuz Pilar, Sánchez-Cárdenas Beatriz [Universidad de Granada].
Categorías semánticas para describir estructuras argumentales en un ámbito de especialidad Poster vendredi 19 juillet 15h00-16h00
Los estudios sobre tipologías nominales de sustantivos no abundan en las lenguas de especialidad. Esto resulta sorprendente
si tenemos en cuenta el poder descriptivo que una tipología nominal de clases semánticas puede tener en un ámbito de especialidad,
donde existe una mayor restricción del significado de las unidades lingüísticas y de sus combinaciones léxicas. En este artículo
exponemos, por un parte, los primeros pasos de una tipología nominal en el ámbito de especialidad del medio ambiente y en
el subdominio de los desastres naturales. Por otro lado, desarrollamos la hipótesis según la cuál si los términos que aparecen
en los argumentos de los verbos de un ámbito de especialidad se clasifican y describen según los roles semánticos que suelen
ocupar – según un estudio de corpus– es posible predecir los verbos asociados con una estructura argumental dada. Esta idea
cobra especial interés en el ámbito de la traducción, ya que estas predicciones tienen un alcance interlingüístico.
Résumé longChabrolle-Cerretini Anne-Marie [ATILF (Université de Lorraine)].
Vers une nouvelle histoire de la linguistique romane: le projet d'un Dictionnaire HIstorique des COncepts Descriptifs de l'Entité Romane Poster vendredi 19 juillet 15h00-16h00
D.HI.CO.D.E.R. est un travail en histoire de la linguistique romane qui s'est donné pour objectif de recenser les concepts qui ont permis
de décrire l'entité romane et de constituer la linguistique romane depuis le XIXe siècle jusqu'à aujourd'hui. Les parties du dictionnaire sont celles de l'histoire de la linguistique romane revisitée à partir
des concepts théoriques et méthodologiques attestés et présentés dans leurs contextes historiques et textuels. Toutes les
aires linguistiques romanes sont objet de l'étude.
Résumé longClim Marius-Radu, Tamba Elena, Catană-Spenchiu Ana, Pătraşcu Mădălin [L'Académie Roumaine, Filiale d'Iasi, Département de Lexicologie – Lexicographie de l'Institut de Philologie Roumaine «A. Philippide»].
CLRE. Corpus lexicographique roumain essentiel. 100 dictionnaires de la langue roumaine alignés au niveau de l’entrée et, partiellement, au niveau du sens mardi 16 juillet, 09h30-10h00, B 205
Ce travail porte sur l'accomplissement d'un projet qui s'est proposé de réaliser un corpus lexicographique qui inclut eDTLR
(la version informatisée du Dictionnaire «Trésor» de la Langue Roumaine) et les autres dictionnaires essentiels de la langue roumaine (dictionnaires anciens et nouveaux, dictionnaires généraux
ou «spéciaux», etc.), alignés au niveau de l’entrée et, partiellement, au niveau du sens. Ce projet s'inscrit dans toute une
série de projets interdisciplinaires de recherche linguistique, ayant pour but, d’une part, de valoriser les ressources existantes
par leur acquisition en format électronique et, d’autre part, la création de nouvelles ressources et de nouveaux instruments
pour l’étude de la langue (des dictionnaires informatisés, des corpus de textes écrits / parlés). Le corpus lexicographique
roumain essentiel facilitera l'accès des spécialistes de Roumanie et de tous les romanistes à un instrument de travail indispensable
pour les études comparatives.
Résumé longCorradini Maria Sofia [Università di Pisa].
La realizzazione del « Dictionnaire de Termes Médico-botaniques de L’Ancien Occitan » (DiTMAO): problemi di organizzazione della conoscenza medico-farmaceutica attestata nei manoscritti occitani medievali. Esempi di ambito anatomico e patologico mardi 16 juillet, 17h30-18h00, B 205
Come ho illustrato nei precedenti convegni CILPR in collaborazione con il collega Guido Mensching della Freie Universitaet
di Berlino, al lavoro di carattere critico-editoriale delle fonti manoscritte in occitano medievale che trattano argomenti
medico-farmaceutico si è di recente affiancata un'attività che, mediante un'opportuna organizzazione dei dati, ne arricchisce
le modalità di interrogazione. Se, infatti, il lemma mantiene il consueto ruolo per consultare l'archivio testuale, si aggiunge,
come ulteriore chiave di accesso, anche il valore semantico, opportunamente strutturato. Nel presente contributo si mostreranno
entrambi questi approcci.
Résumé longDiego Hernández Elena [Universidad de Salamanca (Espagne)].
Estudio lexicográfico para el tratamiento automático de la lengua: diccionario bilingüe francés-español de los sustantivos predicativos de las <ayudas económicas>. vendredi 19 juillet, 14h30-15h00, B 205
El tratamiento automático de las lenguas naturales necesita un trabajo lexicográfico adaptado a las especificidades del autómata.
Para que estos sean capaces de interpretar textos en la lengua de origen y generarlos en la lengua de destino, hay que proporcionarles
una descripción sistemática y exhaustiva de las características morfológicas, sintácticas y semánticas de cada unidad léxica.
Este es el tipo de trabajo que proponemos. Hemos elaborado un estudio sintáctico-semántico de los sustantivos predicativos
de las <ayudas económicas> (beca, subsidio, patrocinio...) en francés y en español, presentado bajo la forma de dos diccionarios
electrónicos monolingües coordinados.
Résumé longDotto Diego, Lorenzi Cristiano [Opera del Vocabolario Italiano, CNR; Scuola Normale Superiore, Pisa].
Il DiVo (Dizionario dei Volgarizzamenti). Nuovi strumenti per lo studio delle traduzioni dal latino nell'italiano delle origini vendredi 19 juillet, 09h00-09h30, B 205
Si presenta il progetto DiVo (Dizionario dei volgarizzamenti), attualmente in corso presso l’Istituto Opera del Vocabolario Italiano (CNR Firenze) e la Scuola Normale Superiore di Pisa.
Esso propone uno studio complessivo del "lessico di traduzione" medievale e comprende tutti i volgarizzamenti di testi classici
e tardo-antichi eseguiti entro la fine del Trecento. Il DiVo si articola in tre punti: - compilazione di una bibliografia filologica secondo il modello TLIon; - costituzione di un corpus bilingue lemmatizzato; - studio lessicale.
Résumé longDugas Edwige [Université Charles de Gaulle - Lille 3].
Détection, extraction automatique et analyse des lexèmes construits par la préfixation en non- en français Poster vendredi 19 juillet 15h00-16h00
Ce poster présente un travail en cours qui vise à mettre à contribution linguistique théorique et Traitement Automatique des
Langues (TAL), dans le cadre d’une thèse consacrée à l’étude synchronique et diachronique du préfixe de négation non- et sa relation aux autres préfixes composant le paradigme de la préfixation négative : a-, anti-, contre-, dé(s)-, dis-, in-, mal-, mé(s)-, non-. J’expose ici la méthodologie employée pour comparer les lexèmes construits sur base nominale et adjectivale à l’aide de
non- (p.ex. NON VIOLENCE, NON VOYANT, NON REMBOURSABLE) attestés dans le Trésor de la Langue Française informatisé (TLFi), et les formes attestées en corpus ouvert (les pages indexées par le moteur de recherche GoogleTM). L’hypothèse sous-jacente
est que les dictionnaires ne reflètent que très partiellement l’état actuel du français (cf. Dal et Namer 2012). Mon objectif
est, à terme, de créer un outil d’extraction automatique des mots construits à l’aide du préfixe non- et à ceux construits avec les autres préfixes de négation.
Résumé longGaiffe Bertrand, Stumpf Béatrice [ATILF (CNRS et Université de Lorraine)].
Une édition au format TEI de la première traduction française de La Cité de Dieu mardi 16 juillet, 15h00-15h30, B 205
L'édition de La Cité de Dieu traduite par Raoul de Presle de 1371 à 1375 sera publiée sous une forme papier classique. Pour
autant, le projet ERC responsable de cette édition a fait le choix d'un encodage en TEI, c'est à dire d'un encodage abstrait
de la forme papier visée, nécessitant de ce fait le développement d'outils destinés à produire la forme imprimable. Nous justifions
ce choix en montrant : 1) que l'encodage, par les contraintes qu'il impose améliore la qualité de l'édition produite ; 2)
que cet encodage permet l'emploi d'outils d'aide à l'édition tels que LGeRM (mis au point pour le DMF) ; 3) que la forme visée,
pour autant qu'on soit un peu exigeant, ne pourrait pas être éditée directement.
Résumé longGala Nuria [Aix Marseille Université], Barbu Mititelu Verginica [Romanian Academy Research Institute for Artificial Intelligence].
LexROM : un réseau lexical pour des familles de mots dans des langues romanes lundi 15 juillet, 15h30-16h00, B 205
Dans cette communication, nous présenterons une ressource -en cours de construction- fondée sur la notion de famille de mots
interlangue. La structuration du lexique des langues sous forme de familles nous a semblé une propriété intéressante à explorer
d'un point de vue multilingue dans le cadre de quelques langues romanes (à ce stade, français, roumain, catalan et espagnol).
Ainsi, notre objectif à terme est de proposer un réseau lexical offrant des possibilités de recherche élargies (morphologie,
sémantique, etc.) pour différentes langues romanes. Exploiter les ressemblances formelles au niveau interlangue présente un
intérêt aussi bien dans des applications humaines -études contrastives, apprentissage du vocabulaire ou aide à l'écriture
dans une langue étrangère- qu'en traitement automatique des langues. Enfin, le développement et l'enrichissement d'un réseau
multilingue soulève de nombreuses questions scientifiques et méthodologiques auxquelles nous apporterons des nouveaux éléments
de réponse dans le cadre de notre communication.
Résumé longGalves Charlotte [Université de Campinas, Brésil].
Construction et exploitation d'un grand corpus historique annoté du portugais: Le Corpus Tycho Brahe mardi 16 juillet, 10h00-10h30, B 205
Je présenterai le Corpus annoté du portugais historique Tycho Brahe, librement accessible sur la toile mondiale, construit sur le modèle des Penn Corpora of Historical English dirigés par Anthony Kroch et ses collaborateurs. Le schéma d’annotation syntaxique de ces corpus s’inspire de la théorie
de la grammaire générative. Les représentations suivent une version simplifiée de la théorie X-barre et contiennent des éléments
abstraits comme catégories vides et indices référentiels. La philosophie de ce genre de Corpus, qui consiste à mettre à disposition
des chercheurs les textes dans leur intégralité, permet également de travailler de façon très productive sur la relation syntaxe/texte,
notamment la relation entre les phénomènes d’ordre et l’organisation de l’information, domaine très actif de recherche actuellement.
Résumé longGiannini Gabriele [Université de Montréal].
Les "petits" recueils : présence, composition, perspectives mercredi 17 juillet, 15h00-15h30, B 205
Dans le cadre du projet international "Lire les fabliaux en contexte", nous nous sommes aperçus rapidement que les manuscrits,
complets ou fragmentaires, contenant à présent un ou quelques fabliaux sont parmi les plus négligés, tant par les éditeurs
que par ceux qui s'intéressent aux différents aspects de la transmission du genre. On a, et on exploite, une image partielle,
voire biaisée de la composition de ces témoins, ainsi que de leur structure d’origine et du réseau au centre duquel ils ont
évolué. En passant en revue une demi-douzaine de cas éclairants, seront mis au jour, d'un côté, les dangers que cette méconnaissance
engendre et, d'un autre côté, les perspectives de recherche qu'un travail de fond renouvelé ouvre.
Résumé longGlessgen Martin-Dietrich [Zürich], Tittel Sabine [Heidelberg].
Bases de données textuelles et lexicographie historique: comment réunir les Plus anciens documents linguistiques de la France et le DEAF? mercredi 17 juillet, 14h00-14h30, B 205
Le projet présent réunit deux entreprises lexicologiques et philologiques de longue haleine: le Dictionnaire Etymologique de l'Ancien français (DEAF), rédigé depuis quatre décennies à Heidelberg, et les Plus anciens documents linguistiques de la France (DocLing), poursuivis également depuis les années 1970. Dans les deux cas, les années 2000 ont donné lieu à une informatisation systématique
qui permet un rapprochement réciproque. En synthèse, notre idée est d'intégrer les données lexicales des DocLing dans les nouveaux ‘articles courts’ du DEAF. Cela permettra de renforcer la part des sources documentaires dans le DEAF, mais aussi de créer une interface entre ce dictionnaire et une base textuelle de référence. En même temps, le vocabulaire
des DocLing serait placé dans le cadre naturel de l'ancienne langue française par une harmonisation des lemmes.
Résumé longGonzález Orellana Karen [ATILF (CNRS et Université de Lorraine)].
Ailleurs et partout : statut et traitement de leurs équivalents lexicographiques dans le Réseau Lexical de l'Espagnol lundi 15 juillet, 15h00-15h30, B 205
Nous aborderons la problématique des équivalents lexicographiques non isomorphes à travers l'analyse de deux adverbes du français
et de leurs équivalents en espagnol : ailleurs et partout. Cette étude est menée dans le contexte du développement d'une base de données lexicale relationnelle, le Réseau Lexical de l'Espagnol (RLE), fondée sur les principes et la méthodologie postulés par la Lexicologie Explicative et Combinatoire. Nous réaliserons un
état des lieux concernant le statut des équivalents espagnols des adverbes en question dans des ouvrages lexicographiques
monolingues et bilingues de référence. De même, nous présenterons une proposition pour le traitement de ces équivalents, en
vue de leur inclusion dans des bases de données relationnelles coordonnées.
Résumé longIacobini Claudio, Voghera Miriam, Cutugno Francesco, Iacobini Claudio, Savy Renata [Università di Salerno].
Il VoLIP: una risorsa per lo studio della variazione nel parlato della lingua italiana samedi 20 juillet, 10h30-11h00, B 205
Il VoLIP (Voce del LIP) è una risorsa linguistica liberamente disponibile sul portale www.parlaritaliano.it, realizzata presso l’università di Salerno.
Il VoLIP permette di ascoltare e scaricare i segnali audio da cui sono tratte le trascrizioni del Corpus LIP, e permette la ricerca nel corpus sia secondo criteri sociolinguistici sia secondo criteri lessicali e morfo-sintattici.
Il Corpus LIP (500.000 parole, 60 ore di registrazione), raccolto nei primi anni ’90, rispetta criteri di variazione diafasici, diatopici
e diamesici (T. De Mauro, F. Mancini, M., Vedovelli, M. Voghera, Lessico di frequenza dell’italiano parlato, Milano, Etaslibri, 1993), ed è a tutt’oggi il corpus di Italiano parlato spontaneo più ampio. Nel VoLIP l’audio del corpus è correlato con metadati testuali e sociolinguistici in formato IMDI, e la trascrizione ortografica è
integrata con la lemmatizzazione. Il VoLIP permette due strategie di interrogazione eventualmente incrociate: i) per variabili di testo e di registro, in base ad una
annotazione in metadati più articolata rispetto al LIP; ii) per criteri lessicali e morfosintattici, in base al lessico (distinto in tipi e forme) e all’analisi in parti del discorso.
L’interrogazione restituisce porzioni di audio allineate al relativo testo.
Résumé longIriarte Sanromán Álvaro, Soares Ana Paula, Simões Alberto, Almeida José João, Comesaña Montserrat, Costa Ana, Machado João, França Patrícia [Universidade do Minho, Braga, Portugal].
Procura-PALavras (P-PAL): Uma aplicação web para uma base de dados lexical do português europeu mercredi 17 juillet, 10h00-10h30, B 205
O Procura-PALavras (P-PAL) é uma aplicação web que permite a obtenção de uma grande diversidade de métricas lexicais e sublexicais extraídas de um
corpus com mais de 227 milhões de palavras do português europeu contemporâneo. O P-PAL pretende ser um instrumento de âmbito multidisciplinar, incluindo outros índices não contemplados em ferramentas congéneres
bem como uma dupla possibilidade de utilização: (i) obter palavras que obedeçam a determinados requisitos; ou (ii) analisar
palavras num conjunto requisitos. Nesta comunicação, faremos uma breve descrição da nossa aplicação, aberta e disponível em
http://p-pal.di.uminho.pt/tools.
Résumé longKraif Olivier, Diwersy Sascha [Université Stendhal Grenoble 3].
Extraction automatique et préparation lexicographique d'unités polylexicales étendues mercredi 17 juillet, 09h00-09h30, B 205
Nous présentons une méthode permettant l'extraction automatique des unités polylexicales caractérisant le profil collocationnel
d'un pivot donné. A partir d'un corpus de textes journalistiques et littéraires d'environ 120 millions de mots, analysés syntaxiquement
grâce au parseur Connexor, nous montrons comment constituer un réseau d'expressions hiérarchisées autour d'un pivot occupant
une fonction syntaxique déterminé. Les unités extraites sont ensuite présentées de manière à faciliter leur exploitation lexicographique
: affichage de l'arbre syntaxique, contextes d'occurrence, regroupement des expressions en fonction de leur réalisations morphosyntaxiques
et indication du paradigme étendu auquel appartient le pivot dans le contexte de ses collocations. Nous chercherons enfin
à relier ces extractions automatiques avec les codages syntaxiques et sémantiques du champ lexical des émotions réalisés par
nos collègues du projet Emolex.
Résumé longKunstmann Pierre [Université d'Ottawa], Souvay Gilles [ATILF (CNRS et Université de Lorraine)].
Dictionnaire Électronique de Chrétien de Troyes (DÉCT) : fin et suite... mardi 16 juillet, 15h30-16h00, B 205
Après neuf ans de travail l'oeuvre sera achevée pour l'été 2013 (DÉCT1), de la lettre A (aaisement) à la lettre Y (Ysoré) ; cette première base sera élargie dans les prochaines années pour constituer le DÉCT2. Le DÉCT1 se limite à la définition
des mots dans la copie du scribe. L'achèvement de cette phase permet la multiplication des renvois d'un article à l'autre
et l'introduction de fonctions nouvelles (essentiellement des données statistiques portant sur l'ensemble). Il sera fait durant
cette présentation une démonstration des principales fonctionnalités du DÉCT1 terminé. Le DÉCT2 se caractérisera par l'ajout
des mots grammaticaux, des variantes des autres manuscrits, et des axes de synonymie et d'antonymie. Ce dictionnaire est un
ouvrage en progression que nous voulons garder ouvert même après l'achèvement de ce second volet.
Résumé longLuzzi Damiana [Fondazione Rinascimento Digitale].
Un’ontologia per il DiTMAO (Dictionnaire de Termes Médico-botaniques de l’Ancien Occitan) mardi 16 juillet, 18h00-18h30, B 205
Il Progetto DiTMAO ha fra gli obiettivi quello di organizzare e rendere accessibili sul Web i testi relativi all’antica terminologia medico-farmaceutica
in occitano per la redazione di un dizionario terminologico. Le voci entrano in un duplice sistema di classificazione logico-semantica:
quello aderente al periodo medievale ove furono usate e quello coerente all’uso attuale. Per raggiungere tali scopi si adoperano
le tecnologie del Semantic Web (ontologie) e una suite di applicazioni software di ultima generazione dedicata al trattamento
di testi, immagini e lessici (Reperio). In questo contributo, si prende in esame la metodologia che ha portato alla scelta
dell’ontologia, intesa in senso informatico e la descrizione dell’ontologia risultante. Rispetto alla consultazione di concordanze
lemmatizzate di impianto tradizionale, la classificazione utilizzata apporta notevoli benefici: maggiore precisione, accuratezza,
ricchezza di informazioni e recall nelle operazioni di IR/IE necessarie agli studi linguistici e filologici relativi alla
terminologia attestata dal corpus.
Résumé longMagri-Mourgues Véronique [Université de Nice].
Statistiques et motifs séquentiels. Le cas des suites Nom Préposition Nom, mot à mot, pétale par pétale vendredi 19 juillet, 14h00-14h30, B 205
La communication se propose d’évaluer l’outil statistique pour identifier et analyser les suites Nom préposition Nom, avec
pour critère restrictif que les deux substantifs sont identiques. L’enjeu essentiel de cette recherche est de montrer que
ce type de structures peut être utilisé à des fins de classifications. La base qui sert de corpus exploratoire à cette recherche
est constituée par un extrait de Frantext catégorisé : il comprend quatre groupes génériques répertoriés dans Frantext : d’une
part deux ensembles narratifs, le roman et les mémoires, d’autre part la poésie et le théâtre afin que les genres principaux
soient tous représentés. Le repérage des unités NpN permet une réflexion sur le statut de la préposition, à la fois sur le
plan lexical et sémantique, et permet de réfléchir au partage entre structures figées et innovations lexicales, entre langue
et discours. Ces unités peuvent être proposées comme indices d’un style d’auteur ou même comme marqueur générique.
Résumé longManea Lucia, Montémont Véronique [ATILF (Université de Lorraine)].
L’évolution de Frantext : quelles modifications et quels usages pour Frantext 2 ? Poster vendredi 19 juillet 15h00-16h00
Le poster sera structuré autour de Frantext, base de données textuelles développée à l’ATILF. Tout d’abord, nous exposerons
l’historique de Frantext et son fonctionnement, pour pointer ensuite les transformations envisagées de la base, dont le but
est la création d’un outil plus performant. Les objectifs visent notamment à l’enrichissement des corpus et à l’amélioration
des procédés d’interrogation. Frantext 2 sera une base de données équipée d’un moteur de recherche perfectionné, assortie
d’un portail bibliographique dans lequel les œuvres seront équipées de métadonnées, et qui autorisera des enquêtes sur de
grands corpus échantillonnés et proposera l’implémentation d’outils statistiques. Permettant de faire des interrogations sur
les états anciens de langue, facilitant la conservation, la valorisation et la connaissance d’un état de la langue, l’étude
des genres du discours ou des genres littéraires, Frantext 2 sera exploitable en linguistique et en littérature mais ouvrira
également vers d’autres domaines.
Résumé longMaître Raphaël [Université de Neuchâtel (Suisse)].
Dictionnaire du patois de Bagnes: un projet – une base vendredi 19 juillet, 10h30-11h00, B 205
Le but de la communication est de présenter le projet «Dictionnaire du patois de Bagnes (Valais)», et tout spécialement sa
base de données, qui sert notamment d'outil de rédaction. Le patois de Bagnes, dialecte francoprovençal des Alpes suisses,
est documenté par 50'000 fiches manuscrites au fichier central du Glossaire des patois de la Suisse romande. Sur la base de ces matériaux est élaboré un dictionnaire, qui, par ailleurs, rattache chaque mot bagnard à ses correspondants
romands par un renvoi au Glossaire, et galloromans par un renvoi au FEW. Une base de données FileMaker est le principal outil de gestion et de transformation du corpus. Sa mission est de prêter
assistance aux lexicographes dans l'accomplissement intuitif de leurs tâches. Elle recherche, présente, ordonne ou regroupe
les matériaux selon les besoins, affiche des synopsis, sert à rédiger, vérifie la rédaction, et exporte les articles.
Résumé longMedori Stella [CESIT Corsica].
Une base de données au service de la toponymie Corse (CESIT Corsica) Poster vendredi 19 juillet 15h00-16h00
Le poster présentera la base de données du CESIT Corsica dédiée à la toponymie de la Corse.
Résumé longNádvorníková Olga [Université Charles, Prague].
InterCorp - projet de corpus parallèle mardi 16 juillet, 10h30-11h00, B 205
La communication présente le corpus parallèle InterCorp, créé par l’Institut du Corpus National Tchèque (www.korpus.cz/intercorp). Composé des originaux et de leurs traductions
respectives en 27 langues (y compris le français, le portugais, l’italien et l’espagnol), InterCorp contient actuellement plus de 90 millions de mots dans la section littéraire, et plus que 450 millions de mots dans les sections
juridique (Acquis communautaire) et journalistique (Presseurop et SYNDICATE). Grâce aux possibilités de requête avancées, le corpus sert depuis plusieurs années à des recherches contrastives ainsi
qu’au large public de traducteurs, enseignants et étudiants. Toutefois, l’utilisation systématique d’InterCorp soulève d’importantes questions méthodologiques concernant non seulement ses limites de taille, mais en particulier les spécificités
de la langue de traduction.
Résumé longPesini Luca [Scuola Normale Superiore, Pisa], Del Grosso Angelo Mario, Bozzi Andrea [Istituto di Linguistica Computazionale « A. Zampolli » del CNR, Pisa].
F. de Saussure e la linguistica romanza. Un’applicazione web per l’edizione elettronica dei manoscritti lundi 15 juillet, 14h00-14h30, B 205
Se il ruolo di F. de Saussure nella linguistica indoeuropea e nella linguistica generale è ben noto, il suo interesse nell’ambito
della linguistica romanza è stato quasi del tutto trascurato dagli studiosi. Fino ad oggi è stato difficile valutare il contributo
di Saussure alla romanistica, dato che i suoi lavori (riguardanti soprattutto i patois francesi e la toponomastica) restano
in gran parte inediti.Soltanto nel quadro di una nuova edizione critica digitale di tutte le opere di Saussure sarà possibile
apprezzare il suo profondo interesse per la filologia romanza e far luce sul ruolo che lo studio dell’evoluzione delle lingue
neolatine ebbe nella riflessione generale di questo linguista, sia comparatista che romanista.
Résumé longPiccini Silvia, Giovannetti Emiliano, Ruimy Nilda [Istituto di Linguistica Computazionale 'Antonio Zampolli' - Consiglio Nazionale delle Ricerche -Pise].
Le lexique électronique de la terminologie de Ferdinand de Saussure : une première Poster vendredi 19 juillet 15h00-16h00
Le Projet italien intitulé « Per un'edizione digitale dei manoscritti di Ferdinand de Saussure » a pour objectif la création
d’un prototype d’édition numérique des textes du grand linguiste genevois, réalisé à partir d’une sélection de ses documents
autographes. Dans ce projet, l’un des volets novateurs est la création du premier thésaurus-lexique électronique de la terminologie
linguistique saussurienne. Afin de réaliser cette base de connaissance, nous nous sommes inspirés du modèle lexical SIMPLE
qui a permis le développement de vastes lexiques sémantiques informatisés, et l’avons adapté aux exigences de notre domaine
de la connaissance. Le lexique réalisé a été conçu dans le but d’offrir un outil performant pour les études saussuriennes.
Il fournit en effet une représentation structurée de la terminologie de Saussure, une définition du contenu sémantique de
chacun des termes ainsi qu’un cadre explicite de la nature et de l’importance des liens qui les unissent. Ce faisceau d’informations
devrait donc contribuer de manière significative à mieux maîtriser le vocabulaire saussurien et, partant, à éclairer certains
aspects originaux de la pensée du père de la linguistique moderne.
Résumé longPolguère Alain [ATILF (CNRS et Université de Lorraine)].
Tissage du Réseau Lexical du Français (RLF) : buts et méthodes lundi 15 juillet, 14h30-15h00, B 205
Le projet RELIEF a débuté au laboratoire ATILF de Nancy au printemps 2011. Sa finalité première est l’élaboration d’un nouveau
type de ressource lexicographique pour le français contemporain : le Réseau Lexical du Français ou RLF. Le projet RELIEF peut être vu comme une phase initiale de trois ans d’un programme conçu sur le long terme, qui vise
l’élaboration de nouveaux modèles lexicographiques, distincts des dictionnaires traditionnels : ils sont non textuels et possèdent
une structure de graphes ; ils englobent le contenu informationnel des dictionnaires traditionnels ; ils sont « calculables ».
Dans notre présentation, nous nous focaliserons sur (i) le positionnement du travail sur le RLF dans le contexte de la lexicographie
contemporaine et du développement de ressources lexicales informatisées du type graphe, (ii) les caractéristiques formelles
et la couverture du RLF et (iii) la méthodologie de construction de la ressource.
Résumé longPosmyk Olaf [Georg-August-Universität Göttingen].
Le recueil Paris, BnF, fr. 24432 et ses copistes mercredi 17 juillet, 15h30-16h00, B 205
Le manuscrit BnF fr. 24432, est un recueil imposant qui renferme un grand nombre de dits, un seul fabliau, des chansons pieuses
et des œuvres didactiques en prose. Dans presque toutes les préfaces et descriptions des éditeurs du XIXe et du XXe siècle, on lit que le manuscrit a été copié par une seule main, ou bien par deux mains. En préparant l’édition des textes
encore inédits, je me suis aperçu que le recueil est beaucoup moins homogène que ne l’ ont supposé jusqu’ici la plupart des
éditeurs. À mon avis, l’idée selon laquelle le manuscrit a été copié par un seul scribe est à écarter.
Résumé longRenders Pascale [Université de Liège].
Mise en ligne, mise à jour et mise en réseau du Französisches Etymologisches Wörterbuch vendredi 19 juillet, 10h00-10h30, B 205
La mise en ligne et la mise en réseau des ressources lexicographiques constituent un chantier actuellement très important
en Europe. Il est temps que le Französisches Etymologisches Wörterbuch (FEW), "dizionario-tetto", soit informatisé et intégré dans ces réseaux. La faisabilité de son informatisation est désormais
prouvée: il existe un logiciel capable d'insérer de façon automatisée, dans tout article du dictionnaire, un balisage XML
qui permet d'accéder facilement à son contenu. Dès lors, une question se pose: pourquoi le FEW n'est-il pas encore sur Internet? Cette communication fait le point sur l'état du projet d'informatisation des 25 volumes
du FEW et présente un nouveau projet, qui étudie les modalités de mise à jour et de mise en réseau de l'ouvrage avec d'autres ressources
lexicographiques pour lesquelles il constitue une référence obligée.
Résumé longRoth Veronika [Universität zu Köln], Weingart Anja, Zwink Julia [Freie Universität Berlin].
Termes romans en graphie hébraïque pour le DiTMAO (Dictionnaire de Termes Médico-botaniques de l’Ancien Occitan) Poster vendredi 19 juillet 15h00-16h00
Le poster démontre quelques aspects lexicographiques problématiques auxquels les éditeurs du DiTMAO sont confrontés. Le corpus du DiTMAO se nourrit, entre autres, des textes écrits en caractères hébreux. Ce sont pour la plupart des listes de synonymes, qui comprennent
des termes médico-botaniques an ancien occitan avec leurs équivalents en arabe, hébreu et latin. Les termes occitans que l’on
y trouve présentent, p.ex., les difficultés suivants : la graphie hébraïque suggère une variante différente de celles des
textes en graphie latine ; le terme médical occitan est une première documentation ou même un hapax legomenon ; un terme prend
une signification divergente du lemme, à déduire de la signification des synonymes. Le poster mettra en évidence lesdits problèmes
et d’autres, en proposant à la fois les solutions.
Résumé longSilvestre João Paulo, Villalva Alina [Universidade de Lisboa].
As traduções da Regra de S. Bento em Português – glossário comparativo e documentação para um dicionário histórico vendredi 19 juillet, 09h30-10h00, B 205
O corpus textual constituído pelas diferentes versões em português da Regra de São Bento (séculos XIV a XVI) permite a elaboração
de um glossário comparativo com informação linguística diacrónica, que oferece dados inéditos para a descrição semântica e
morfológica do léxico português. Tratando-se de cópias de uma versão portuguesa anterior, os textos ilustram etapas da evolução
da língua medieval e clássica. O método desenvolvido para a construção deste glossário pode ser aplicado ao estudo das versões
da Regula Benedicti em outras línguas românicas.
Résumé longSimões Alberto, Iriarte Sanromán Álvaro, Almeida José João [Universidade do Minho, Braga, Portugal].
Dicionário-Aberto: Construção semiautomática de uma funcionalidade codificadora mercredi 17 juillet, 09h30-10h00, B 205
O nosso projeto visa transformar o Dicionário Aberto (DA, http://www.dicionario-aberto.net) num avançado dicionário de produção. O que se pretende é que, utilizando as funcionalidades
de pesquisa reversa do Dicionário Aberto, o utilizador possa procurar unidades lexicais relacionadas (sinónimos, quase-sinónimos, hiperónimos, hipónimos, merónimos,
holónimos, co-ocorrentes, etc.) a partir de uma ou de várias palavras. Para que isto seja possível, será necessário que o
sistema de pesquisa não use apenas os termos introduzidos pelo utilizador e as respectivas ocorrências nas definições, mas
também uma estrutura semântica, que providencie relações léxico-conceptuais com os termos introduzidos. Estas relações serão
cruzadas e serão calculadas medidas de proximidade, sendo deste modo possível apresentar um conjunto de resultados ordenados
por relevância.
Résumé longUngureanu Cristina Violeta [Universite de Pitesti, Roumanie].
Le projet SOCIODIC : un premier dictionnaire roumain de terminologie sociolinguistique Poster vendredi 19 juillet 15h00-16h00
Le projet en cours que nous désirons présenter a été développé par l’Université de Piteşti (Roumanie), en collaboration avec
l’Université Neuchâtel (Suisse) ; il est financé par le programme SCIEX helvétique, qui favorise les échanges scientifiques
entre la Suisse et les pays de l’Est européen . Notre projet se propose de réaliser pour la première fois en Roumanie et en
langue roumaine une vision d’ensemble de la recherche sociolinguistique à travers l'élaboration d'un dictionnaire terminologique
de la sociolinguistique. Il vise à créer un instrument de travail pour les chercheurs et les étudiants roumains, qui leur
facilitera l’accès aux connaissances actuelles en sociolinguistique et qui contribuera en même temps à créer en roumain le
métalangage – la terminologie – nécessaire au développement de la recherche, au potentiel de la création scientifique en roumain.
Résumé long |