Lexicografía de las lenguas románicas: Aproximaciones a la lexicografía moderna y contrastiva. Volumen II 9783110310337, 9783110310160

This volume contains essays on modern and contrastive Romance lexicography as well as studies discussing lexicographical

262 15 7MB

Spanish; Castilian Pages 504 Year 2014

Report DMCA / Copyright

DOWNLOAD PDF FILE

Table of contents :
Presentación del volumen II
La marca figurado en la lexicografía gallega monolingüe
Lexicografía bilingüe práctica basada en corpus: planificación y elaboración del Dicionario Moderno Inglés-Galego
El sufijo -age en los sustantivos deverbales del francés moderno: un operador causativo
Los italianismos de las Bellas Artes en los diccionarios del gallego
La lexicografía catalana actual: tradición y modernidad
La lexicografía rumana informatizada: tendencias, obstáculos y logros
La estructura argumental de los verbos de cambio de estado para su tratamiento lexicográfico
La creación de neologismos en lengua gallega: autonomía o dependencia
Lexicografía ladina moderna
Hábitos de uso de los diccionarios entre los estudiantes universitarios europeos: ¿nuevas tendencias?
La información fónica en la lexicografía gallega moderna
Léxico especializado en la lexicografía gallegoitaliana (algunas reflexiones)
El campo léxico als ervicio de la lexicografía: Un análisis contrastivo en torno a algunos subcampos de los verbos de comunicación en alemán y español
Sobre algunos conflictos en la 'pre'-lexicografía: la selección de corpus para la elaboración de un diccionario contrastivo alemán-español
Propuestas para un diccionario conceptual bilingüe para Ele y DaF: ¿Qué aportan los diccionarios de aprendizaje para situaciones de expresión escrita en lengua extranjera?
Requisitos y expectativas de un buen diccionario online. Resultados de estudios empíricos en la investigación sobre el uso de diccionarios, con especial atención a los traductores
El elemento salmantino en el Diccionario de la Academia: la vigésima segunda edición (2001)
La lexicografía occitana entre recuperación del idioma y tresor sentimental
Consideraciones sobre el contorno y otros aspectos contextuales de la definición lexicográfica
Los neologismos de la prensa en gallego e italiano
Un siglo de diccionarios del italiano
Tratamiento de los culturemas en la lexicografía italoespañola actual
Los diccionarios de construcciones verbales en las lenguas romances
La lexicografía e Internet
¿Qué punto de referencia/tertium comparationis es preciso para la lingüística contrastiva?
Recommend Papers

File loading please wait...
Citation preview

Lexicografía de las lenguas románicas Aproximaciones a la lexicografía moderna y contrastiva Volumen II

Lexicografía de las lenguas románicas Aproximaciones a la lexicografía moderna y contrastiva Volumen II

Editores María José Domínguez Vázquez, Xavier Gómez Guinovart, Carlos Valcárcel Riveiro Coordinadoras María Dolores Sánchez Palomino, María José Domínguez Vázquez

DE GRUYTER

ISBN 978-3-11-031016-0 e-ISBN [PDF] 978-3-11-031033-7 e-ISBN [EPUB] 978-3-11-039481-8 Library of Congress Cataloging-in-Publication Data A CIP catalog record for this book has been applied for at the Library of Congress. Bibliographic information published by the Deutsche Nationalbibliothek The Deutsche Nationalbibliothek lists this publication in the Deutsche Nationalbibliografie; detailed bibliographic data are available in the Internet at http://dnb.dnb.de. © 2015 Walter de Gruyter GmbH, Berlin/München/Boston Druck und Bindung: CPI books GmbH, Leck ∞ Gedruckt auf säurefreiem Papier Printed in Germany www.degruyter.com

Índice Presentación del volumen II .................................................................................................V La marca figurado en la lexicografía gallega monolingüe María Álvarez de la Granja ........................................................................................ 1 Lexicografía bilingüe práctica basada en corpus: planificación y elaboración del Dicionario Moderno Inglés-Galego Alberto Álvarez Lugrís y Xavier Gómez Guinovart ............................................. 31 El sufijo -age en los sustantivos deverbales del francés moderno: un operador causativo Jean-Claude Anscombre........................................................................................... 49 Los italianismos de las Bellas Artes en los diccionarios del gallego Benedict Buono.......................................................................................................... 67 La lexicografía catalana actual: tradición y modernidad Mª. Teresa Cabré Castellví ...................................................................................... 81 La lexicografía rumana informatizada: tendencias, obstáculos y logros Marius-Radu Clim..................................................................................................... 95 La estructura argumental de los verbos de cambio de estado para su tratamiento lexicográfico María Eugenia Conde Noguerol ........................................................................... 111 La creación de neologismos en lengua gallega: autonomía o dependencia Ana Belén Crespo Bastos, Xosé María Gómez Clemente y Xavier Gómez Guinovart ................................................................................... 125 Lexicografía ladina moderna Vittorio Dell’Aquila y Gabriele Iannàccaro......................................................... 153 Hábitos de uso de los diccionarios entre los estudiantes universitarios europeos: ¿nuevas tendencias? Mª. José Domínguez Vázquez y Carlos Valcárcel Riveiro ................................ 165 La información fónica en la lexicografía gallega moderna Xosé A. Fernández Salgado ..................................................................................... 191 Léxico especializado en la lexicografía gallegoitaliana (algunas reflexiones) Isabel González ......................................................................................................... 211 El campo léxico al servicio de la lexicografía: Un análisis contrastivo en torno a algunos subcampos de los verbos de comunicación en alemán y español Vanessa González Ribao y Kristel Proost ............................................................. 223

7*

Lexicografía de las lenguas románicas. II.

Sobre algunos conflictos en la 'pre'-lexicografía: la selección de corpus para la elaboración de un diccionario contrastivo alemán-español Vanessa González Ribao.......................................................................................... 247 Propuestas para un diccionario conceptual bilingüe para Ele y DaF: ¿Qué aportan los diccionarios de aprendizaje para situaciones de expresión escrita en lengua extranjera? Meike Meliss............................................................................................................. 271 Requisitos y expectativas de un buen diccionario online. Resultados de estudios empíricos en la investigación sobre el uso de diccionarios, con especial atención a los traductores Carolin Müller-Spitzer y Alexander Koplenig .................................................... 299 El elemento salmantino en el Diccionario de la Academia: la vigésima segunda edición (2001) Mª. Montserrat Muriano Rodríguez ..................................................................... 323 La lexicografía occitana entre recuperación del idioma y tresor sentimental Guilhem Naro Rouquette ....................................................................................... 337 Consideraciones sobre el contorno y otros aspectos contextuales de la definición lexicográfica José-Álvaro Porto Dapena ..................................................................................... 359 Los neologismos de la prensa en gallego e italiano Alexandre Rodríguez Guerra ................................................................................. 387 Un siglo de diccionarios del italiano Francesco Sabatini y Vittorio Coletti ................................................................... 413 Tratamiento de los culturemas en la lexicografía italoespañola actual María Teresa Sanmarco Bande .............................................................................. 423 Los diccionarios de construcciones verbales en las lenguas romances Xosé Soto Andión .................................................................................................... 441 La lexicografía e Internet Russon Wooldridge................................................................................................. 461 ¿Qué punto de referencia/tertium comparationis es preciso para la lingüística contrastiva? Gerd Wotjak ............................................................................................................. 471



Presentación del volumen II

El volumen Lexicografía de las lenguas románicas II. Aproximaciones a la lexicografía moderna y contrastiva aporta contribuciones dedicadas a la lexicografía contemporánea, esto es, a aquellas investigaciones realizadas desde mediados del siglo pasado. En la obra se incluyen estudios de carácter contrastivo, teórico o metalexicográfico, junto con panoramas de la lexicografía actual de las lenguas románicas. El compendio temático que aquí se recoge ofrece una visión de conjunto amplia, actualizada y científica de la investigación realizada para las lenguas románicas y su lexicografía, complementando así los temas recogidos en el tomo I de la obra. Este se centra en el análisis del estado de la cuestión en lexicografía románica desde una perspectiva histórica mediante estudios generales y específicos de las distintas lenguas. Este volumen presenta aportaciones diversas que siguen ejes temáticos muy concretos, los cuales actúan de hilo conductor de la publicación y la dotan de unidad conceptual y estructural, si bien dando espacio a la diversidad. En conjunto, los contenidos de los trabajos agrupados en esta obra se corresponden con alguna o algunas de las siguientes líneas temáticas de estudio: - Visiones de conjunto sobre la lexicografía moderna de las lenguas románicas, como las de Dell’Aquila y Iannàccaro para el ladino, Cabré para el catalán, Clim para el rumano, Sabatini y Coletti para el italiano y Naro Rouquette para el occitano. - Muchos artículos inciden en la relación entre lexicografía e informática, esto es, en el papel que la informatización, la digitalización, los corpora, entre otros, han desempeñado en la extracción y el análisis de datos, y, en definitiva, en el desarrollo de la lexicografía. Por tanto, nos encontramos aquí con artículos que presentan el estado de la lexicografía de una lengua románica atendiendo a este fenómeno y también con estudios de carácter específico sobre una lengua o varias. En este conjunto temático se engloban, asimismo, contribuciones que abordan la lexicografía electrónica, esto es, el análisis de diccionarios concebidos desde un principio como productos en red, así como aquellos que le prestan atención a la planificación y elaboración de las obras de consulta. Se enmarcan aquí trabajos como los de Clim, González Ribao, Lugrís/Guinovart, Müller-Spitzer/Koplenig y Wooldridge. - Junto a artículos sobre el tratamiento del léxico especializado en determinados diccionarios (Buono, González Fernández) o sobre ciertos aspectos de especial interés en ellos, como la información fónica (Fernández Salgado), nos encontramos estudios más orientados a la vertiente lexicológica o al análisis morfológico, semántico e incluso sintáctico de ciertos

V**I

-

-

Lexicografía de las lenguas románicas. II.

componentes léxicos (Crespo/Clemente/Guinovart, Rodríguez Guerra, Anscombre, Conde Noguerol, Soto Andión), análisis cuya repercusión es evidente en las obras lexicográficas, y así se refleja en algunos de esos estudios. En muchos de los estudios se observa una especial atención al papel que desempeña el usuario del diccionario en la propia elaboración de la obra de consulta. Algún artículo adopta esta temática como objeto específico de análisis (Domínguez/Valcárcel), si bien este aspecto está presente en diferentes trabajos del tomo. En cuanto a la lexicografía contrastiva, las contribuciones de González Fernández, Lugrís/Guinovart, González Ribao/Kristel Proost, Meliss, Sanmarco y Wotjak abordan cuestiones de carácter teórico así como análisis lexicográficos de más de una lengua, entre las que cabe citar el inglés, el gallego, el alemán y el español.

Las lenguas objeto de estudio en este tomo son, pues, el gallego, el francés, el ladino, el italiano, el catalán, el rumano, el español, el alemán y el occitano. Además, dado el peso que tienen el inglés y el alemán en el ámbito de la lexicografía, también se atiende a la relación de estas lenguas con las románicas ya mencionadas. El mayor número de artículos que se centran en la lengua gallega se debe, como ya se señaló en el tomo I, a la entidad que inspira la elaboración de ambos volúmenes, la Red de Lexicografía RELEX, que se crea en el contexto gallego y con una gran parte de investigadores interesados en el estudio de esta lengua. La prominencia de los estudios sobre el gallego, sin embargo, no supone un menoscabo en ningún caso para las otras lenguas románicas, ya que todas ellas cuentan con representación en ambos tomos, o por lo menos en uno de ellos. Así pues, el volumen en su conjunto pretende proporcionar una visión amplia y actualizada de las principales tendencias que se están siguiendo actualmente en la lexicografía moderna y contrastiva de las lenguas románicas. Esperamos, tal y como se señaló ya en la introducción general a la obra, que ambos volúmenes sean de utilidad para un público numeroso, teniendo en cuenta la diversidad de líneas, lenguas y objetos de estudio abordados, y que todo aquel que busque respuesta a sus preguntas la encuentre. María José Domínguez Vázquez (Universidade de Santiago de Compostela) Xavier Gómez Guinovart (Universidade de Vigo) Carlos Valcárcel Riveiro (Universidade de Vigo)

La marca figurado en la lexicografía gallega monolingüe María Álvarez de la Granja Instituto da Lingua Galega / Universidade de Santiago de Compostela / RELEX

The figurative label in monolingual Galician lexicography Abstract This paper analyses the use of the indication ‘figurative sense’ (fig.) in general-purpose monolingual Galician lexicography. To this end, the introductions to four Galician dictionaries were checked and a study was made of 83 animal-related expressions applied to human beings such as ‘porco’, ‘cacarexar’, ‘can sen dono’, etc. The survey shows up certain shortcomings in the use of the label and brings to light tendencies which might help to account for its distribution in these dictionaries. Keywords Lexicography, Galician, figurative meaning, metaphor, labeling.

1. Objetivos y metodología El objetivo de este trabajo es analizar el uso de la marca de sentido figurado (fig.) en los diccionarios gallegos monolingües de carácter general. Las obras estudiadas son los cuatro diccionarios monolingües modernos con mayor número de entradas: el Dicionario de galego de la editorial Ir Indo (2004), en adelante DG; el Gran dicionario Século 21 da lingua galega (2005), en adelante DS21; el Gran dicionario Xerais da lingua (20092), en adelante GDXL y el Dicionario da Real Academia Galega (2012), en adelante DRAG. 1 Con relación al corpus, consideramos apropiado trabajar con un listado de expresiones figuradas relativamente homogéneo que nos permitiese medir el grado de sistematicidad y coherencia en el empleo de la marca. Dado que contábamos con un corpus de expresiones figuradas animalizadoras del –––––––— 1

De este diccionario, en la edición de 2012, que es la que manejamos, solo existe versión electrónica. También consultamos el Gran dicionario Cumio da Lingua Galega (2004) [GDCLG], pero encontramos plena coincidencia con el DS21 en el tratamiento y las definiciones de las voces analizadas. Por este motivo, las indicaciones que se hagan sobre este último diccionario son aplicables al primero. En el análisis nos referimos al DS21 y no al GDCLG por ser aquella una obra posterior (y con mayor número de entradas). Por otro lado, solo incluimos en el estudio diccionarios que se adecúan a la normativa gallega oficial.

2

María Álvarez de la Granja

ser humano, establecido en González Pereira (2011), optamos por partir de este trabajo para la elaboración de nuestro listado.2 El corpus de González Pereira (2011) está conformado por 398 expresiones que implican, de manera más o menos directa, la animalización del ser humano (botar a lingua a pacer ‘no contenerse en el hablar’, catro gatos ‘muy poca gente’, toupa ‘persona que ve muy poco’, etc.). Dado que se trata de un corpus que recoge expresiones de mayor y menor difusión, extraídas tanto de diccionarios generales como de diccionarios específicos de fraseología, de cara a la elaboración de este trabajo decidimos hacer una selección representativa del total. Habida cuenta de que el diccionario con un menor número de entradas de los analizados es el DRAG (50 000 artículos), optamos por buscar todas las expresiones del corpus de González Pereira (2011) en el citado diccionario y trabajar exclusivamente con las unidades que figuraban en esta obra. El resultado es un listado de 83 expresiones que se puede consultar en el Apéndice que acompaña a este trabajo.3 La variabilidad tipológica, tanto formal como semántica, que se encontraba en el corpus inicial se mantiene en el listado final. Desde el primer punto de vista, encontramos tanto unidades monolexicales (foca, rumiar, touro...) como pluriverbales (botar a lingua a pacer, can sen dono, coma un pito...), las cuales constituyen un 36% del total de expresiones analizadas. Desde el punto de vista semántico, registramos tanto denominaciones de animales (foca, lince, toupa, touro...), a veces con alguna peculiaridad (ave de paso, can sen dono), como voces designadoras de partes del cuerpo (cachola, pata...), de viviendas (cortello, niño...), de acciones o procesos característicos de los animales (cacarexar, escornarse, rumiar...), etc. Incluimos también un pequeño grupo de locuciones cuyo carácter animalizador probablemente sea solo indirecto y derive del hecho de contener en su interior unidades monoverbales que por sí solas ya implican animalización (meter os fociños o meter a pata). Tras mostrar en 2 las indicaciones que se ofrecen en las páginas introductorias de los diccionarios estudiados sobre las llamadas marcas de transición semántica, presentamos en 3 el tratamiento del corpus en las cuatro obras. En 4 ofrecemos una recapitulación de los datos recogidos en los apartados precedentes y acompañamos esta síntesis de una búsqueda de tendencias en la asignación de la marca. Finalizamos con unas reflexiones sobre el valor de la marcación y sobre su aplicabilidad en los diccionarios.

–––––––— 2

3

Ya de Hoyos (1999-2000), así como Borràs y Torner (2006) emplearon con el mismo objetivo, aunque en relación con la lexicografía española, expresiones extraídas del mundo animal.  Eliminamos del corpus el verbo fungar, que formaba parte del listado de 398 expresiones, porque entendemos que los significados figurados asignados no parten necesariamente de una acepción vinculada con el mundo animal. Por otro lado, entendemos el concepto "animalización" en un sentido amplio, que da cabida a las estructuras comparativas. Sobre dicho concepto, puede consultarse Echevarría Isusquiza (2003).

La marca figurado en la lexicografía gallega monolingüe

3

2. La marca de sentido figurado en las introducciones de los diccionarios 2.1. DRAG4 El documento “Características do Dicionario Real Academia Galega (ed. 2012)” proporciona poca información sobre la marca estudiada. De hecho, es el único de los epígrafes del apartado sobre la microestructura, y el único del documento, en el que únicamente se ofrecen ejemplos, pero ninguna explicación. El texto que encontramos es el siguiente (los destacados son del diccionario): 5.6. Información sobre a natureza da acepción: ext., fig. anaerobio - a adx. 3. ext. [Motor, propulsor] que pode funcionar sen aire. Os propulsores anaerobios funcionan fóra da atmosfera. anatematizar v.t. 1. Pronunciar ou lanzar un anatema unha autoridade eclesiástica contra [alguén]. Anatematizárono por herexe. CF excomungar. 2. fig. Reprobar enerxicamente ou condenar moralmente. Anatematizou a súa ideoloxía e comportamento. carburar v.i. 3. fig. e pop. Funcionar. A televisión non carbura, non sei que lle pasa. 4. fig. e pop. Razoar. Ti non carburas.

 En la “Guía para a consulta” la explicación es muy breve: “Antes da definición poden aparecer indicacións acerca da afinidade semántica entre a acepción en cuestión e a precedente, ou acerca da significación orixinaria ou máis próxima (ext., prop., fig.)”. Los ejemplos que se ofrecen son los siguientes:

apostolado s.m. 1. Misión dun apóstolo de predicar e propagar o Evanxeo. O apostolado de S. Paulo. 2. ext. Propaganda e defensa dunha causa ou doutrina, especialmente relixiosa. Facer apostolado a favor da paz. O apostolado dos misioneiros. 3. Representación artística do grupo constituído polos doce apóstolos. No cadro que representaba a Asunción da Virxe aparecía o apostolado aos pés. axigantar v.t. 1. prop. e fig. Facer moi grande ou moito máis grande. Os espellos que había na sala axigantábana. Cada vez axiganta un pouco máis o conto. // v.p. 2. prop. e fig. Facerse grande ou moito máis grande. A sombra dos corpos axigántase.

En el listado de abreviaturas, que figura organizado de acuerdo con el valor de las diferentes marcas, las tres arriba mencionadas (ext., prop., fig.) se encuentran en el apartado final “Outras”.

–––––––— 4

Comenzamos el análisis por el DRAG, por su carácter académico y por ser la obra que nos sirvió de base para la elaboración del corpus final de trabajo (los documentos a que nos referimos en este apartado están todos disponibles en la página web que se indica en la bibliografía final). El orden de los otros tres diccionarios restantes se corresponde con el alfabético, establecido a partir de las siglas empleadas en su denominación.

4

María Álvarez de la Granja

2.2. DG En el apartado “Contido” de la sección “Características xerais”, y dentro de aquel, en el subapartado “Categorías gramaticais” se señala que ademais das categorías gramaticais, tamén se inclúen indicacións semánticas de uso (fig, p ext) e de nivel de lingua (fam, col...). Todas estas informacións poden á súa vez incluírse ao final do artigo ou da acepción correspondente coa abreviatura Tm ‘Tamén’, que indica unha característica adxacente, gramatical ou semántica da principal.

El ejemplo que se emplea para ilustrar lo expuesto no contiene ninguna marca semántica. Por otro lado, en la “Guía de uso” no hay tampoco ninguna indicación sobre este particular y en los listados de abreviaturas las marcas que se recogen son fig y p ext.

2.3. DS21 En el apartado “Guía de uso e consulta” se señala: “Coas abreviaturas fig. e por ext. indícase a afinidade semántica entre a acepción sinalada e a precedente, que é a da significación orixinal ou propia”. Y se muestran los siguientes ejemplos de empleo de cada una de las marcas: taciturno –a (do lat. taciturnu) adx. 1. Que fala pouco, pouco falador. Sin. calado, reservado. Ant. charlatán, falador, falangueiro, locuaz. Cf. silandeiro, silencioso. 2. fig. Que mostra tristeza ou melancolía. Sin. melancólico, triste, tristeiro. tacón (de taco) m. 1. Peza semicircular do calzado, unidade exteriormente unida á parte que corresponde ao talón, para levantalo máis ou menos. Sin. taco. 2. fam. Por ext., zapato con tacón alto.

En el listado de abreviaturas encontramos fig. y por ext.

2.4. GDXL En la sección “Estrutura do dicionario e guía do usuario”, el GDXL incluye un apartado, el 2.5, denominado “Indicacións de uso”. En él se hace referencia simultáneamente a la marcación diasistemática y a las marcas tradicionalmente denominadas de transición semántica: Para marcar as indicacións de uso das acepcións empréganse dúas solucións. En abreviatura, despois do número e en cursiva, indícase se o uso é figurado, familiar ou se resulta da extensión dunha acepción indicada inmediatamente antes. Danse tamén outras indicacións de uso, en concreto as relativas ó campo no que ese lema posúe un determinado uso, as referentes ó seu uso como coloquial ou literario, ou aquelas que indican que con ese significado se trata dunha forma cunha extensión territorial reducida. Todas estas indicacións preceden a definición dese significado.

La marca figurado en la lexicografía gallega monolingüe

5

El ejemplo que se ofrece es el siguiente (los destacados son del diccionario): [baka'nal] adx. 1. Relativo ou pertencente a Baco [deus romano do viño]. // s.f. 2. [Na antigüidade] festa ritual que se celebraba na honra do deus romano Baco [na que se comía e bebía en exceso e se liberaban os instintos sexuais]; orxía. 3. fig. Festa ou banquete no que destacan os actos de euforia e se come e bebe esaxeradamente; orxía. 4 fig. Festa ou reunión entre varias persoas na que se liberan os instintos sexuais; orxía. 5. [Na arte] escena pictórica que representa esa festa ritual dos antigos gregos e romanos; orxía. ETIM. lat. bacchanale(m) ‘lugar onde se reúnen as bacantes’.

BACANAL

En el listado de abreviaturas, las marcas que se recogen son fig. y p.ext.

3. Análisis de las entradas 3.1. DRAG Solo 32 de las 83 expresiones de nuestro corpus (un 38,5%) fueron etiquetadas en el DRAG con una marca de figuración5 (31 con fig. y 1 con ext.). En las siguientes líneas intentamos descubrir si existe una norma o pauta en el sistema de marcación. En primer lugar, llama la atención el hecho de que, excepto en el caso de can sen dono, ninguna de las restantes expresiones pluriverbales fuese objeto de etiquetado con una marca de figuración. Sería interesante saber si este tratamiento de las unidades polilexicales es general al diccionario o una peculiaridad específica de nuestro listado. El análisis de todas y cada una de las entradas de la obra está más allá de nuestro alcance, pero creemos poder afirmar que la inclusión de marcas de transición semántica en las expresiones pluriverbales es muy poco habitual en este diccionario: por poner unos cuantos ejemplos, ninguna de las más de 40 locuciones que figuran en la entrada correspondiente a man fue etiquetada con una marca de este tipo, y lo mismo puede afirmarse de las expresiones recogidas bajo corazón, bajo auga o bajo luz. Encontramos alguna marca fig. (en atar cabos, baixar a cabeza, casa de putas, dar guerra, declarar a guerra, estar vendido, pedra angular o pedra de toque), pero este tratamiento es esporádico y no parece encontrar justificación en ninguna especificidad de las expresiones citadas (por poner un ejemplo comparativo, frente a la etiqueta de baixar a cabeza no encontramos ninguna marca en baixar as orellas). En cualquier caso, lo que se puede afirmar es que tal vez las expresiones complejas recogidas en el diccionario con un doble sentido, literal (o próximo a este) y figurado, sean mejores candidatas para la marca. Afirmamos esto, porque a pesar de que tal tipo de unidades es relativamente poco frecuente en los diccionarios generales, 4 de las 9 locuciones encontradas con marca fig. en nuestro repaso general al diccionario presentan tal característica: –––––––— 5

Empleamos figuración en un sentido amplio, dando cabida tanto a la marca figurado, como a la marca por extensión y a otras similares que implican la presencia de un mecanismo figurativo, sea este de carácter metafórico o metonímico.

6

María Álvarez de la Granja

Can sen dono. 1. Can vagabundo. 2. fig. Persoa sen amigos.6 Casa de putas. 1. pop. Prostíbulo. 2. fig. Lugar de desorde e confusión. Declarar a guerra. 1. Facer saber un país a outro que se considera en estado de guerra con el. 2. fig. Comezar unha loita ou disputa con alguén. Pedra de toque. 1. Variedade de xaspe que se emprega para avaliar a pureza dunha aliaxe ou do ouro e a prata. 2. fig. Aquilo que serve para probar ou confirmar a calidade ou a autenticidade de algo.

Esto no implica que la marca aparezca como norma en expresiones con esta especial polisemia: frente a los casos mencionados, podemos citar ave de paso, que forma parte de nuestro corpus, á man o de cabeza, donde la marca fig. no fue incorporada: Ave de paso. 1. Ave migratoria que só para nun lugar a descansar. 2. Persoa que non se detén nun lugar. Á man 1. Manualmente, sen axuda de máquinas. 2. Preto, ao alcance da man. De cabeza. 1. Coa cabeza por diante. 2. Sen dubidar, sen vacilar.

Por otro lado, el 58% de las expresiones monolexicales recibe marca de figuración. El análisis comparativo de tales unidades muestra que el tratamiento de las marcas, que se puede consultar en las tablas 1a y 1b, no resulta sistemático. En estas tablas y en las siguientes, informamos así mismo de otras posibles marcas (de registro y expresivas) que acompañan a las voces del corpus:7

Animales (nivel básico de categorización y niveles inferiores)

Animales (voces genéricas) Ruidos Otras acciones características de los animales Acciones que se realizan

Unidades sin marcas de figuración Sin Solo Solo marcas registro significado expresivo burro gorila cabalón1 carneiro cabalón2 tigre lince cabrón1 mono cabrón2 porco1 cadela foca raposo

Registro y significado expresivo lagarta

bicho bradar

piar

–––––––— 6 7

A partir de ahora, en todas las entradas con las que ilustremos la exposición eliminaremos la información paradigmática y los ejemplos, cuando existan. Aquí y en las siguientes tablas, algunas voces polisémicas figuran desdobladas y van acompañadas de un número en subíndice que permite diferenciar entre sus diferentes sentidos, los cuales se pueden consultar en el apéndice.

7

La marca figurado en la lexicografía gallega monolingüe Unidades sin marcas de figuración Sin Solo Solo marcas registro significado expresivo con los animales Viviendas Colectivos Partes del cuerpo

Registro y significado expresivo

galiñeiro bandada cachola pata

Tabla 1a: La marcación del DRAG. Unidades sin marcas de figuración

Unidades con marcas de figuración Solo Figuración y  figuración registro porco toupa Animales (nivel básico de 2 hiena categorización y niveles inferiores) papagaio touro víbora animal Animales (voces genéricas) besta paxaro peixe cacarexar1 Ruidos cacarexar2 gruñir ladrar ornear ouvear bufar Otras acciones características de los escornarse animales fozar1 fozar2 remoer rumiar trotar turrar cazar Acciones que se realizan con los pescar animales cortello Viviendas formigueiro niño rabaño Colectivos Partes del cuerpo Tabla 1b: La marcación del DRAG. Unidades con marcas de figuración

Por extensión

fociño

8

María Álvarez de la Granja

Si analizamos los diferentes subgrupos de manera individual, el tratamiento es sistemático en el caso de los verbos que designan acciones características de los animales, pues todos ellos están marcados en el DRAG con la marca fig., así como en el de los que denotan acciones que se realizan con ellos (pues tanto cazar como pescar se etiquetan con fig. y fam.). No ocurre lo mismo con los verbos designadores de ruidos, puesto que, frente al criterio general, bradar y piar carecen de marca de figuración. Problemas similares encontramos con los colectivos (obsérvese el diferente tratamiento de bandada y rabaño), con las partes del cuerpo (solo fociño figura etiquetado, y en este caso con la marca ext.), con las viviendas (compárese galiñeiro con las restantes formas) y muy especialmente con las palabras designadoras de animales. En este caso destaca el hecho de que 10 de ellas reciben marca de figuración (entre las cuales, 4 voces genéricas de las 5 existentes) y 16 no. El análisis de las formas que, dentro de un mismo subgrupo temático, reciben diferente tratamiento no nos conduce a una explicación satisfactoria de este, aunque en algún caso concreto sí podamos encontrar ciertas justificaciones (con independencia de que estas nos parezcan adecuadas o no): así, por ejemplo, en el caso de lince, la ausencia de marca probablemente esté relacionada con la errónea lematización de la voz bajo ser un lince, pues tal y como ya indicamos, el DRAG tiende a no marcar como figuradas las expresiones complejas. Sin embargo, en nuestra opinión, en la mayor parte de los casos solo podemos apelar a la asistematicidad en el empleo de las marcas para explicar su asignación, pues no encontramos razón de ningún tipo que justifique por ejemplo, la presencia vs. ausencia de la marca fig. en las parejas touro y foca, rabaño y bandada, cortello y galiñeiro, víbora y cadela, animal y bicho, etc. La comparación entre formas pertenecientes al mismo subgrupo temático es especialmente elocuente, pero creemos que el contraste y la valoración debe realizarse también globalmente. Salvo posibles casos puntuales, no creemos que exista justificación para que las voces que conforman nuestro pequeño corpus sean tratadas de manera diferente desde el punto de vista de la incorporación de las llamadas marcas de transición semántica.

3.2. DG Del conjunto de 49 expresiones del corpus que figuran en el DG (un 59% del total), solo 10 (un 20,4%) reciben marca de figuración. Se trata de la obra con un menor número de acepciones o entradas recogidas,8 lo que se explica especialmente por la escasez de unidades fraseológicas (de las 30 que conforman el corpus, en este diccionario solo tiene entrada la expresión pel de galiña, a la que no se le asigna marca de ningún tipo). Este hecho no responde a ninguna especificidad de nuestro –––––––— 8

Aquí y en lo sucesivo somos “flexibles” a la hora de considerar que un diccionario recoge una acepción de las 83 presentes en el DRAG, en el sentido de que apelamos no solo a la coincidencia sino también a la proximidad de significados.

9

La marca figurado en la lexicografía gallega monolingüe

corpus, puesto que el DG recoge en general muy pocas locuciones, aunque sí numerosos compuestos sintagmáticos, de tal modo que la búsqueda a través del diccionario no nos permitió encontrar ninguna locución etiquetada con marca de figuración.9 En lo que respecta a las unidades monolexicales, tan solo el 28% es portadora de la marca, con esta distribución:

Animales (nivel básico de categorización y niveles inferiores)

Animales (voces genéricas) Ruidos

Otras acciones características de los animales

Acciones que se realizan con los animales Viviendas

Unidades sin marcas de figuración Sin Solo registro marcas burro gorila cabalón1 lagarta víbora cabrón1 cabrón2 foca hiena lince mono porco1 porco2 raposo animal besta paxaro ladrar ornear ouvear piar bufar fozar1 fozar2 rumiar trotar turrar pescar cazar

niño

Unidades con marcas de figuración Solo figuración cabalón2 cadela papagaio

peixe

Por extensión

bicho

cacarexar1 cacarexar2 gruñir escornarse remoer

cortello

–––––––— 9

Aquí y en los sucesivos diccionarios, la búsqueda se realizó bajo las entradas auga, corazón, luz y man, así como bajo expresiones con doble sentido, literal y figurado (á man, casa de putas, de cabeza, declarar a guerra y pedra angular). Además, llevamos a cabo una búsqueda aleatoria a través de todo el diccionario. En el DG bajo auga, corazón y luz solo descubrimos compuestos sintagmáticos y las pocas locuciones registradas bajo man (man forte o mans mortas) eran las consideradas como de ámbito especializado. Como ya indicamos, ninguna de ellas portaba marca de figuración.

10

Colectivos Partes del cuerpo

María Álvarez de la Granja Unidades sin marcas de figuración Sin Solo registro marcas formigueiro galiñeiro bandada rabaño cachola fociño pata

Unidades con marcas de figuración Solo figuración

Por extensión

Tabla 2: La marcación del DG

Aunque al menos en lo que se refiere específicamente a las marcas de figuración podemos descubrir algunas sistematicidades en ciertos subgrupos (viviendas, colectivos y partes del cuerpo), en el DG, como en el DRAG, encontramos numerosos problemas relativos al tratamiento de las marcas analizadas. En general, resulta muy difícil explicar la presencia de marcas de figuración en las pocas palabras que fueron etiquetadas con ellas, en contraste con la ausencia de marcación en otros casos. Así, por ejemplo, cabalón1 es considerada una expresión figurada, pero no así cabalón2, y lo mismo puede afirmarse de remoer, frente a por ejemplo rumiar; de gruñir, frente a ladrar o frente a ouvear, o de papagaio frente a víbora, por citar algunas palabras valorativas relacionadas con los actos de habla.

3.3. DS21 El 76% de las voces que conforman el corpus de 83 expresiones se recoge en este diccionario. Un 39,7% de ellas recibe la marca fig. En lo que respecta a las expresiones polilexicales, solo una de ellas, ave de paso, está etiquetada con dicha marca. Pero, frente a lo que ocurría en el DRAG, aquí sí encontramos fuera de nuestro corpus un mayor número de unidades fraseológicas introducidas por marcas de figuración, aunque con aparentes asistematicidades.10 En relación con las expresiones monolexicales, un 58,1% de ellas lleva asociada una marca de figuración (25 voces con marca frente a 20 sin ella). Veamos la distribución en la tabla 3: –––––––— 10

Así, por ejemplo, bajo la entrada man, reciben marca fig. las expresiones dar a man, estar en boas mans o traer entre mans, pero no lavar as mans, mans limpas o coas mans na masa, entre otras. De modo similar, bajo piedra encontramos marcadas abrandar as pedras, menos dá unha pedra, non deixar pedra por mover y non deixar pedra sobre pedra, frente a, por ejemplo, arrincar pedras con dentes, quedar de pedra o tirar a pedra e agachar a man, sin marcas. Por otro lado, no encontramos una especial tendencia a marcar la segunda acepción de expresiones polisémicas, con doble valor literal y figurado.

11

La marca figurado en la lexicografía gallega monolingüe Unidades sin marcas de figuración Sin marcas

Solo registro cabrón1 lince gorila

Animales (voces genéricas)

burro mono porco111 porco2 toupa12 [animal]13 [besta]14

Ruidos

bradar

Otras acciones características de los animales Acciones que se realizan con los animales Viviendas

fozar2 remoer15

Animales (nivel básico de categorización y niveles inferiores)

Solo significado expresivo lagarta

paxaro

Unidades con marcas de figuración Solo Figuración y figuración registro cabrón2 tigre touro víbora [animal] [besta] bicho peixe cacarexar2 gruñir ladrar ornear ouvear escornarse fozar1 turrar cazar pescar

trotar

niño

cortello formigueiro galiñeiro bandada rabaño

Colectivos Partes del cuerpo

bufar rumiar

fociño pata

cachola

Tabla 3: La marcación del DS21

–––––––— 11 12 13

14

15

En esta acepción, porco remite a porcallán. La palabra aparece recogida en la expresión parecer unha toupa. El DS21 recoge dos acepciones vinculables con la que figura en el DRAG: la número 7, '(dise da) persoa incapaz, groseira ou moi ignorante', marcada con la etiqueta fig., y la 8, '(dise de) quen emprega a súa forza de forma desmedida ou violenta', sin marca. De ahí la presencia de corchetes que, aquí y en lo sucesivo, indican desdoblamiento en el diccionario analizado de lo que en el DRAG es una única acepción. También aquí se recogen varias acepciones relacionadas con la que figura en el DRAG: 3 '(Dise da) persoa forte e bruta. (...). 5 (Dise da) persoa brusca e violenta. 6 fig. (Dise da) persoa ruda e ignorante'. Nótese que solo la última recibe marca. En esta acepción, remite a rumiar, que sí figura etiquetado con fig. e col.

12

María Álvarez de la Granja

El análisis de la tabla muestra algunos problemas en el tratamiento de las marcas de figuración, especialmente patente en el grupo de los animales y de las acciones características de estos. Por otro lado, llama la atención la ausencia de marca de figuración en las 3 voces designadoras de partes del cuerpo y la diferente consideración que reciben acepciones de una misma voz (vid. en la tabla la distinta marcación de cabrón1 y cabrón2, de fozar1 y fozar2, así como lo indicado en las notas 13 y 14, donde se aprecia la proximidad en las acepciones de animal y besta, a pesar de lo cual la marcación es diferente). Aunque en algunos subgrupos podemos encontrar un tratamiento coherente (colectivos o actividades que se realizan con los animales), no encontramos, en líneas generales, una justificación para la asignación realizada, más allá de posibles asistematicidades en el empleo de las marcas que estamos estudiando. Compárese el distinto tratamiento de fozar, remoer y trotar frente a los demás verbos que expresan acciones características de los animales o las divergencias en la asignación entre tigre, touro o víbora (con fig.) frente a lince o toupa (sin marca).

3.4. GDXL En el caso del GDXL, 41 de las 77 expresiones del corpus recogidas en dicho diccionario fueron etiquetadas con una marca de transición semántica (el 53,2%). Solo un 7% de las acepciones no están presentes en esta obra lexicográfica. Veamos ahora cuáles son las características de esta marcación. Igual que ocurría en los diccionarios anteriores, en las expresiones pluriverbales no figuran marcas, sin que en este caso haya excepciones (la única excepción del DRAG, can sen dono, no tiene entrada en el GDXL). Como en los diccionarios anteriores, llevamos a cabo una comprobación de otras entradas para averiguar si estábamos ante el tratamiento habitual de las unidades fraseológicas y no encontramos ninguna expresión pluriverbal etiquetada con marcas de figuración, ni siquiera entre unidades con doble contenido, literal y figurado. En las siguientes tablas recogemos de forma esquemática el tratamiento de nuestro corpus monolexical en el GDXL. Un 82% de las 50 expresiones monolexicales son etiquetadas con marca de figuración: Unidades sin marcas de figuración Sin Solo Solo significado marcas registro expresivo Animales (nivel básico de categorización y

burro cabrón2 carneiro

cabalón2

Registro y significado expresivo

13

La marca figurado en la lexicografía gallega monolingüe Unidades sin marcas de figuración Sin Solo Solo significado marcas registro expresivo niveles inferiores) Animales (voces genéricas) Ruidos Otras acciones características de los animales Acciones que se realizan con los animales Viviendas Colectivos Partes del cuerpo

Registro y significado expresivo

porco1 [raposo]16 bicho [ouvear]17

pescar

fociño

cachola

Tabla 4a: La marcación del GDXL. Unidades sin marcas de figuración

Unidades con marcas de figuración Solo Figuración y figuración registro cabrón1 Animales (nivel básico de categorización cabalón1 gorila cadela y niveles inferiores) hiena foca lince lagarta mono papagaio [raposo] tigre toupa touro víbora animal Animales (voces genéricas) besta

Por analogía

–––––––— 16

17

Dentro de la misma entrada, la acepción 2 de raposo, bajo la categoría gramatical sustantivo ('persoa astuta e mal intencionada'), incorpora la etiqueta fig., pero la acepción 3 ('que ten habilidade, astucia e malicia para conseguir o que se propón'), categoría gramatical adjetivo, no. En el DRAG figura la acepción '[Persoa] emitir sons agudos e fortes ou palabras en voz moi alta', que se desdobla en dos en el GDXL: 'falar moi alto', marcada como fig., y, a continuación, 'berrar por efecto da dor', sin marca.

14

María Álvarez de la Granja

Unidades con marcas de figuración Solo Figuración y figuración registro paxaro bradar Ruidos cacarexar1 cacarexar2 gruñir ladrar ornear [ouvear] Otras acciones características de los bufar escornarse animales fozar1 fozar2 remoer rumiar trotar turrar Acciones que se realizan con los cazar animales cortello Viviendas formigueiro galiñeiro niño rabaño Colectivos pata Partes del cuerpo

Por analogía

bandada

Tabla 4b: La marcación del GDXL. Unidades con marcas de figuración

Como se puede observar, el tratamiento del GDXL en lo que respecta a la inclusión de marcas de figuración es aparentemente más sistemático que el que encontramos en otros diccionarios, siendo pocos los casos en los que la marca fig. no fue incorporada en la microestructura. No obstante, sí cabe señalar la existencia de unas pocas incoherencias (o aparentes incoherencias), como el diferente tratamiento de fociño y cachola, no marcadas, frente a pata, que sí porta la marca; de bicho, con marca, frente a animal, besta e paxaro, sin ella; de cazar, verbo marcado, al lado de pescar, sin etiqueta; o la peculiar marcación de bandada (p. anal.), con una abreviatura que no figura en la lista inicial del diccionario (rabaño, contrariamente, se etiqueta mediante fig.). En lo que respecta a las voces designadoras de animales y correspondientes al nivel básico de categorización o a niveles inferiores, cabe mencionar la ausencia de marca en burro, cabrón2, carneiro y porco1. Aunque acabamos de mencionar que detectamos relativamente pocas incoherencias en el empleo de marcas de figuración dentro de nuestro corpus, debemos señalar que sí encontramos algunos problemas cuando analizamos el tratamiento de las etiquetas dentro de una misma entrada. Efectivamente,

La marca figurado en la lexicografía gallega monolingüe

15

recopilando los datos para la elaboración de este trabajo, detectamos ciertas inconsistencias al comparar el tratamiento de acepciones que se recogen en el corpus con el de otras que, al no figurar en el DRAG, quedaron excluidas del mismo. Veamos 4 ejemplos representativos: burro [...] adx.. e s. 13. Persoa torpe e de pouca intelixencia. 14. Persoa falta de delicadeza e amabilidade. 15 fig. Persoa moi traballadora. remoer [...] 3. fig. Meditar concienzudamente. 4. Murmurar polo baixo. bufar [...] 2 fig. Manifestar cólera ou desesperación [unha persoa]. [...] 7 Rosmar, protestar entre dentes. pescar [...] 2 fig. Alcanzar o que se persegue. 3 fig. Coller unha enfermidade ou outra cousa que se considera mala. 4 fig. Entender con perspicia algo que se di. 5 Descubrir a alguén que está a facer algo mal ou nunha situación comprometida.

Consideramos que los ejemplos ilustran claramente los problemas existentes: no encontramos justificación para la presencia de la marca en la acepción 2 de bufar, pero no en la 7, en las acepciones 2, 3 y 4 de pescar, pero no en la 5, etc. Recordemos también el diferente tratamiento de los valores de ouvear, comentado en la nota 17, así como de las dos acepciones de la voz cabalón. De este modo, si bien el GDXL parece tener una fuerte tendencia a incluir marcas de figuración, al menos mayor que en los otros diccionarios, no es menos cierto que estas no se introducen con la sistematicidad deseada, lo cual, en nuestro caso concreto, se pone especialmente de relieve al contrastar el diferente tratamiento de acepciones dentro de una misma entrada.

3.5. Breve cotejo de los cuatro diccionarios Las incongruencias señaladas no solo atañen al análisis de los diccionarios individualmente. Si comparamos las cuatro obras lexicográficas, descubrimos que existe poca coincidencia en el empleo de las marcas entre unas y otras, exceptuando el caso de las expresiones pluriverbales que, de manera general, no reciben marca de figuración (aunque tampoco en este caso existe coincidencia total). Así, si nos centramos en la marcación en su conjunto (incluyendo marcas de figuración con sus diferentes subtipos, marcas de registro y marcas de significado expresivo), descubrimos que solo 10 voces coinciden en todos los diccionarios que las incluyen: burro y porco1 (sin marcas) junto a cacarexar2, gruñir y escornarse (solo marca de figuración) en los cuatro diccionarios; raposo (sin marcas), además de papagaio, touro, cacarexar1 y peixe (solo marca de figuración) en los tres diccionarios que les dan entrada y carneiro (sin marcas) en las dos únicas obras que contienen el significado figurado de esta voz. Si el análisis se centra exclusivamente en la presencia o ausencia de marcas de figuración, la situación no cambia mucho, pues a la lista anterior solo podemos añadir cachola, que figura sin marca en los cuatro diccionarios, y piar, que tampoco porta etiqueta en ninguno de los dos diccionarios que le dan entrada. En los demás casos, siempre hay alguna discrepancia entre las obras lexicográficas a la hora de asignar o no marca de figuración.

16

María Álvarez de la Granja

4. Recapitulación y reflexiones finales Como vimos en 2, la información sobre la marca fig. que se ofrece en la parte introductoria de los diccionarios analizados es muy escasa y poco clarificadora. Las obras que las consideran indicaciones de uso las sitúan en una maraña de marcas con funcionalidades muy diversas, que precisarían de un tratamiento individualizado. Aquellos que sí dan cuenta de su especifidad, interpretándolas directamente como marcadoras de afinidad semántica, no precisan en qué consiste esta. En la siguiente tabla ofrecemos de manera esquemática los valores de la marca recogidos en las introducciones: DRAG DS21 DG GDXL

Interpretación del valor de fig. Afinidad semántica y naturaleza de la acepción Afinidad semántica Indicación semántica de uso Indicación de uso

Tabla 5: La interpretación de fig. en las introducciones de los diccionarios

Tanto el DRAG como el DS21 consideran que fig. señala la existencia de afinidad semántica entre la acepción introducida por la marca y la precedente, pero a esta interpretación el DRAG añade que la etiqueta da cuenta de la naturaleza de la acepción encabezada por ella. En ninguno de los dos diccionarios se precisa con más detalle en qué consiste esa afinidad semántica o esa especial naturaleza de la acepción, y lo cierto es que, sin más datos, y tal y como ya vimos en 3, no encontramos justificación para algunas ausencias de la marca fig. (por ejemplo, en lince, en ambos diccionarios) frente a su presencia en otras formas con características similares (por ejemplo, touro). El contraste entre la asignación en ambos diccionarios también muestra discrepancias que resultan chocantes cuando aparentemente se utiliza el mismo criterio clasificador (cf. el diferente tratamiento de niño, paxaro, tigre, trotar, etc.). Ambos diccionarios, aunque de maneras diferentes, aluden en sus comentarios al significado original. El DS21 señala que la acepción precedente a la que porta la marca es, justamente, la acepción en la que se recoge el significado original o propio, mientras que el DRAG afirma que estas marcas también pueden ofrecer indicaciones acerca de la significación originaria o más próxima, con lo que tal vez se intente recubrir el valor de la marca prop. que figura en algunas acepciones. En las dos obras se indica, además, que las marcas vinculan dos acepciones contiguas, pero esto no ocurre siempre así, tal y como se puede comprobar en esta entrada extraída del DRAG: lazo 1. Atadura cunha soa volta ou asa en arco, que se desfai facilmente ao tirar dun dos cabos. 2. Lazada1. 3. Cordón, fita etc., para adorno, na que se fixo unha lazada. 4. Fita apropiada para facer lazadas ou outros adornos. 5. Corda cun nó corredío nun extremo, que se lanza para apresar certos animais, como touros, cabalos etc. 6. Trampa que consiste nun arame, cordel etc., cun lazo corredío nun extremo, onde queda preso o animal. 7. fig. Aquilo que teñen en común dúas persoas ou cousas ou que establece unha conexión entre elas.

La marca figurado en la lexicografía gallega monolingüe

17

La acepción 7, etiquetada mediante fig., no resulta de un valor figurado de 6 ('trampa'), sino de una extensión semántica a partir de la primera acepción de la palabra lazo. Muchos otros ejemplos similares se podrían encontrar tanto en el DRAG como en el DS21, dado que es muy habitual que las acepciones marcadas se sitúen al final de la entrada. Incluso uno de los ejemplos que utiliza el DRAG para ilustrar el empleo de la marca (vid. supra carburar en 2.1) entra en contradicción con la exigencia de un significado precedente con el que se vincule la acepción figurada, pues en tal entrada no se recoge el valor literal del verbo. Por su parte, el GDXL y el DG consideran que la marca fig. es una indicación de uso, pero al no añadir más información (únicamente el DG señala que se trata de una indicación semántica de uso) diluyen su especificidad, pues la sitúan en paralelo a las marcas diasistemáticas, sobre todo de registro, e incluso, en el caso del DG, a la información gramatical. 18 En cualquier caso, encontramos de nuevo aparentes incoherencias en el tratamiento de las marcas tanto internamente como si llevamos a cabo la comparación de los diccionarios entre sí (vid. supra los comentarios y tablas en 3.2 y 3.4). Por otro lado, cabe llamar la atención sobre el hecho de que ninguno de los cuatro diccionarios utilice el término tradicional “marca de transición semántica” o interprete fig. como una etiqueta que señala un proceso evolutivo. Por poco desarrollada que esté, la perspectiva que se ofrece es siempre de carácter sincrónico, o al menos puede interpretarse sincrónicamente: marca de afinidad semántica entre acepciones, etiqueta sobre la naturaleza de estas o indicación de uso. A este respecto debe tenerse en cuenta que en los trabajos metalexicográficos que analizan este tipo de marcas encontramos dos perspectivas de las mismas, una de carácter sincrónico y otra de carácter histórico. De acuerdo con la primera visión, y con más o menos matizaciones, las etiquetas estudiadas señalarían en última instancia la existencia de una relación semántica percibida sincrónicamente entre el significado original y el figurado. De acuerdo con la segunda, las marcas darían cuenta simplemente de una transición semántica entre dos significados, uno originario y otro derivado de este. Así, por ejemplo, Porto Dapena (2008: 46) considera las marcas de transición semántica como elementos de carácter diacrónico (el destacado es del texto original): Tampoco, finalmente, utilizaremos las marcas de transición semántica, esto es, fig[urado] o met[afórico], tan frecuentes en los diccionarios descriptivos, pues se refieren a un aspecto evolutivo que, creemos, se debe pasar por alto en un diccionario sincrónico como el nuestro.

De igual modo, González Pérez (2000-2001: 89) señala que estas marcas son especialmente apropiadas para repertorios históricos. Contrariamente, ya Osselton (1988: 242) parece interpretar la marca como un elemento sincrónico, pues aludiendo a su carácter innecesario en los diccionarios, –––––––— 18

Recuérdese que la marca analizada es explicada en este diccionario dentro del apartado “Categorías gramaticais”.

18

María Álvarez de la Granja

señala que es tarea de los lexicógrafos “to list those meanings, and not to parade speculations about doubtfully perceived connections between them”, donde las “perceived connections” hacen referencia a los vínculos semánticos que los hablantes de una lengua perciben sincrónicamente entre las diferentes acepciones de una palabra. De hecho, en los últimos años han aparecido diferentes trabajos que abogan por la necesidad de reflejar en los diccionarios, muy especialmente en los de aprendizaje, las relaciones semánticas sincrónicas que se establecen entre las acepciones figuradas de una palabra y aquellas de las que derivan, esto es, la motivación o etimología sincrónica (van der Meer 1996: 424) y las marcas de figuración pueden contribuir a esta tarea (Battaner 2010). Así pues, los lexicógrafos gallegos parecen concordar en sus introducciones con esta interpretación sincrónica de las marcas, y también en la asignación práctica, en el sentido de que, de manera general, solo se marcan como figuradas acepciones cuyo vínculo con el significado original es percibido sincrónicamente, sin indagar en la historia de las palabras para descubrir procesos de extensión semántica que ya no son percibidos como tales.19 Ahora bien, si la existencia de un vínculo semántico percibible sincrónicamente entre el significado original y el extendido parece condición cuasinecesaria para la presencia de marcación,20 no es menos cierto que tal vínculo no es condición suficiente, pues, como ya tuvimos ocasión de comprobar, muchas voces que poseen esta característica no reciben marcas de figuración. En buena medida, consideramos que este hecho se explica apelando simplemente a la falta de sistematicidad en la marcación, derivada en parte de la falta de reflexión sobre el valor de las marcas y sobre su aplicación. No obstante, es posible también apreciar ciertas tendencias en su uso, que no dejan de ser eso, comportamientos generales con numerosas excepciones. En primer lugar, al describir el tratamiento en los diferentes diccionarios ya hicimos referencia a la tendencia de los lexicógrafos a no emplear marcas en las –––––––— 19

20

Por poner un ejemplo, ningún diccionario sincrónico gallego marca nunca una voz como cabo, en su acepción 'corda', como una extensión a partir del significado 'parte final', por mucho que la palabra gallega aun conserve este valor. Creemos que esta práctica es común a otras lexicografías y que en realidad, aunque en algunos estudios metalexicográficos las marcas de transición semántica se interpreten como marcas diacrónicas, esta interpretación no se corresponde con la aplicación práctica. Salvo casos puntuales, en los que el lexicógrafo deja traslucir sus conocimientos etimológicos o simplemente perpetúa una marca heredada de la tradición lexicográfica, los autores de diccionarios tienden a etiquetar solo acepciones cuyo vínculo con el significado original se percibe, en mayor o menor medida, en la actualidad, lo que muestra que el criterio que en última instancia funciona a la hora de asignar marcas es el sincrónico y no el etimológico. En los diccionarios también se etiquetan con la marca fig. algunas palabras que solo poseen significado figurado, pero que se pueden vincular fácilmente con el significado literal de sus elementos constitutivos. Es el caso de florecente en el DRAG o de lambecús en el GDXL.

La marca figurado en la lexicografía gallega monolingüe

19

unidades fraseológicas, muy especialmente en el DRAG y en el GDXL.21 De hecho al menos en esta última obra, para la cual no encontramos excepciones, tal vez estemos ante el resultado de una decisión consciente derivada de la alta previsibilidad de la existencia de figuración en este tipo de unidades (que con frecuencia no tienen un significado literal fijo). En este sentido, DeCesaris y Alsina (2002: 88-89) señalan que la inclusión de la marcas en las expresiones pluriverbales quizás sea innecesaria, puesto que la introducción de las unidades como sublemas ya es un indicio de que poseen un valor idiomático. También podemos situar en esta misma línea de reflexión el hecho de que una buena parte de las expresiones marcadas como figuradas en el DRAG son aquellas que tienen doble sentido, literal y figurado. De hecho, Olímpio de O. Silva (2008: 848) señala para la lexicografía española que la asignación de esa marca puede indicar la existencia de un homófono literal, y, por ende, la doble posibilidad de interpretación de la U[nidad]F[raseológica] (por ejemplo, saltar por los aires); y la posibilidad de empleo de una unidad fuera del ámbito específico en el que normalmente se usa (como levantar el sitio).

En segundo lugar, como algunos autores ya han señalado para diccionarios de otras lenguas, las acepciones de carácter abstracto parecen tener más posibilidades de recibir marca que aquellas que designan realidades concretas (González Pérez 2000-2001: 84, Ayto 1986: 50).22 En esta línea, podemos encontrar algunos ejemplos fuera de nuestro corpus: por ejemplo, flor recibe marca de figuración en el DRAG y en el GDXL para la acepción 'o mellor, a parte máis apreciada dunha cousa ou dun conxunto', pero no para la acepción 'doce con forma de flor que se elabora con ovos, leite e fariña'. Lo mismo podemos afirmar de ollo, que en el GDXL recibe marca fig. con el significado de 'capacidade de acerto' o con el de 'atención ou coidado que se pon', pero no con el de 'burato formado na masa do queixo, do pan, dunha esponxa etc.' o con el de 'abrocho, anovo, agromo das plantas'. Borràs / Torner (2006), analizando expresiones figuradas del Diccionario de la Academia Española (1992), extraídas también del mundo animal, consideran que en buena medida la marca da cuenta de usos intensionales de los sustantivos metafóricos, esto es, que las etiquetas acompañan sobre todo expresiones que tienen un uso valorativo (como una buena parte de las que conforman nuestro corpus).23 –––––––— 21

22

23

Como ya indicamos, el DG introduce muy pocas locuciones. El DS21 solo marca una de las expresiones de nuestro corpus, pero en otras entradas del diccionario sí encontramos un cierto número de unidades fraseológicas portadoras de marcas de figuración. Este último autor reproduce un fragmento de la introducción del Longman Dictionary of Contemporary English (1978) en el que expresamente se señala que solo se marcan con fig. transferencias desde lo concreto a lo abstracto. “Lo que defendemos, en resumen, es que los sustantivos marcados como fig. en el DRAE (1992) son sustantivos que se usan en su valor intensional. Dicho en otros términos, mientras que camella aplicado al lomo de tierra que existe entre dos surcos designa una entidad concreta —esto es, el nombre del lomo de tierra es camella—, cacatúa en el sentido de 'mujer que trata de disimular su vejez' describe el conjunto de atributos que posee la

20

María Álvarez de la Granja

Aunque, en el caso de los sustantivos es probable que esto mismo se pueda afirmar de la lexicografía gallega, es necesario señalar que esta explicación no parece aplicable a voces de otras categorías gramaticales que también pueden portar la marca, como es el caso de los verbos, que no se emplean, al menos directamente, para la descripción de un conjunto de atributos. ¿Cuál es el criterio que utilizan entonces los lexicógrafos a la hora de introducir las marcas? Es muy posible que, aunque de manera esencialmente intuitiva, tiendan a etiquetar en mayor medida aquellas acepciones que, empleando la concepción y terminología de Dobrovol'skij y Piirainen (2005: 14), poseen un “image component”, una imagen que pervive en el funcionamiento sincrónico de la palabra: By image component we understand a specific conceptual structure mediating between the lexical structure and the actual meaning of figurative units. Hence, the content plane of a figurative unit not only consists of a pure "meaning", i.e. actual sense denoting an entity in the world, but also includes traces of the literal reading underlying the actual meaning [...]. Figurative units possess a second conceptual level at which they are associated with the sense denoted by their literal form.

Van der Meer (1996, 1997, 1999, 2002) también alude a la presencia del significado literal en el uso figurado: In the case of numerous figuratively used words the non-figurative sense is still synchronically relevant, enriching the figurative use with a 'by-way-of-speaking' dimension. Literal senses, even when much less often used, are essential for a full understanding as long as evidence from corpora proves that this sense is still present (van der Meer 1996: 423).

Esto explicaría, por ejemplo, que en ninguno de los diccionarios analizados la acepción de descubrir 'saber onde está, cal é, como é etc. [algo ou alguén que estaba oculto ou que era descoñecido]' (descubrir un tesouro, descubrir América) aparezca etiquetada con la marca fig., a pesar de que su vínculo con el valor literal 'sacar aquilo que cobre ou oculta total ou parcialmente [algo ou alguén]' (descubrir unha placa, descubrir unha pota) sea evidente tras una rápida reflexión. Estaríamos en este caso ante una metáfora convencional que no funciona en la actualidad como una expresión figurada, pues al codificarla y descodificarla nadie crea lazos con el sentido literal (aunque podamos establecerlos fácilmente, tras una breve reflexión metalingüística). Por otro lado, los substantivos que sí parecen portar “restos” del significado literal (como víbora o rabaño) en buena medida funcionan como elementos valorativos, puesto que muchos de los rasgos del significado literal que se transmiten al significado figurado son precisamente atributos que se emplean para la caracterización de otros seres. Y es aquí donde confluimos con la teoría de Borràs y Torner (2006), que acabamos de comentar. A su vez, la transferencia de atributos hace que muchas de estas voces figuradas se carguen de expresividad, lo que puede –––––––— mujer a la cual se aplica el término, que adquiere, así pues, valor predicativo” (Borràs / Torner 2006: 38-39).

La marca figurado en la lexicografía gallega monolingüe

21

llevar a algunos autores a afirmar que las marcas de transición semántica tienen esencialmente un carácter estilístico (Pérez Castro 2002). Algunas peculiaridades de la asignación de marcas de figuración en nuestro corpus tal vez se puedan explicar apelando a lo que acabamos de indicar. De acuerdo con lo expuesto en 3.5, entre los diferentes diccionarios solo existe plena coincidencia en la marcación de unas pocas palabras. Entre ellas encontramos porco1, burro y raposo, todas ellas sin marcas en ninguna de las obras que las recogen.24 Nótese que estas palabras se pueden usar como adjetivos y que tal hecho pone de relieve un cierto alejamiento con respecto a la acepción de origen y al menos cierta pérdida de la imagen de referencia, lo que, de acuerdo con lo indicado, puede pesar en la ausencia de marca.25 De hecho, en el caso de raposo, el GDXL no emplea la etiqueta en su uso como adjetivo, pero sí en el empleo como sustantivo. En cualquier caso, otras palabras (como animal o besta) se emplean como adjetivos, pero figuran introducidas por la etiqueta fig. en varios de los diccionarios, de modo que, en nuestra opinión, lo que puede influir en la carencia de marca es ese cierto distanciamiento, mayor o menor, entre significado literal y figurado —que tiene su reflejo en la posibilidad de emplear las palabras como adjetivos—, antes que una decisión consciente sobre el empleo de la marca ante ciertos comportamientos categoriales de las voces. Así pues, tal distanciamiento, presentado intuitivamente ante el lexicógrafo, podría conducir en ciertos casos a la no inclusión de la etiqueta, sin que exista, en nuestra opinión, una decisión previa al respecto en el marco de la planificación de la microestructura.26 Después de lo afirmado, no debe sorprender que acepciones con dos de las características señaladas (valor abstracto e imagen) carezcan de marca en los diccionarios. Basta examinar las tablas arriba presentadas para encontrar ejemplos: tigre en el DRAG, carneiro en el GDXL, lince en el DS21 o víbora en DG. Creemos entonces que, a la hora de introducir las marcas de figuración, el lexicógrafo trabaja en buena medida con criterios impresionistas, intuitivos. Las voces que poseen un claro vínculo con el significado literal, sincrónicamente vivo a través de una imagen y en las que se produce un salto conceptual desde lo concreto a lo abstracto son probablemente las expresiones figuradas prototípicas y, por lo tanto, las que más

–––––––— 24 25

26



Los cuatro en el caso de porco1 y burro, y tres en el de raposo. Como señalamos a continuación, la coincidencia de raposo es solo parcial. Pasamos de la identificación de un ser humano con un animal, basada en la percepción de ciertas características similares entre uno y otro (“é un burro”), a la asunción de esas características como significado de la palabra (“é moi burro”), en cuyo caso, la identificación entre ser humano y animal desaparece o al menos, ya no se establece directamente. Por tal motivo, creemos que la posibilidad de emplear tales formas como adjetivos denota un cierto alejamiento de la imagen zoomórfica. Lo que determina claras incoherencias, como el hecho de que, en la entrada burra del GDXL, la acepción 'persoa torpe e de pouca intelixencia' sí aparezca etiquetada con la marca fig.

22

María Álvarez de la Granja

probabilidad tienen de recibir marca.27 No obstante, el hecho de que no exista una reflexión teórica previa sobre la cuestión explica las inconsistencias mencionadas y otras a las que ya hemos hecho referencia en varias ocasiones.28 Una cuestión a la que todavía no hemos aludido es la que tiene que ver con las marcas de registro y de actitud. Llama la atención el escaso número de voces que comparten marcas de este tipo con etiquetas de figuración: tres en el DRAG, cuatro en el GDXL, cinco en el DS21 y ninguna en el DG. Aunque no podemos afirmar que unas y otras se excluyan en la práctica lexicográfica, sí parece cierto que existe una tendencia a rechazar la acumulación de etiquetas, a pesar de que su valor es claramente distinto y a pesar de que es muy frecuente, al menos en el grupo de voces analizadas, la pertenencia de las formas a registros marcados (sobre todo al coloquial) o la presencia de valores expresivos (vid. supra lo indicado al respecto). Por otro lado, esta circunstancia no parece exclusiva de la lexicografía gallega. Así, por ejemplo, Osselton (1988: 244) ya señalaba para la lexicografía inglesa que en cierta medida, la marca figurado “seems to operate merely as one of a battery of alternatives between which stylistic judgements are made”. Con esa “batería de alternativas” el autor hace referencia a etiquetas como informal, “slang” o humorístico. Finalmente, en ninguno de los cuatro diccionarios queda clara la diferencia de valor entre las marcas figurado y por extensión (y por analogía en el GDXL). En lo que se refiere a las introducciones, solo el GDXL parece establecer una distinción implícita y poco clarificadora al mencionar tanto usos figurados como usos que resultan “da extensión dunha acepción indicada inmediatamente antes”, valores que probablemente se podrían atribuir respectivamente a fig. y a p.ext., aunque dicha atribución no se haga explícita (nada se dice sobre la marca p. anal.). Con respecto a la asignación práctica, la presencia de marcas de figuración diferentes a fig. es poco frecuente en nuestro corpus: solo encontramos por extensión en fociño (DRAG) y bicho (DG), así como por analogía en bandada (GDXL). No resulta claro, en cualquier caso, cuál es el valor que se asocia a estas marcas y qué las diferencia de figurado. Las opiniones sobre la utilidad de las llamadas marcas de transición semántica varían de autor a autor: como ya vimos, aquellos que las interpretan como marcas de carácter diacrónico tienden a considerarlas de escaso o nulo valor en un diccionario sincrónico, mientras que entre los que las perciben como marcas sincrónicas

–––––––— 27 28

Los propios lexicógrafos lo reconocen: “the most obvious manifestation of this [figurative uses of language] is where a literal or physical meaning [...] underpins a non-literal or abstract one” (Atkins y Rundell 2008: 287). En cualquier caso, estas no son exclusivas de la lexicografía gallega. Así, por ejemplo, Osselton (1988) ya mencionaba en su trabajo las incoherencias que se podían encontrar en la lexicografía inglesa dentro de una misma obra, así como las divergencias observadas al cotejar diccionarios distintos. También González Pérez (2000-2001) o de Hoyos Puente (1999-2000) señalan estos problemas en relación con la lexicografía española.

La marca figurado en la lexicografía gallega monolingüe

23

encontramos ambos pareceres: van der Meer (1996, 1997, 1999, 2002)29 o Battaner (2010) defienden su presencia en las obras lexicográficas, mientras que Osselton (1988) o Pérez Castro (2002)30 sostienen la opinión contraria. Varios autores (por ejemplo van der Meer en sus diferentes trabajos, o DeCesaris y Alsina 2002) han mostrado como el hecho de informar sobre los vínculos semánticos entre dos acepciones no es baladí, sobre todo en los diccionarios de aprendizaje, pues con ello se da cuenta de la influencia sincrónica del significado y uso literal en el valor y empleo figurado, pero parece evidente que la marcación solo debe llevarse a cabo tras una reflexión previa acerca de lo que se debe marcar y de cómo se debe hacer y después de una valoración de los problemas y sus posibles soluciones. La presencia de una imagen en el funcionamiento sincrónico de las expresiones podría ser un criterio delimitador, pero sería necesario reflexionar previamente sobre las características que llevan a afirmar o a negar la existencia de dicha imagen (Dobrovol'skij / Piirainen 2005), algo que por razones de espacio no podemos abordar aquí.31 No se nos escapa, en cualquier caso, que la tarea es ardua y que solo la práctica lexicográfica a partir de un corpus completo, y no simplemente a partir de una breve selección de ejemplos adecuados a lo que se quiere ilustrar, nos puede dar una respuesta definitiva sobre la posibilidad de integrar de manera consistente las marcas de figuración en los diccionarios. 

Referencias bibliográficas Diccionarios –––––––— 29

30 31

En estos trabajos el autor muestra la utilidad no solo de dar cuenta de la existencia de figuración, sino también de explicitar en las definiciones de los diccionarios de aprendizaje la relación entre sentidos literales y figurados, ofreciendo varios ejemplos ilustrativos. Ayto (1986), aunque con una funcionalidad similar, ofrece un modelo diferente de definición. Puede verse también Baránov / Dobrovols'skij (2009), parte 3 o Echevarría Isusquiza (2003). Este autor (2002: 128) interpreta que la lexicografía no debe ocuparse de estas cuestiones, sino otras ciencias, en especial la crítica literaria. Van der Meer (2002) señala como criterio para considerar una expresión figurada el hecho de que el significado literal, de algún modo, perviva en su uso metafórico. Para este autor, esta pervivencia queda demostrada si la voz, en sus empleos metafóricos, se coloca con otras palabras extraídas del mismo dominio fuente, pero usadas también de manera figurada. DeCesaris / Alsina (2002) añaden a la recurrencia de las colocaciones la de la regencia verbal, de tal modo que los verbos usados figuradamente utilizan las mismas preposiciones que cuando se emplean literalmente. Sin embargo, y dejando a un lado el hecho de que probablemente nos encontramos ante una escala (de mayor o menor figuración) y no ante una oposición binaria (presencia / ausencia de figuración), lo que implica ya una dificultad en el empleo de la marca, estos criterios no nos parecen siempre de fácil aplicación.

24

María Álvarez de la Granja

GDCLG: Pena Martínez, Xosé Antonio (dir.) (2004): Gran dicionario Cumio da lingua galega. Vigo: Edicións do Cumio. DRAG: Real Academia Galega (2012): Dicionario da Real Academia Galega. A Coruña: Real Academia Galega. Disponible en [Consulta: 03/09/2013]. GDXL: Carballeira Anllo, Xosé María (coord.) (20092): Gran dicionario Xerais da lingua. Vigo: Xerais. DG: Domínguez Dono, Xesús et al. (2004): Dicionario de galego. Vigo: Ir Indo. DS21: Pena Martínez, Xosé Antonio (dir.) (2005): Gran dicionario Século 21 da lingua galega. Vigo: Galaxia / Edicións do Cumio.

Estudios Atkins, B.T. Sue / Rundell, Michael (2008): The Oxford guide to practical lexicography. Oxford: Oxford University Press. Ayto, John (1988): «Fig. leaves. Metaphor in dictionaries», en Mary Snell-Hornby, ed., ZüriLEX’86 proceedings. Papers read at the EURALEX International Congress, University of Zürich, 9-14 September 1986. Tübingen: Francke Verlag, 49-54. Baránov, Anatolij / Dobrovols'skij, Dmitrij (2009): Aspectos teóricos da fraseoloxía. Santiago de Compostela: Centro Ramón Piñeiro para a Investigación en Humanidades. Battaner, Paz (2010): «La marca figurado como marca de uso», en Elisenda Bernal / Sergi Torner / Janet DeCesaris, eds., Estudis de lexicografia 2003-2005. Barcelona: Institut Universitari de Lingüística Aplicada. Universitat Pompeu Fabra, 39-60. Borràs, Laura / Torner, Sergi (2006): «De nuevo sobre la marca figurado en los diccionarios», en Elisenda Bernal / Janet DeCesaris, eds, Palabra por palabra: estudios ofrecidos a Paz Battaner. Barcelona: Institut Universitari de Lingüística Aplicada. Universitat Pompeu Fabra, 34-45. DeCesaris, Janet / Alsina, Victória (2002): «The Representation of Figurative Senses in Learner’s Dictionaries», en Henrik Gottlieb / Jens Erik Mogensen / Arne Zettersten, eds., Symposium on Lexicography X. Proceedings of the Tenth International Symposium on Lexicography May 4-6, 2000 at the University of Copenhagen. Tübingen: Max Niemeyer, 779). Dobrovols'skij, Dmitrij / Piirainen, Elisabeth (2005): Figurative Language: Cross-cultural and Cross-linguistic Perspectives. Amterdam: Elsevier. Echevarría Isusquiza, Isabel (2003): «Acerca del vocabulario español de la animalización humana», Círculo de lingüística aplicada a la comunicación 15. Disponible en [Consulta: 03/ 09/2013]. González Pereira, Andrea (2011): Os procesos de animalización no galego: a caracterización do ser humano a través do mundo animal. Vigo: Universidade de Vigo (Trabajo de Fin de Máster inédito). González Pérez, Rosario (2000-2001): «La marca figurado en los diccionarios de uso», Revista de Lexicografía, VII, 77-90. Hoyos, José Carlos de (1999-2000): «La marca de transición semántica: sentido figurado», Revista de Lexicografía, VI, 73-105. Olímpio de O. Silva, Mª Eugênia (2008): «Las marcas de transición semántica en el tratamiento de las locuciones verbales», en Dolores Azorín Fernández et al., eds., El diccionario como puente entre las lenguas y culturas del mundo. Actas del II Congreso Internacional de Lexicografía Hispánica. Alicante: Universidad de Alicante, 843-849.

La marca figurado en la lexicografía gallega monolingüe

25

Osselton, Noel E. (1988): «The Dictionary Label ‘Figurative': Modern Praxis and the Origin of a Tradition», en Karl Hyldgaard-Jensen / Arne Zettersten, eds., Symposium on Lexicography III. Proceedings of the Third International Symposium on Lexicography, May 14-16, 1986, at the University of Copenhagen. Tübingen: Max Niemeyer, 239-249 (recopilado en Noel E. Osselton, Chosen words: past and present problems for dictionary makers. Exeter: University of Exeter, 1995). Pérez Castro, Lois C. (2002): «Acerca de los usos y sentidos figurados y de su tratamiento lexicográfico», Revista Española de Lingüística, 32/1, 123-128. Porto Dapena, José-Álvaro, dir., (2008): El Diccionario “Coruña” de la lengua española actual: planta y muestra. A Coruña: Universidade da Coruña. van der Meer, Geart (1996): «The Treatment of Figurative Meanings in the English Learner’s Dictionaries (OALD, LDOCE, CC and CIDE)», en Martin Gellerstam et al., eds., Euralex ‘96 Proceedings. Papers submitted to the Seventh EURALEX International Congress on Lexicography in Göteborg, Sweden. Göteborg: Göteborg University, 423-429. — (1997): «Four English Learner’s Dictionaries and Their Treatment of Figurative Meanings», English Studies, 78/6, 556-571. — (1999): «Metaphors and dictionaries: the morass of meaning, or how to get two ideas for one», International Journal of Lexicography, 12/3, 195-208. — (2002): «Metaphors: How Do Dictionaries Scramble out of this Morass of Meaning?», en Henrik Gottlieb / Jens Erik Mogensen / Arne Zettersten, eds., Symposium on Lexicography X. Proceedings of the Tenth International Symposium on Lexicography May 4-6, 2000 at the University of Copenhagen. Tübingen: Max Niemeyer, 231-242.

Apéndice. Corpus de expresiones analizadas Ofrecemos aquí el listado de las 83 expresiones que conforman el corpus, con su significado. La definición es la que figura en el DRAG. En el caso de que encontremos para una misma palabra dos acepciones próximas, que en el trabajo de González Pereira (2011) se agrupan bajo un único lema, presentamos las dos definiciones juntas (vid. por ejemplo víbora). En lo que respecta al lema, este no tiene que corresponder necesariamente con el proporcionado en el DRAG. En algún caso suprimimos algún elemento que consideramos innecesario (por ejemplo, en ser un can vello, que lematizamos como can vello)32 y otras veces unificamos variantes, no siempre presentes en el DRAG —por ejemplo meter o(s) fociño(s)—. En el caso de las construcciones comparativas, incluimos entre corchetes la base de comparación, que algunos diccionarios incorporan en el lema y otros no.  Expresión figurada

á pata coxa

Significado atribuido en el DRAG

Cunha perna encollida e saltando sobre a outra

–––––––— 32

Esto explica algunas incoherencias entre el lema (por ejemplo can vello) y la definición (que en este caso se corresponde con la de una locución verbal: 'ser astuto ou precavido ou ter moita experiencia...').

26

María Álvarez de la Granja

Expresión figurada

Significado atribuido en el DRAG

a patas

Andando

á(s) catro patas

Apoiando no chan os pés, os xeonllos e as mans

animal

Que actúa sen facer uso da razón, sen ter en conta os sentimentos dos demais e baseándose na forza física

ave de paso

Persoa que non se detén nun lugar

bandada

Grupo numeroso de persoas que se moven xuntas

besta

Persoa ignorante e bruta para a que só conta a forza física

besta negra

Persoa ou cousa que provoca especial rexeitamento ou que constitúe a principal dificultade para algo

bicho / becho

Persoa que ten cara aos demais a brutalidade dun bicho

bo polo

Expresión que indica desaprobación máis ou menos severa da actitude, comportamento etc., dun rapaz ou dun home

boi de palla

Home sen malicia, moi bondadoso e de carácter apracible

botar a lingua a pacer

Criticar [algo ou a alguén] sen coñecelo suficientemente

bradar

[Persoa] lanzar sons agudos e fortes ou palabras en voz moi alta

bufar

Amosar un grande enfado con bufidos ou con certos xestos ou expresións

burro

Que ten poucos coñecementos ou ten dificultades para comprender as cousas

cabalón1

Persoa corpulenta e ruda

cabalón2

Muller con aparencia ou modos de home

cabrón1

Home ao que a súa parella lle é infiel, particularmente cando o consente

cabrón2

Persoa desprezable e maliciosa

cacarexar1

Ponderar esaxerada ou reiteradamente as accións ou as calidades de [algo ou alguén, especialmente as propias]

cacarexar2

Difundir indiscretamente

cachola

Cabeza das persoas

cadela

Muller irascible ou de mal xenio

La marca figurado en la lexicografía gallega monolingüe

Expresión figurada

27

Significado atribuido en el DRAG

[caer] coma moscas

Morrer en gran cantidade

can sen dono

Persoa sen amigos

can vello

Ser astuto e precavido ou ter moita experiencia nun determinado asunto ou en xeral

carne / pel de galiña

Alteración da pel producida por una sensación de frío ou arrepío

carneiro

Carneirán (= que persiste nunha idea ou actitude)

catro gatos

Moi pouca xente

cazar

Sorprender [alguén] nalgunha acción, polo xeral considerada como mala, ou nunha situación en que non lle gustaría ser visto

coma o can e o gato

Aplícase aos que se levan mal

cortello

Lugar sucio e desordenado

de fociños

Dando coa cara contra algo nunha caída ou golpe

escornarse

Esforzarse moito, física ou intelectualmente, para conseguir algo

estarricar / estirar a pata

Morrer

foca

Persoa que está moi gorda

fociño

Parte da cara das persoas que comprende a boca e o nariz ou, nalgúns sitios, só o nariz

formigueiro

Sitio onde hai moita xente

fozar1

Andar en algo alterando a súa disposición

fozar2

Traballar en calquera cousa a medias e sen maña

galiñeiro2

Lugar onde se dan moitos berros e voces, sendo difícil falar

gorila

Persoa de gran complexión física, especialmente un gardacostas ou un vixiante dun lugar público

gruñir

[Persoa, algún animal] emitir sons que manifestan enfado

hiena

Persoa cruel e desprezable

ladrar

Falar a berros, con enfado ou cólera

28

María Álvarez de la Granja

Expresión figurada

Significado atribuido en el DRAG

lagarta

Muller maliciosa

lamber o fociño

Pasar a lingua polos labios unha ou varias veces

lince

Ter moita intelixencia, habilidade ou astucia

meter a pata

Intervir de maneira equivocada nun asunto

meter o(s) fociño(s)

Intervir alguén nun asunto alleo sen que lle sexa pedido, causando molestia

meter os cans pola / na bouza

Provocar enfrontamento

[mollarse / poñerse] coma un pito

Moi mollado

mono

Persoa que fai o mono ou monadas

[morrer] coma moscas

Caer coma moscas

[morrer] coma un can

Aplicado a unha persoa, con verbos como vivir, morrer, tratar etc., significa abandonado, sen coidados

mosca morta

Aplícase á persoa que baixo unha aparencia de bondade agacha malas intencións, ou á apoucada da que se sospeita simulación

niño

Lugar onde se realiza calquera actividade non legal ou que precisa ser ocultada

ornear

Chorar queixándose

ouvear

[Persoa] emitir sons agudos e fortes ou palabras en voz moi alta

papagaio

Persoa que fala moito

pata

Perna dunha persoa

paxaro

Home astuto e cauteloso

peixe

Persoa que actúa con mala intención

pescar

Sorprender [alguén] nunha acción, polo xeral considerada como mala

piar

[Persoa] anhelar moito algo ou a alguén

La marca figurado en la lexicografía gallega monolingüe

Expresión figurada

29

Significado atribuido en el DRAG

[pobre] coma as arañas

Estar moi pobre

poñerse / pórse de cornos

Enfadarse

porco1

Que non se limpa e que non limpa o seu hábitat, ou que ensucia máis do normal ou do necesario

porco2

Que actúa ou se comporta sen escrúpulos, sen nobreza, mesmo prexudicando os demais

rabaño

Conxunto de persoas en relación a alguén que as guía

raposo

Persoa astuta

remoer

Dar voltas e máis voltas

rumiar

Pensar moito en [unha cousa], darlle moitas voltas no pensamento

[sangrar] coma un carneiro

Sangrar abundantemente

¡tarde piaches! (pito serodio)

Expresión que indica que alguén se decidiu moi tarde por algo, cando xa non ten posibilidades de conseguir o que se propón

tigre

Persoa cruel e sanguinaria

torcer / virar o fociño

Manifestar desacordo con algo

toupa

Persoa que ve moi pouco

touro

Home forte e robusto

[tratar] coma un can

Aplicado a unha persoa, con verbos como vivir, morrer, tratar etc., significa abandonado, sen coidados

trotar

Andar moi á présa, pero sen correr

turrar

Insistirlle moito a unha persoa en algo / Amosarse turrón (= que porfía nas súas ideas ou actitudes e non escoita razóns, mesmo ante a evidencia de estar equivocado ou obrando mal)

víbora

Persoa ruín e desleal / Persoa maledicente

Lexicografía bilingüe práctica basada en corpus: planificación y elaboración del Dicionario Moderno Inglés-Galego Alberto Álvarez Lugrís Universidade de Vigo / Grupo TALG / Red de Lexicografía RELEX

Xavier Gómez Guinovart Universidade de Vigo / Grupo TALG / Red de Lexicografía RELEX

Corpus-based practical bilingual lexicography: planning and building the Dicionario Moderno Inglés-Galego Abstract One of the lines of research of the TALG Group (Galician Language Tecnologies and Applications) of the University of Vigo is the generation of bilingual dictionaries from lexical equivalences identified in a translation parallel corpus aligned at sentence level. In a sense, the process consists of converting a parallel corpus into a new corpus tagged and aligned down to the word level. In this paper we will describe the compilation of the Dicionario moderno inglésgalego from the creation of the corpus to the building of the dictionary. Keywords corpus-based lexicography, parallel corpora, bilingual dictionaries, English, Galician.

1. Introducción Los corpus paralelos1, formados por compilaciones digitales de textos en su versión original y traducida, permiten observar directamente la realidad lingüística plasmada en las traducciones, facilitando el estudio empírico de muchos fenómenos traductológicos que no sería posible examinar de otro modo sin grandes dificultades. –––––––— 1

Este trabajo fue financiado por el Ministerio de Economía y Competitividad, dentro del proyecto Adquisición de escenarios de conocimiento a través de la lectura de textos: Desarrollo y aplicación de recursos para el procesamiento lingüístico del gallego (SKATeRUVIGO) (ref. TIN2012-38584-C06-04); y por la Consellería de Cultura, Educación e Ordenación Universitaria de la Xunta de Galicia, gracias a la convocatoria de Ayudas para la consolidación y estructuración de unidades de investigación competitivas del Sistema Universitario de Galicia, dentro de la Rede de Lexicografía (Relex) (ref. CN 2012/290) y de la Rede de Tecnoloxías e análise dos datos lingüísticos (ref. CN 2012/179).

32

Alberto Álvarez Lugrís / Xavier Gómez Guinovart

Con todo, los corpus paralelos no solo permiten acercarse a los estudios de traducción y de lingüística comparada con una perspectiva realista inimaginable antes de su compilación, sino que también posibilitan el desarrollo de aplicaciones lingüísticas y de tecnologías de la lengua que basan su funcionamiento en los datos suministrados por los corpus, al tiempo que ofrecen diversas posibilidades de explotación en el ámbito del procesamiento del lenguaje natural. Los resultados más importantes de la explotación de estos corpus se obtienen en las aplicaciones computacionales relacionadas con la traducción y la lexicología, en los campos de la traducción automática estadística (Koehn 2010), de las memorias de traducción y de la traducción automática basada en ejemplos (Carl / Way 2002), de la extracción léxica para recuperación de información multilingüe (Brown et al., 2000), de la extracción de terminología bilingüe (Gómez Guinovart 2012) y de la extracción de léxico bilingüe (Simões 2008). En este último campo de trabajo, en el que se enmarca nuestra investigación, el objetivo es la generación de diccionarios bilingües basados en las equivalencias léxicas de traducción identificadas en un corpus paralelo, en el que previamente se han establecido a nivel de frase u oración las correspondencias de traducción. En cierto sentido, el problema central de la extracción de léxico bilingüe consiste en convertir un corpus paralelo etiquetado con los alineamientos (es decir, con las equivalencias de traducción) a nivel de oración, en un corpus etiquetado paralelo con los alineamientos a nivel de palabra. Para lograr esta tarea, se han desarrollado diversos algoritmos, gran parte de ellos basados en medidas estadísticas relacionadas con la asociación mutua o con la coaparición de los elementos léxicos en las frases u oraciones bilingües alineadas (Och / Ney 2003), y mostrando todos un margen de error nada desdeñable en los resultados (Tiedemann 2003) debido a la naturaleza intrínsecamente “no literal” de la traducción y a otras dificultades relacionadas con las características del corpus, como la distancia lingüística entre las lenguas implicadas, el tipo de textos o el estilo de la traducción. En este artículo presentaremos de manera global el trabajo llevado a cabo para realizar el Dicionario Moderno Inglés-Galego (DMIG), desde la compilación del corpus paralelo fuente de la información lexicográfica al proceso informatizado de extracción de la información léxica, y a la labor lexicográfica práctica de elaboración del diccionario bilingüe. El DMIG es un diccionario basado en la colección de textos ingleses traducidos al gallego que forma parte del Corpus CLUVI y constituye, a nuestro entender, el primer diccionario basado en corpus de la lexicografía gallega. Todas las palabras inglesas que aparecen en sus entradas están documentadas en los textos en inglés traducidos al gallego recopilados en el corpus paralelo CLUVI. Asimismo, todas las traducciones gallegas recogidas en el diccionario para esas palabras son traducciones reales identificadas en las versiones gallegas de los textos ingleses del corpus. Finalmente, para cada traducción identificada, el diccionario suministra un ejemplo real de su uso tal como está documentado en el corpus.

Lexicografía bilingüe práctica basada en corpus

33

2. El Corpus CLUVI El CLUVI (Corpus Lingüístico da Universidade de Vigo), elaborado por nuestro grupo de investigación de la Universidad de Vigo, es un conjunto de corpus paralelos de unos 23 millones de palabras, formado principalmente con traducciones al gallego o del gallego, accesibles para consulta en la web desde septiembre de 2003 en la dirección . Ciñéndonos únicamente a las secciones del CLUVI que incluyen traducciones con el gallego, el Corpus CLUVI está formado por seis corpus paralelos principales pertenecientes a cuatro registros especializados de los ámbitos jurídico-administrativo, literario, de la informática y de divulgación científica; y a cinco combinaciones lingüísticas diferentes: bilingüe gallego-español, bilingüe inglés-gallego, bilingüe francés-gallego, tetralingüe inglés-gallego-francésespañol y tetralingüe español-gallego-catalán-euskera. Estos seis corpus, con los datos actuales sobre su extensión, son el Corpus Lega de textos jurídicoadministrativos gallego-español (6 582 415 palabras), el Corpus Logaliza de localización de software inglés-gallego (3 706 242 palabras), el Corpus Unesco de divulgación científica inglés-gallego-francés-español (3 724 620 palabras), el Corpus Tectra de textos literarios inglés-gallego (2 407 539 palabras), el Corpus Fega de textos literarios francés-gallego (1 863 95 palabras), y el Corpus Consumer españolgallego-catalán-euskera de información sobre salud y consumo (5 586 431 palabras). El corpus jurídico Lega gallego-español contiene material textual bilingüe de dos vertientes especializadas del lenguaje jurídico muy próximas, más bien diferenciadas: por una parte, el ámbito administrativo, representado por 30 ejemplares íntegros del Diario Oficial de Galicia (DOG) publicados entre 2000 y 2005; y por otra parte, el ámbito legislativo, representado por un conjunto de 76 textos publicados entre 1978 y 2008 con legislación diversa de ámbito nacional (publicada en el DOG), estatal (publicada en el Boletín Oficial del Estado - BOE) y supraestatal (Constitución Europea). Más concretamente, las leyes y legislaciones publicadas en el BOE y en el DOG pertenecen a distintos campos dentro del ámbito legislativo: al campo judicial, al ámbito de la Constitución y de los Estatutos, al campo económico, al campo social, al derecho ambiental, al derecho informático y al ámbito relacionado con sectores específicos (universidades, pesca, circulación, etc.). Los textos administrativos suman un total de 2 394 407 palabras, mientras que los textos legislativos representan un total de 4 188 008 palabras. Por otra parte, el Corpus Logaliza de localización de software inglés-gallego contiene la localización al gallego del paquete ofimático OpenOffice, del sistema operativo Windows XP de Microsoft, del navegador Firefox y de los escritorios Gnome y KDE para Linux; el Corpus Unesco inglés-gallego-francés-español de divulgación científica está constituido por 32 ejemplares íntegros de la revista mensual The Unesco Courier publicados entre 1998 y 2001; y el Corpus Consumer español-gallego-catalán-euskera de información sobre consumo incluye 1 036 artículos de la revista Consumer Eroski publicados entre 1998 y 2005. Finalmente, el corpus literario Tectra inglés-gallego recopila 50 textos literarios completos en lengua inglesa con sus traducciones para el gallego; y el corpus literario Fega francésgallego, 29 textos literarios completos en lengua francesa con sus traducciones para

34

Alberto Álvarez Lugrís / Xavier Gómez Guinovart

el gallego. Los corpus Tectra inglés-portugués (875 595 palabras), e inglés-español (122 251 palabras), aún en desarrollo, incluyen los textos literarios bilingües del Tectra inglés-gallego en su traducción al portugués y al español. El CLUVI incluye también otros seis corpus paralelos del gallego en distintas fases de elaboración, en particular, el Corpus Egal de economía gallego-español (718 642 palabras), el Corpus Dega alemán-gallego (366 038 palabras), el Corpus Veiga de subtitulación inglés-gallego (294 714 palabras) (vid. Sotelo y Gómez Guinovart 2012), el Corpus Turigal de turismo español-gallego (325 389 palabras), el Corpus literario Galea gallego-español (162 795 palabras) y el Corpus literario Pega portugués-gallego (68 431 palabras). Otros corpus paralelos fruto de proyectos realizados en el seno de nuestro grupo de investigación en el ámbito del Corpus CLUVI, que no incluyen directamente el gallego como objeto de estudio, son el Corpus Palop de literatura poscolonial portugués-español (566 590 palabras) (Malvar 2007) y el Corpus Turigal de turismo portugués-inglés (1 285 764 palabras) (Moreira 2011). Asimismo, cabe destacar que a través de la interfaz de consulta del Corpus CLUVI se puede acceder a la consulta del Corpus Lege-Bi euskera-español de textos jurídico-administrativos (2 384 053 palabras), desarrollado por el grupo DELi de la Universidad de Deusto. En la siguiente sección presentaremos las características generales de la anotación del Corpus CLUVI, así como las soluciones adoptadas en su desarrollo para la codificación de las equivalencias de traducción cuando la correspondencia entre original y traducción no es directa por causa de la omisión, adición o reordenamiento de frases en la traducción.

2.1. Criterios de anotación El alineamiento de los textos paralelos se almacena en el CLUVI en el formato TMX (Translation Memory eXchange), el estándar para la codificación en XML de memorias de traducción independientemente de la aplicación utilizada (Savourel / Lommel 2005). Las memorias de traducción se utilizan sobre todo en los programas de traducción asistida por ordenador y, más comúnmente, en los entornos de traducción como SDL Trados, DéjàVu, Wordfast, Transit o Passolo, este último más orientado a la localización de software. Estos asistentes informáticos para la traducción integran en un mismo producto un procesador de textos especialmente diseñado para traducir, un conjunto de diccionarios bilingües, herramientas para la gestión terminológica (para la creación y mantenimiento de glosarios, la consulta automática de glosarios durante la traducción y la extracción automática de terminología) y una utilidad de gestión de memorias de traducción. La memoria de traducción es una base de datos donde se almacenan la versión original y traducida de cada una de las frases que se traducen en el marco de la aplicación. Cuando se está traduciendo una frase, el programa detecta automáticamente si esa misma frase u otra similar ya fue traducida con anterioridad, con el objeto de que se pueda reutilizar la traducción sin necesidad de reescribirla completamente, haciendo las modificaciones que se consideren más idóneas. En 1997 la industria creó e impulsó

Lexicografía bilingüe práctica basada en corpus

35

el estándar TMX para permitir el intercambio de memorias de traducción entre los distintos programas de traducción asistida. Con ciertas matizaciones, un corpus paralelo alineado equivale a una memoria de traducción y, en la práctica, existe un número considerable de corpus paralelos alineados codificados en TMX, con la ventaja adicional de que los corpus así etiquetados pueden ser empleados como memorias de traducción para alimentar los programas de traducción asistida (tal y como se propone en Simões et al. 2004). La unidad básica de segmentación para el alineamiento de los bitextos del Corpus CLUVI es la frase ortográfica del texto original. Por tanto, la correspondencia entre el texto original y la traducción va a ser siempre del tipo 1:n. Con frecuencia, a una frase del original le corresponde una frase de la traducción (1:1). Sin embargo, se dan también casos en los que una frase del original no se traduce (1:0), o en los que a una frase del original le corresponde en la traducción media frase (1:1/2) o dos frases (1:2), o incluso en los que una frase de la traducción no se corresponde con ninguna frase del original (0:1). Aparte de eso, la traducción implica a veces desplazamientos de frases enteras, o movimientos de fragmentos de frases del original a otras frases en la traducción. Estos movimientos se reordenan en la sección de textos traducidos de los corpus paralelos del CLUVI para cumplir el requisito del alineamiento 1:n, que preserva la integridad y el orden de las unidades de traducción del texto original. Este criterio es crucial cuando se aplica al procesamiento de corpus plurilingües de más de dos lenguas, debido a que las frases del original son las que, actuando a modo de intermediarias, nos permiten establecer las correspondencias entre las frases equivalentes de las distintas lenguas. La especificación TMX no tiene en cuenta la codificación de estos aspectos de las traducciones, ya que fue diseñada para el almacenamiento e intercambio de memorias de traducción, y no para la representación de segmentos equivalentes en corpus paralelos. El sistema de codificación del CLUVI utiliza una versión adaptada de algunas de las etiquetas que forman parte de la especificación TMX para representar las correspondencias que no son 1:1 y los reordenamientos codificados en el corpus paralelo. Los aspectos traductológicos codificados en el Corpus CLUVI, en concreto, las omisiones, adiciones y reordenamientos, son etiquetados mediante una versión adaptada de los elementos e que forman parte del estándar TMX. En la omisión, hay una porción del texto de partida que no tiene correspondencia en el texto de llegada, es decir, una frase o parte de una frase no es traducida. La omisión se codifica en los corpus paralelos del CLUVI con el elemento . De acuerdo con la especificación TMX, el elemento (de nombre derivado del inglés highlight) “delimits a section of text that has special meaning, such as a terminological unit, a proper name, an item that should not be modified, etc.” (Savourel / Lommel 2005). En la especificación del CLUVI, basada en la TMX, el elemento marca en el texto de partida el elemento que se omite en el texto de llegada. Indicamos este uso de la etiqueta mediante un atributo type caracterizado con el valor de “supr”, tal como ejemplificamos en (1), donde (1a) es el bitexto inglés-gallego y (1b) su codificación en el formato de representación del CLUVI:

36

Alberto Álvarez Lugrís / Xavier Gómez Guinovart

(1) a. [en] 'Hello', I said. [gl] -Ola. b.

'Hello',I said. -Ola.

La adición en la traducción implica una inserción de fragmentos en el texto de llegada que no tienen correspondencias en el texto de partida. La adición también se codifica en el CLUVI con el elemento , haciendo que este indique el fragmento insertado en la traducción. Este uso de la etiqueta se distingue mediante un atributo type caracterizado con el valor de “incl”. El fragmento añadido se incorpora a la unidad de traducción en la que está insertado. Cuando el nuevo fragmento es una oración (o una secuencia de oraciones), se incorpora bien a la unidad de traducción anterior, bien a la siguiente, de acuerdo con su contexto, respetando así el criterio de alineamiento 1:1, como se ilustra en el ejemplo (2): (2) a. [en] 'Hello.' [gl] -Ola - dixen. b.

'Hello.'

-Ola - dixen.

El reordenamiento implica desplazamientos de frases enteras o movimientos de fragmentos de frases del original a otras frases en la traducción. Estos movimientos se reordenan en la sección de textos traducidos de los corpus paralelos del CLUVI para cumplir el requisito del alineamiento 1:n, que preserva la integridad y el orden de las unidades de traducción del texto original. El reordenamiento se codifica en el CLUVI mediante una combinación de los elementos y . Anotamos el fragmento o la oración movida mediante un elemento que incluye un atributo type con valor de “reord”y un atributo x con un valor numérico que actúa de índice. Por otra parte, indicamos con un elemento el lugar en el texto que ocupaba originalmente el elemento desplazado. Según la especificación TMX, el elemento (o placeholder) se utiliza “to delimit a sequence of native standalone codes in the segment. Standalone codes are codes that are not opening or closing of a pair, for example empty elements in XML” (Savourel / Lommel 2005). En la especificación del CLUVI, basada en la TMX, el elemento adaptado indica el punto de partida

Lexicografía bilingüe práctica basada en corpus

37

del movimiento, mientras que la relación entre el elemento desplazado y el lugar de partida es codificada en el elemento mediante un atributo x que comparte valor con el índice codificado en el elemento del segmento movido. Obviamente, la etiqueta que indica el lugar de origen siempre es una etiqueta vacía. Como criterio de etiquetado en la codificación del CLUVI, y con la finalidad de evitar incoherencias entre las distintas personas que participan en la codificación del corpus, los segmentos reordenados siempre son desplazados en dirección al inicio del texto. En consecuencia, en el CLUVI no hay ninguna secuencia semejante a [...] Reordered element; en vez de eso, las secuencias son siempre del tipo Reordered element [...] , como se puede observar en el ejemplo (3) de codificación de un reordenamiento sencillo: (3) a. [en] 'The front door!' she said in this loud whisper. 'It's them!' [gl] -A porta de fóra. ¡Son eles! - murmurou bastante alto. b.

'The front door!' she said in this loud whisper.

-A porta de fóra.- murmurou bastante alto.



It's them.

¡Son eles!

Estas son, por tanto, las ampliaciones del estándar TMX adoptadas en el Corpus CLUVI para la codificación de las equivalencias de traducción no biunívocas. Como veremos en la siguiente sección del artículo, la anotación de estas equivalencias no biunívocas tendrá una importancia capital en el procesamiento del corpus para la extracción de las equivalencias de traducción que finalmente se codificarán en el DMIG.

3. Extracción de la información lexicográfica bilingüe De acuerdo con nuestros presupuestos metodológicos, la primera fase en el trabajo de elaboración del DMIG fue la preparación del corpus paralelo CLUVI que constituye su fuente textual. En este corpus, de forma general, a cada unidad del

38

Alberto Álvarez Lugrís / Xavier Gómez Guinovart

texto original le corresponde otra unidad del texto traducido. Hay, no obstante, excepciones: las llamadas asimetrías de la traducción, que constituyen la principal dificultad para el alineamiento y, en consecuencia, también para el tratamiento automático de la extracción léxica bilingüe a partir del corpus paralelo. Como vimos, las asimetrías de traducción se pueden definir como correspondencias no biunívocas y alteraciones en el orden de las unidades de traducción. Si lo habitual es que las correspondencias entre original y traducción sean biunívocas (1:1), abundan los casos en los que esta correspondencia puede ser 1:0, 1:1/2, 1:2, 0:1, etc. Del mismo modo, podemos encontrar en las traducciones fragmentos desplazados, incluso oraciones enteras que cambian de lugar. La existencia de estos fenómenos motivó el uso de una serie de etiquetas especiales para identificarlos y facilitar el trabajo de extracción automática de equivalencias léxicas bilingües candidatas a ser entradas del diccionario. A este efecto, una vez identificados y marcados los casos de omisión, adición y reordenamiento, se generó una nueva copia del corpus en el que estas asimetrías se eliminaron, al igual que algunos signos de puntuación, los dígitos y las palabras gramaticales con mayor índice de frecuencia. Todos estos elementos complican el proceso de extracción léxica bien por ser repetitivos, bien por suponer casos de dislocación entre el texto inglés y el gallego. Dependiendo de la lengua del texto, se eliminaron unas unidades u otras, aunque en general para las dos lenguas se eliminaron los signos de puntuación, excluyendo los guiones de unión de palabras compuestas; los dígitos; y los segmentos etiquetados como omisiones o inserciones, ya que indican unidades sin correspondencia de traducción. Concretamente, en la versión modificada del corpus paralelo para la extracción léxica bilingüe, eliminamos de la lengua inglesa determinantes (the, a, an), pronombres personales (I, you, he, she, it, we, you, they, me, you, him, her, you), posesivos (my, his, her), demostrativos (this, that), conjunciones (and, but, if, or), preposiciones (to, of, in, at, on, with, out, around, about), partículas negativas (no, not), pronombres indefinidos (all), verbos auxiliares (do, does, did, is, are, was, were, has, had) y la marca de genitivo sajón. Por otro lado, para el gallego eliminamos artículos (o, a, os, as), indefinidos (un, uns, unha, unhas), pronombres personales tónicos (eu, ti, el, ela, nós, vós, eles, eles, me, se, nos), posesivos (meu, meus, seu, seus), preposiciones (a, con, de, en, para, por), contracciones de preposición con artículo (ó, ao, á, ós, aos, ás, co, coa, cos, coas, do, da, dos, das, no, na, nos, nas, polo, pola, polos, polas), conjunciones (que, e, se, nin, ou, pero), verbos de tipo auxiliar (é, era) y partículas negativas (non). Para conseguir que un corpus paralelo etiquetado quede alineado en el nivel de la palabra (es decir, para conseguir que se establezcan en el corpus las equivalencias léxicas de traducción) existen diversos algoritmos estadísticos que trabajan con índices de atracción o asociación léxica y con los datos de la coaparición de elementos léxicos en las unidades de traducción bilingües alineadas. En nuestro caso, empleamos la herramienta informática para el alineamiento léxico NATools (Simões / Almeida 2003). Los diccionarios de traducción probabilísticos (DTP) de las NATools, generados automáticamente a partir de corpus paralelos alineados a nivel oracional, indican para cada forma léxica en la lengua origen documentada en el

Lexicografía bilingüe práctica basada en corpus

39

corpus el conjunto de posibles traducciones en la lengua destino identificadas por la herramienta en el corpus. Cada entrada léxica del DTP indica el número de apariciones en el corpus del elemento léxico en la lengua fuente, y sus posibles traducciones con sus probabilidades de equivalencia calculadas a partir de los alineamientos oracionales, como se puede comprobar en los ejemplos de entradas léxicas inglés-gallego del DTP para el Corpus Logaliza recogido en (4): (4) "library" => { count => 434, trans => { "biblioteca" => 0.92184907, "bibliotecas" => 0.00992135, "libraría" => 0.00357169, }, }, "files" => { count => 3622, trans => { "ficheiros" => 0.92156011, "ficheiro" => 0.01192421, "arquivos" => 0.00071648, }, }, "windows" => { count => 1686, trans => { "windows" => 0.52585220, "xanelas" => 0.22492823, "ventás" => 0.10177911, "fiestras" => 0.06585271, }, }

El resultado obtenido de la extracción automática es un diccionario bilingüe probabilístico al que le hace falta una revisión manual para mejorar su precisión; se trata fundamentalmente de eliminar equivalencias fallidas y de añadir otras que, a pesar de estar documentadas en el Corpus CLUVI, no se recogen en el diccionario probabilístico por distintas razones de índole cuantitativo. Para identificar estas ausencias en la lista inicial de equivalencias, comprobamos la presencia en el diccionario de todas las formas léxicas presentes tres o más veces en los textos en inglés del corpus y consultamos los lemarios y las equivalencias ofrecidas por otras listas léxicos bilingües de orientación elemental y escolar, como el Diccionario inglésgallego de Xerais (Salgado 1999). Se encontrarán más detalles técnicos sobre el proceso de extracción léxica bilingüe en Gómez Guinovart / Sacau (2004). Tras esta revisión, el lemario del DMIG recoge todos los lemas que aparecen un mínimo de tres veces en el conjunto de los corpus de los que se partió (principalmente, los corpus Tectra y Unesco, mas también los corpus Logaliza y

40

Alberto Álvarez Lugrís / Xavier Gómez Guinovart

Veiga), junto a un conjunto de palabras que consideramos de interés a pesar de poseer una presencia menor en los textos. En total, el diccionario contiene 20 000 entradas documentadas en el corpus, acompañadas de 30 000 traducciones y 60 000 ejemplos, un caudal léxico importante que constituye la base de la presente edición impresa del DMIG.

4. Diseño del DMIG El proceso de edición del diccionario continuó por su microestructura, es decir, por la estructura interna de las entradas o artículos lexicográficos (Gómez Guinovart et al. 2008). De este modo, se añadieron las categorías gramaticales, notas gramaticales y de uso, un ejemplo bilingüe para cada una de las traducciones suministradas con su respectiva referencia al Corpus CLUVI, y, de ser relevante, información sobre los usos fraseológicos del lema, un apartado presente en 1 de cada 4 entradas. La información fraseológica, que acrecienta el valor de este diccionario, recoge las combinaciones lexicalizadas del lema con otra u otras palabras, acompañadas de sus traducciones documentadas en el corpus. La fuente del DMIG está íntegramente editada en el formato XML, respetando unas sencillas normas de codificación definidas en su DTD (definición del tipo de documento). La DTD es la declaración formalizada de la estructura lógica de un documento, en este caso un diccionario. Está compuesta por una serie de declaraciones de elementos codificadas en SGML. A continuación presentamos la DTD de nuestro diccionario:









Esta DTD se lee de la siguiente manera: un documento de tipo diccionario está formado por un conjunto de entradas; cada entrada incluye además del lema un conjunto de informaciones traductológicas agrupadas en función de las categorías gramaticales del lema. Cada uno de estos conjuntos (denominados super_cat en la DTD) puede contener una o más acepciones, dependiendo de la polisemia de cada lema en cada categoría gramatical. Cada acepción incluye una traducción al gallego, un ejemplo de uso y, opcionalmente, la expresión plurilexemática (fraseológica) de la que forme parte el lema. Por último, cada ejemplo consta de un fragmento textual del Corpus CLUVI en inglés, su traducción al gallego y la referencia de la obra en la

Lexicografía bilingüe práctica basada en corpus

41

que se documenta el ejemplo. De este modo, cada entrada del diccionario puede incluir una o más categorías gramaticales con una o más traducciones, siendo codificada internamente como se ilustra en el siguiente ejemplo, en el que por claridad hemos resaltado en negrita las etiquetas XML:

own transitive verb ser dono One relic hast thou in thy treasury, handed down from the Moslems who once @owned# Toledo --a box of sandal-wood containing a silken carpet: Tes unha reliquia no teu tesouro, herdada dos musulmáns que nalgún tempo @foron donos# de Toledo... unha arqueta de pao de sándalo que contén unha alcatifa de seda.ALH (778) posuír Kino and Juana came slowly down to the beach and to Kino's canoe, which was the one thing of value he @owned# in the world. Kino e Juana baixaran de vagar ata a praia e achegáranse á canoa de Kino, que era o único de valor que el @posuía# no mundo.PER (239) own up confesar But she did not mind @owning up# to it in the least; one must admit that. Pero alomenos non lle importaba @confesalo#; iso había que recoñecelo. CAR (1083) adjective propio It was about this little kid that wouldn't let anybody look at his goldfish because he'd bought it with his @own# money. Falaba dun neno pequeno que non deixaba ve-lo seu peixe a ninguén porque o mercara co seu @propio# diñeiro.VIX (20)

pronoun of one's ownde seu He thought it very possible that Master Randolph's sister was a coquette; he was sure she had a spirit @of her own#; but in her bright, sweet, superficial little visage there was no mockery, no irony. Considerou que sería moi posible que a irmá de Master Randolph fose unha coqueta. Estaba seguro de que tiña un espírito @de seu#. Mais no seu pequeno, elegante, doce e superficial rostro non había farsa nin ironía ningunha.DAI (124)

Las entradas, codificadas en XML, son convertidas al formato de salida, para su visualización en la web o para su versión impresa, mediante una hoja de estilo XSL.

42

Alberto Álvarez Lugrís / Xavier Gómez Guinovart

4.1. Microestructura La microestructura del DMIG es semejante a la de otros diccionarios bilingües, pero se le da más importancia (y más espacio) a las traducciones de los lemas y a los ejemplos de contextualización. Los elementos que componen cada una de las entradas son los habituales en la mayoría de los diccionarios bilingües: lema en inglés, categoría del lema, indicaciones gramaticales y de uso, traducciones al gallego, ejemplos de cada traducción con indicación de su fuente textual y un apartado de fraseología en aquellos casos en los que el lema participa en refranes, frases hechas, etc. Si analizamos detalladamente la estructura interna de los artículos, podemos reparar en que sus elementos constituyentes muestran cierta variabilidad, reflejo de la heterogeneidad y de las irregularidades de la lengua inglesa. Así por ejemplo, se destacan en el diccionario los casos de lemas con flexión irregular, como por ejemplo en louse: 

Figura 1: Entrada para louse

 o las diferencias entre las formas típicamente británicas y estadounidenses, como se puede ver en las cabeceras de las siguientes entradas:





Figura 2: Entrada para plead



Figura 3: Entrada para jumper



Lexicografía bilingüe práctica basada en corpus

43

Figura 4: Entrada para film



Figura 5: Entrada para lorry



Pueden acompañar a los lemas, además, diversas notas sobre sus usos en inglés, que sirven para delimitar más correctamente el sentido que se le da a la palabra en cada caso: 

Figura 6: Entrada para must 

El DMIG ofrece también información ortográfica, morfológica y de uso sobre las traducciones gallegas de los lemas. A pesar de que muchos de los textos del corpus CLUVI de los que se extraen los ejemplos son anteriores a la reforma más reciente de las normas ortográficas y morfológicas del gallego (Real Academia Galega 2004), el DMIG ha unificado y regularizado la ortografía de todos los ejemplos para hacerlos concordar con las nuevas directrices de la lengua:





Figura 7: Entrada para hassle



44

Alberto Álvarez Lugrís / Xavier Gómez Guinovart

Figura 8: Entrada para thank

De gran ayuda creemos que pueden ser las advertencias sobre errores de lengua habituales, como algunos castellanismos muy extendidos:

Figura 9: Entrada para syndrome

En cuanto al caudal léxico recogido en este diccionario, se ha procurado incluir, además del que podríamos llamar léxico estándar o común de la lengua inglesa (y gallega), otros grupos de palabras como:  a) palabras de creación reciente o con nuevos significados, procedentes sobre todo de los campos de las tecnologías de la información y algunas disciplinas científicas:

Figura 10: Entrada para hacking

b) nombres propios de persona, país, ciudad, ríos, mares, etc.; es decir, artículos de contenido más enciclopédico que lexicográfico: 







Lexicografía bilingüe práctica basada en corpus

45

Figura 11: Entrada para Mauritius

c) términos especializados que llegan a la lengua común a través de textos de divulgación científica: 

Figura 12: Entrada para bioethics

Por lo que respecta al contenido de las entradas, cabe destacar, por último, la sección de fraseología del diccionario, que en algunos casos, como el de los phrasal verbs, llega a ser muy amplio. Consúltese, por ejemplo, la entrada del verbo come, que contiene 14 unidades de este tipo o las entradas para los verbos go o break, con 12.

5. Conclusiones El Dicionario moderno inglés-galego elaborado por el Seminario de Lingüística Informática (SLI) de la Universidade de Vigo es una obra con características propias dentro de la tradición lexicográfica gallega. Se trata del primer gran diccionario inglés-gallego elaborado con una metodología moderna de orientación textual empírica. El DMIG está basado en un corpus representativo de textos ingleses traducidos al gallego que forman parte del Corpus CLUVI. Todas las palabras inglesas que aparecen como lemas de las entradas del DMIG están documentadas en los textos ingleses traducidos al gallego recopilados en el CLUVI. Además de esto, todas las traducciones gallegas que se recogen en el diccionario para esas palabras son traducciones reales identificadas en las versiones gallegas de los textos ingleses. Para cada traducción seleccionada recogemos un ejemplo real de uso documentado en el CLUVI.





46

Alberto Álvarez Lugrís / Xavier Gómez Guinovart

Una versión actualizada del DMIG, en formato electrónico, puede consultarse en Internet en la dirección . Asimismo, puede consultarse el Corpus CLUVI, fuente textual de este diccionario, en la dirección . El trabajo de nuestro grupo de investigación en el DMIG se centrará, a partir de este momento, en la revisión y ampliación de las entradas y de la información que contienen, al tiempo que se mejorará y ampliará la sección de corpus paralelos inglés-gallego del Corpus CLUVI, que supone la base empírica de conocimiento léxico en la que se sustenta el diccionario. Desde el Seminario de Lingüística Informática de la Universidade de Vigo deseamos que el DMIG sea una herramienta útil tanto para estudiantes y personas usuarias del inglés de todos los niveles, como para profesionales de la traducción y de la interpretación entre inglés y gallego, que hasta ahora tenían que recurrir a diccionarios puente inglés-portugués o inglés-castellano para poder realizar consultas lexicográficas bilingües en su trabajo.

Referencias bibliográficas Brown, Ralf D. / Carbonell, Jaime G. / Yang, Yiming (2000): «Automatic dictionary extraction for Cross-Language Information Retrieval», en Jean Véronis, ed., Parallel Text Processing: Alignment and Use of Translation Corpora. Dordrecht: Kluwer, 275-298. Carl, Michael / Way, Andy (eds.) (2002): Recent Advances in Example-Based Machine Translation. Dordrecht: Springer. DMIG: Gómez Guinovart, Xavier (coord.) / Álvarez Lugrís, Alberto / Díaz, Eva (2012): Dicionario moderno inglés-galego. Ames (Santiago de Compostela): 2.0 Editora. Gómez Guinovart, Xavier (2012): «A Hybrid Corpus-Based Approach to Bilingual Terminology Extraction», en Isabel Moskowich-Spiegel Fandiño / Begoña Crespo, eds., Encoding the Past, Decoding The Future: Corpora in the 21st Century. Newcastle upon Tyne: Cambridge Scholar Publishing, 147-175. Gómez Guinovart, Xavier / Díaz Rodríguez, Eva / Álvarez Lugrís, Alberto (2008): «Aplicacións da lexicografía bilingüe baseada en córpora na elaboración do Dicionario CLUVI inglésgalego», Viceversa: Revista Galega de Traducción, 14, 71-87. Gómez Guinovart, Xavier / Sacau Fontenla, Elena (2004): «Métodos de optimización de la extracción de léxico bilingüe a partir de corpus paralelos», Procesamiento del Lenguaje Natural, 33, 133-140. Koehn, Philipp (2010): Statistical Machine Translation. Cambridge: Cambridge University Press. Malvar, Paulo (2007): «Aproximação à linguística de corpus como metodologia de base empírica. Compilação e anotação do Corpus Paralelo PALOP (português-espanhol) de Narrativa Pós-colonial», Agália, 89-90, 9-80. Moreira, Adonay (2011): «The Translator as Cultural Mediator: a corpus-based study of omissions and additions in translations of tourism brochures», The Journal of Cultural Mediation, 1, 86-95. Och, Franz Josef / Ney, Heermann (2003): «A Systematic Comparison of Various Statistical Alignment Models», Computational Linguistics, 29 (1), 19-51. Real Academia Galega (2004): Normas ortográficas e morfolóxicas do idioma galego. Vigo: Galaxia. Salgado, Benigno (1999): Diccionario elemental inglés-galego galego-inglés. Vigo: Xerais.

Lexicografía bilingüe práctica basada en corpus

47

Savourel, Yves / Lommel, Arle (2005): TMX 1.4b Specification. Technical Report. Localisation Industry Standards Association. Disponible en [Consulta: 28/05/13]. Simões, Alberto (2008): Extracção de recursos de tradução com base em dicionários probabilísticos de tradução. Tese de doutoramento. Braga: Universidade do Minho. Simoes, Alberto / Almeida, José Joao (2003): «NATools: a statistical word aligner workbench», Procesamiento del Lenguaje Natural, 31, 217-224. Simões, Alberto / Gomez Guinovart, Xavier / Almeida, José João (2004): «Distributed translation memories implementation using WebServices», Procesamiento del Lenguaje Natural, 33, 89-94. Sotelo Dios, Patricia / Gómez Guinovart, Xavier (2012): «A Multimedia Parallel Corpus of English-Galician Film Subtitling», en Alberto Simões / Ricardo Queirós / Daniela da Cruz, eds., 1st Symposium on Languages, Applications and Technologies. OASIcs: Open Access Series in Informatics, vol. 21. Saarbrücken: Dagstuhl Publishing, 255-266.



El sufijo -age en los sustantivos deverbales del francés moderno: un operador causativo Jean-Claude Anscombre CNRS-LDI Université Paris XIII

The suffix -age and the deverbal nouns in modern French: a causative operator Abstract The suffix -age of modern French when applied to verbal bases results in a very productive class of action nouns. This study aims at defining the exact function of the suffix -age as opposed to -ment. As illustrated in several examples, the suffix -age always derives an agentive noun, including in the case of an inaccusative verbal base, as in arrivage 'delivery' as opposed to arrivée 'arrival', from unaccusative arriver 'to arrive'. After a thorough examination of the properties of such derived nouns, including the modification of the argument structure of the base, we claim that the suffix -age has to be considered as a causative operator. Finally, a semantic contrast between suffixation in -age and suffixation in -ment is proposed in terms of external/internal property. Keywords French, morphology, lexicology, semantics, suffixation, action nouns.

1. Introducción Este trabajo tiene como objetivo sentar las bases para un futuro estudio completo de tres sufijos del francés contemporáneo, a saber –age, –ment y -tion (y la variante -sion). 1 Antes de entrar de lleno en la problemática de estas construcciones morfológicas, quisiéramos justificar someramente el interés de tal estudio. –––––––— 1

El español contemporáneo posee los mismos sufijos, pero con algunas diferencias. Si bien el sufijo –ción (contribución) y sus variantes –ión (confesión) y –sión (discusión) parece estar tan extendido en español como en francés, su aplicación no siempre coincide en ambos idiomas: coronación/couronnement, aleación/alliage, desesperación/désespoir, alineación/alignement, etc. Por otra parte, el sufijo –age, de gran extensión en el francés actual, tiene un uso mucho más restringido en español contemporáneo (es un préstamo de origen galorrománico), si bien se ha de notar un número importante de creaciones técnicas recientes como fichaje, porcentaje, reportaje, frente a un paradigma más antiguo (almacenaje, cabotaje, forraje). En cuanto a –ment, tiene dos correspondencias en español:

50

Jean-Claude Anscombre

El sufijo -age tiene tres valores distintos y que suelen estudiarse separadamente. El primero es un valor denominal colectivo: un N-age es 'un conjunto de entidades de un mismo tipo N', siendo feuillage 'conjunto de feuilles' un ejemplo común y corriente de ello. El segundo valor es también un sustantivo denominal con significado de 'estado de': esclavage 'estado de esclavo, esclavitud', veuvage 'estado de viudo, viudez'. El tercer valor, el único que interesa aquí, es de tipo nombre de acción: aplicado a laver 'lavar', el sufijo –age nos da el sustantivo deverbal lavage 'lavado'. Por otra parte, el sufijo –ment es el sufijo por excelencia de formación de adverbios a partir de adjectivos: difficile, simple, durable llevan a difficilement, simplement, durablement. Pero también permite derivar nombres de acción: manier 'manejar', maniement 'manejo'; classer 'clasificar', classement 'clasificación'. Finalmente, el sufijo -(t/s)ion, el más conocido de todos, es de rancio abolengo dentro de la romanística. Al igual que –age y –ment, su aplicación a una base verbal da lugar a nombres de acción: réparer 'arreglar', réparation 'arreglo'; progresser 'progresar', progression 'progresión', etc. En el presente estudio, nos proponemos examinar el funcionamiento de los sufijos –age y -ment, que permiten derivar nombres de acción, dentro de los cuales incluiremos también los nombres de efecto. Nótese de pasada que determinar la naturaleza exacta de un nombre de acción no es tárea fácil, y suele requerir la aplicación de varios criterios, como veremos más adelante. Como es bien sabido, no son los únicos sufijos que permiten derivar nombres de acción, pero ante las obligadas limitaciones de extensión de este artículo, nos limitaremos al análisis del sufijo -age en tanto que se opone a -ment, por motivos que se explicitarán más adelante, y a intentar dilucidar los siguientes problemas: a) Las características temporales y aspectuales propias de la derivación en -age. Como botón de muestra, basta mencionar que los diccionarios glosan por 'acción de vestir' (= habiller) tanto habillement como habillage, pasando por alto el contraste L'habillage a pris du temps/*L'habillement a pris du temps. b) La dimensión agentiva o no del derivado nominal. c) El intrigante problema de los 'agujeros' léxicos en los casos contemplados en este trabajo: ¿Cómo explicar los contrastes cassage/*tassage y *cassement/tassement entre los verbos casser 'romper'/tasser 'apretujar'? d) ¿En qué medida afecta la derivación nominal al esquema argumental de la base? Compárese desde este punto de vista le nettoyage par les services compétents y *le jardinage par Max. Intentaremos mostrar que una parte importante de los fenómenos a los que dan lugar los derivados nominales estudiados se manifiestan a través de propiedades lingüísticas estables, en lo esencial semánticas. Lo cual justifica en nuestra opinión la tesis de una regulación por factores semánticos del proceso morfológico, que deja –––––––— el paradigma poco productivo en –mento (experimento, juramento, reglamento) y la clase muy productiva de los –miento: aparcamiento, arrepentimiento, nombramiento, etc.

El sufijo -age en los sustantivos deverbales del francés moderno

51

por tanto de ser una operación puramente formal. Si aceptamos la idea de que parte de la información léxica se proyecta en la estructura sintáctica, habría entonces propriedades semánticas que interactuarían con el léxico para configurar la estructura de ciertas oraciones. Concretamente, aquellas donde aparecen entre otros nuestros dos derivados nominales.

2. Los nombres de acción: prolegómenos 2.1. Temas verbales y temas nominales Recordaré brevemente los conceptos morfológicos de base que iré utilizando a lo largo de este trabajo. El punto de partida es un estudio de Plénat (1988), retomado y revisado en Anscombre (2003). Los artículos de Pena (1999) y de Roché (2009) ofrecen un tratamiento muy completo del asunto así como una terminología adecuada. La base de una o varias palabras es el constituyente de aquellas palabras sobre el que puede operar algún proceso morfológico, sea derivación, flexión o incluso composición. Una base puede ser una base verbal o una base nominal, según el caso. En cambio el tema es la forma que sirve de base para la flexión de la palabra. Por tanto, todo tema es una base, pero no a la inversa. La gran ventaja que ofrece el concepto de base es que permite abarcar los casos, que se dan con mucha frecuencia en las lenguas románicas, de temas alomorfos: una misma base se manifiesta bajo distintas formas fonológicas. Como botón de muestra, la base que se corresponde con el verbo español sentir presenta tres ejemplares alomorfos, o sea sent- (de sentir y de sentimos), sient- (de siento), y sint- (de sintamos). La base verbal del francés rougir 'ponerse rojo' se manifiesta con el tema rougi- en je rougis e il rougira, y el tema rougis- en il rougissait y rougissant. Plénat (1988) distingue además un tema de presente, que es el tema verbal del participio de presente del verbo francés (tema verbal del gerundio en español); 2 y un tema de supino, que es aquel que se corresponde con los nombres de acción emparentados. Por ejemplo, el nombre de agente régisseur presenta un tema de presente (régir > régissant > régisseur), cuando al igual que el español constructor, el francés constructeur ostenta un tema de supino (construire ≠ construction > constructeur). Esta distinción permite dar cuenta de varios fenómenos, como por ejemplo el contraste entre cicatriser/cicatrisation y inciser/incision (y no incisation¸ como se podría esperar). Cicatrisation está formado de manera regular sobre un tema verbal, esta vez de infinitivo, cicatris-. Por contra, incision no se deriva del tema verbal incis- de inciser- de ser así daría incisation-, sino de un antiguo tema de supino procedente del latín incisum, y que también se manifiesta en incisif 'incisivo'.

–––––––— 2

En francés, el tema de presente también es el tema del pretérito imperfecto.

52

Jean-Claude Anscombre

2.2. Estructura morfológica de los nombres de acción en, -age, -ment y -tion Nos hemos apoyado para este estudio sobre un corpus contemporáneo de aproximadamente 350 nombres de acción en -age, 600 en -ment y 900 en -tion, procedentes de una misma fuente. Hemos dedicado la primera perte del estudio a una clasificación de los nombres de acción contemplados en este trabajo en función del tema que sirve de base para la derivación. Lo cual no deja de ser una tárea difícil teniendo en cuenta que la determinación de un tema pasa con bastante frecuencia por un supletivismo, como veremos más adelante. Según la naturaleza del tema, podemos clasificar los nombres de acción en age, -ment y -tion de la siguiente manera: 1. Nombres de acción en -tion/-sion: a) Con tema verbal: i) Tema de presente: no existe ninguno. ii) Tema de infinitivo: aérer > aération, catégoriser > catégorisation, cotiser > cotisation, dériver > dérivation, orchestrer > orchestration, orienter > orientation, répartir > répartition... b) Con tema nominal: agir/action, apparaître/apparition (véase appariteur 'bedel'), construire/construction (véase constructeur), succéder/succession (successeur). Buena parte de estos derivados se deben a la aclimatación de latinismos que han ido integrándose y generalizándose en el sistema con gran facilidad, tal y como ejemplifican los participios latinos. Appareo > apparitum > apparition, construo > constructum > construction... El fenómeno incluso puede darse para familias enteras; los verbos en -fier son un caso típico de ello: classifier/classification (classificatum), pacifier/pacification (pacificatum), solidifier/ solidification, etc. 2. Nombres de acción en -ment: a) Con tema verbal: i) Tema de presente: derivan un nombre de acción en -ment muchos de los verbos llamados incoativos del segundo grupo. Las excepciones son agir/action, finir/finition, más aquellos de los que derivan un nombre de acción en -age: alunir/alunissage, atterrir/atterrissage, crépir/ crépissage, finir/finissage... Cabe citar también el subgrupo de los que deriva el nombre de acción de otra manera: bénir/bénédiction, choisir/choix, guérir/guérison, unir/union, trahir/trahison..., etc. No obstante, la gran mayoría producen un nombre de acción en -ment: affadir > affadissement, envahir > envahissement, flétrir > flétrissement, jaillir > jaillissement, rougir > rougissement... Dan también lugar a esos derivados unos cuantos verbos en -er del primer grupo: armer >

El sufijo -age en los sustantivos deverbales del francés moderno

53

armement, avorter > avortement, dévoyer > dévoiement, laver > lavement, ravaler > ravalement, etc.3 ii) Tema de infinitivo: no existe ninguno. Un ejemplo de tipo laver > lavement resulta ambiguo entre un tema de presente lav-er > lav-ant > lav-ement y un tema de infinitivo lav-er > lave-ment. En vista de los estrechos parecidos formales y semánticos con la serie de los incoativos, optaremos por un tema de presente y no de infinitivo. Evitamos así duplicar entradas sin ningún beneficio explicativo. b) Con tema nominal: no parece existir ningún caso en la nómina que hemos establecido. No obstante, debemos mencionar una cración muy reciente, la de blanchir > blanchiment, casi siempre en la colocación específica blanchiment d'argent 'blanqueo de dinero'. Ahora bien, acabamos de ver que los nombres de acción en -ment suelen derivarse de un tema de presente, lo cual nos deja solo dos posibilidades: o se trata de un tema verbal de infinitivo, o bien de un tema nominal a partir de argent blanchi. En ambos casos, se trata de una innovación morfológica. 3. Nombres de acción en -age: a) Con tema verbal: i) Tema de presente: como se ha señalado anteriormente, algunos incoativos dan lugar a derivados en -age: a saber, alunir, amerrir, atterrir, blanchir, crêpir, emplir (y derivados), enfouir, polir, rôtir, rouir, vernir. La inmensa mayoría de los nombres de acción en -age proceden en realidad de verbos del primer grupo en -er: afficher > affichage, arroser > arrosage, bavarder > bavardage, cambrioler > cambriolage, doser > dosage, espionner > espionnage, jardiner > jardinage, marier > mariage... Las excepciones son escasas: abattre > abattage es el único caso (con battre) del tercer grupo. ii) Tema de infinitivo: en vista de la regularidad flexiva de los verbos del primer grupo, resulta imposible deteminar si, por ejemplo, lavage se deriva de un tema de presente o bien de infinitivo. Dado que con los incoativos tenemos un claro caso de tema de presente, consideraremos, a fin de evitar la duplicación innecesaria de entradas, que los derivados de verbos del primer grupo también tienen como base un tema de presente. b) Con tema nominal: no existe ningún otro tema nominal más que en el caso de apprenti > apprentissage. El siguiente esquema recoge los resultados que hemos ido poniendo de manifiesto en esta primera parte: –––––––— 3

Algunos incoativos del segundo grupo no permiten la derivación de un nombre de acción: bâtir, chérir, munir (munition se ha especializado como nombre de objeto, casi siempre en plural), subir, transir (sólo ha sobrevivido el participio pasado transi).

54

Jean-Claude Anscombre

Este esquema pone de manifiesto una distribución sufijal complementaria relacionada con el tema. Los derivados en–age y –ment proporcionan nombres de acción procedentes únicamente de un tema verbal de presente, nunca de un tema verbal de infinitivo ni de un tema nominal. En cambio, los nombres de acción en – tion/-sion pueden derivarse sea de un tema nominal, sea de un tema verbal. En este último caso, se trata siempre de un tema de infinitivo. En segundo lugar, el examen de las nóminas relativas a los tres sufijos muestra que el reparto de los sufijos no puede identificarse con la morfología verbal, si bien pueden observarse tendencias. Por ejemplo, los incoativos del segundo grupo se reparten asimétricamente entre las tres clases sufijales: finir/finition, flétrir/flétrissement, polir/polissage. Por último, existe un número notable de dobletes: sea con significados similares, como en el caso de nettoyage y nettoiement 'limpieza', sea con una notable diferencia de significados. Por ejemplo, del verbo gratter 'rascar' se derivan dos nombres de acción, grattage

El sufijo -age en los sustantivos deverbales del francés moderno

55

'acción de rascar una cosa, rascamiento', y grattement 'ruido que produce un rascamiento'.4 En cambio, los tripletes son escasos. De ahora en adelante, nos centraremos en el sufijo -age que contrastaremos con el sufijo -ment en lo que atañe a los esquemas argumentales por una parte y a las propiedades aspectuales por otra.

3. Los nombres de acción en –age, -ment: esquemas argumentales 3.1. Estructura eventiva de los genitivos adnominales encabezados por nombres deverbales Una primera idea que surge con bastante naturalidad consiste en examinar para cada sufijo las modificaciones del esquema argumental cuando se pasa de la base verbal al nombre derivado o emparentado. Retomaré de Godard (1986), Grimshaw (1990) y sobre todo Kupferman (1991),5 la distinción entre argumento externo (sujeto de un verbo transitivo activo o de un verbo inergativo) y argumento interno (objeto de un verbo transitivo activo o sujeto de un verbo incausativo) tal como se aplica en Anscombre (2000). Estudiando las estructuras de tipo N1 de N2 en francés, con un nombre N1 deverbal de un verbo V, Kupferman se plantea la cuestión de una posible lectura subjectiva de N2, o sea una interpretación en la que N2 aparece como sujeto de V, frente a una lectura objetiva en la que N2 aparece esta vez como objeto. Por ejemplo, hay un genitivo subjetivo en le décollage de l'avion 'el despegue del avión' (l'avion décolle) y un genitivo objetivo en le pilotage de l'avion 'el pilotaje del avión' (on pilote l'avion). Kupferman establece que los principios que rigen las dos interpretaciones subjetiva y objetiva de estos genitivos adnominales son grosso modo los siguientes: a) La lectura subjetiva de N1 de N2 es posible solo si N1 puede interpretarse como no agentivo y no eventivo. Por consiguiente, será el caso siempre que N2 sea un argumento interno del verbo V. b) En este caso, son aceptables las configuraciones anafóricas de tipo: N2, le N1 en GV.., y N2, son N1 GV... (respectivamente pronombre anafórico en y posesivo anafórico). c) En cambio, la posibilidad del esquema N1 par N2 corresponde a un sujeto agentivo y una lectura eventiva, o sea un argumento externo. A modo de ilustración, consideremos los siguientes ejemplos que muestran los dos valores de résolution, o sea 'acción de resolver' (deverbal agentivo) y 'manera de resolver' (deverbal no agentivo): –––––––— 4 5

La serie de ruidos chasquido, ronquido, silbido... sugiere un rasquido que (desgraciadamente) no existe. Véanse también sobre el tema Levin (1993), Levin-Rappaport (1995), Davis-Koenig (2000), Alexiadou (2001), Levin-Rappaport (2005), Ramchand (2008), Tubino Blanco (2011), entre muchos otros.

56

Jean-Claude Anscombre

(1) La résolution (??de Max + de l'équation) a été laborieuse. (2) La résolution par Max de l'équation a été laborieuse. (3) Max, sa résolution [de l'équation] est (élégante + ??laborieuse). (4) L'équation, la résolution en a été (??élégante+ laborieuse). En el ejemplo (1), el adjetivo laborieuse selecciona el valor agentivo, lo que impide la lectura subjetiva y hace que salga beneficiada la lectura objetiva. La posibilidad de (2) es consecuencia directa del valor agentivo de résolution. (3) resulta de b) y el ejemplo (4) muestra que la lectura objetiva suele coincidir con una interpretación agentiva y eventiva.6

3.2. Los esquemas argumentales de los sustantivos deverbales en –age Dos son las características de los sustantivos deverbales en -age: (H1) Los nombres de acción con sufijo -age admiten los mismos argumentos que el verbo-base. (H2) El sufijo deverbal nominalizador -age indica acciones causadas por un agente externo. -Age es un operador causativo. Veamos el caso de arracher 'arrancar, sacar' con el argumento interno une dent 'un diente'. El derivado arrachage 'extracción' da lugar a los siguientes hechos: (5) l'arrachage d'une dent/l'arrachage par le dentiste/l'arrachage d'une dent par le dentiste/*l'arrachage du dentiste Le dentiste 'el dentista' es argumento externo (no-temático) del verbo arracher, en tanto que sujeto de un verbo agentivo. En este sentido, cabe señalar la existencia del nombre de agente correspondiente arracheur, especialmente frecuente en el modismo mentir comme un arracheur de dents 'mentir uno más que habla'. El argumento sujeto (y externo) del verbo GN = le dentiste puede introducirse en la estructura V-age par GN y no en la estructura V-age de GN.7 En cambio, el argumento objeto la dent puede figurar en la estructura V-age de GN, siendo esta vez GN el argumento interno. En otras palabras, el derivado arrachage hereda el esquema argumental del verbo base. El verbo cambrioler 'entrar a robar' y el correspondiente derivado cambriolage 'robo en una casa' muestran un comportamiento similar, lo cual apoya la tesis de la conservación del esquema argumental:

–––––––— 6 7

De donde el muy conocido ejemplo la construction du maçon 'la casa del albañil/*la construcción del albañil' y la construction de la maison 'la construcción de la casa'. Véase Grimshaw (1990), para una temática muy similar.

El sufijo -age en los sustantivos deverbales del francés moderno

57

(6) le cambriolage de la villa/le cambriolage par les voleurs/le cambriolage de la villa par les voleurs/*le cambriolage des voleurs donde cambrioler aparece como un verbo de sujeto agentivo en vista del derivado agentivo cambrioleur entre otros argumentos.8 Examinemos ahora el caso más complicado del verbo de movimiento décoller y del correspondiente derivado décollage, cuyo comportamiento queda ejemplificado como sigue: (7) le décollage de l'avion/*le décollage par l'avion/??le décollage (de l'avion) par un pilote expérimenté9 Se puede observar que el enunciado l'avion décolle representa indiscutiblemente una glosa correcta del sintagma nominal le décollage de l'avion. De hecho, si bien l'avion es sujeto en l'avion décolle, no es en absoluto agente, puesto que el auténtico agente es el piloto. Efectivamente, como muchos verbos de movimiento tanto en francés como en español, décoller es inacusativo. Autoriza la construcción impersonal activa: (8) Par suite du mauvais temps, il a décollé très peu d'avions ce matin. e incluso la variante con pronombre anafórico en:



(9) Par suite du mauvais temps, des avions, il en a décollé très peu.

Estas propiedades confirman que el verbo décoller es inacusativo, siendo el sujeto l'avion argumento interno. De aquí se deducen de inmediato la inaceptabilidad de le décollage par l'avion (par requiere un argumento externo) y la aceptabilidad de le décollage de l'avion (el sujeto de un verbo inacusativo es argumento interno). Ahora bien, una vez establecido el carácter inacusativo de décoller, surge el problema del valor semántico de décollage, que puede resumirse de la siguiente manera: ¿el hecho que palabras como décollage- y debido al sufijo -age- conserven los esquemas argumentales del verbo significa que no hay más argumentos o no? ¿El sufijo -age solo transmite el esquema argumental del verbo base o bien tiene repercusión en la estructura argumental? Si de hecho -age no hace más que reproducir en el derivado la estructura argumental de la base verbal, entonces resulta predecible que décollage no tenga ningún rasgo de agentividad. Consideremos ahora los siguientes ejemplos: (10) Ce pilote expérimente une nouvelle méthode de décollage. (11) Le pilote va maintenant procéder au décollage. –––––––— 8 9

Para criterios de inacusatividad e inergatividad, véanse por ejemplo Zribi-Hertz (1987) y Cechetto (2002). El corpus contemplado no ofrece ningún ejemplo.

58

Jean-Claude Anscombre

(12) Le décollage depuis cette piste requiert de l'habileté. que compararemos con:



(13) *Les coureurs expérimentent une nouvelle méthode d'arrivée. (14) *L'arbitre va maintenant procéder à l'arrivée. (15) ??L'arrivée sur cette piste requiert de l'habileté. La aceptabilidad de las secuencias (10) a (12) es típica de los nombres de acción cuando son agentivos,10 lo cual muestra la agentividad de décollage frente a la inaceptabilidad de arrivée 'llegada', que no permite las mismas combinaciones (ejemplos (13)-(15)). El marcado contraste entre décollage y arrivée es un verdadero problema, siendo ambos verbos décoller y arriver inacusativos, y plantea la cuestión de explicar porqué décollage habilita un agente y no arrivée. La tesis fundamental con respecto a estos fenómenos que vamos a defender en las páginas siguientes es que no solamente el sufijo -age es causativo-agentivo, sino que es además causativo a partir de una base verbal inacusativa. El patrón de la estructura semántica correspondiente sería el siguiente en el caso de décollage: décollage de x: (y) [y CAUSA [x décolle]] En contraste con este esquema causativo, el patrón semántico de arrivée es de tipo: arrivée de x: [x arrive] Nuestra hipótesis asocia, por consiguiente, a décollage una interpretación de tipo quelqu'un fait décoller l'avion 'alguien hace que despegue el avión', lo cual viene a ser lo mismo que ver el sufijo -age como prueba de la presencia en francés moderno de una morfología causativa.11 Es de interés señalar que frente al sustantivo procesivo pero no agentivo arrivée, el francés ha hecho derivar del mismo verbo inacusativo arriver 'llegar' otro sustantivo, a saber arrivage 'entrega, envío', de claro matiz agentivo, como podemos observar en: (16) “[...] Heureusement qu'il y a eu votre arrivage, sans ça on n'aurait pas pu faire face, une fois, hein [...]” (F. Cavanna, Les Russkoffs, 1979: 31-32). Es de notar en este ejemplo que la expresión votre arrivage significa poco más o menos 'la llegada de las cosas que Vd [nos] mandó', y que por lo tanto explicita el agente. Por otra parte, la sustitución de arrivage por arrivée da lugar a una modificación radical del significado: votre arrivée = 'su llegada'. Se puede objetar que si -age es causativo-agentivo, ¿cómo es que no existen los correspondientes nombres de agente décolleur y arriveur en los dos casos que acabamos de examinar?. Si bien no parece existir realmente una explicación de por qué no existen estos dos nombres –––––––— 10 11

Véase Anscombre (2000) sobre el tema. Sobre el particular, véanse Levin-Rappaport (1995), Alexiadou (2001), Van Valin (2005), Ramchand (2008) y desde un punto de vista estrictamente minimalista, Tubino Blanco (2011).

El sufijo -age en los sustantivos deverbales del francés moderno

59

de agente, hay que notar sin embargo que no siempre un verbo agentivo permite la derivación del agente en -eur (Anscombre 2001): así, en el caso de écrire/*écriveur, pleurer/*pleureur12, écouter/*écouteur, etc. Por otra parte, hay casos efectivos de deverbales en -age de base inacusativa y con el correspondiente nombre de agente en -eur. Y como para muestra basta un botón, examinaremos el caso del verbo flotter 'flotar'. Obsérvese que autoriza la impersonal activa: (17) Il flottait dans l'air comme un parfum de printemps. En el corpus, aparece con frecuencia acompañado de circunstanciales de modo que indican la no-intencionalidad: flotter librement 'flotar libremente', flotter à la dérive 'flotar a la deriva', flotter au gré du vent 'flotar a merced del viento', etc., como queda ejemplificado en: (18) “[...] Semblant flotter, comme une bouée à la dérive, le camion qui transporte Benazir tentera jusqu'à l'aube de pénétrer dans Lahore pour atteindre le stade [...]” (Corpus Le Monde, 2007-2013). Es, pues, un verbo inacusativo, e interesa observar que tiene un derivado específico flottage, que da lugar casi exclusivamente a la colocación le flottage du bois 'la maderada' o conducción de la madera por flotación. Es sustantivo agentivo: (19) “[...] La Véritable Histoire de Joseph Boiseau nous fait découvrir les nombreuses opérations (et les techniques bien précises ) qui président au «flottage»: coupe selon des mesures particulières, martelage d' identification des bûches, charroi jusqu'à la rivière [...]” (Corpus Le Monde, 2007-2013). como queda reflejado en (17): alusión a les techniques qui président au flottage 'las técnicas de la maderada', y que abarcan varios sustantivos agentivos: coupe 'corte, aserradura', martelage 'martilleo', charroi 'acarreo'. Ahora bien, existe el corespondiente nombre de agente flotteur 'ganchero, encargado de conducir los troncos a lo largo del río', lo cual confirma nuestra hipótesis de una causatividad básica vinculada al sufijo -age, y apoya la idea de que este sufijo introduce un argumento externo: flottage de x tiene una estructura de tipo (y) [y CAUSA [x flotte]], siendo y de tipo [+humano] con toda probalidad: no hemos encontrado ningún contraejemplo. Hasta el momento, nos hemos centrado verbos inacusativos, cuando la gran mayoría de los deverbales en -age en realidad proceden de verbos transitivos: amarrage, assemblage, éclairage, perçage, son sustantivos derivados de verbos transitivos. Alguno que otro verbo ofrece las dos posibilidades: transitividad e

–––––––— 12

Salvo en el caso de pleureuse 'plañidera'.

60

Jean-Claude Anscombre

intransitividad. Es precisamente el caso de marier 'casar', que da lugar a una versión intransitiva,13 como muestran: (20) Lia et Max se sont mariés hier. (21) Le maire a marié Lia et Max hier. Una posible explicación consistiría en ver en (20) + (21) una alternancia causativa: el verbo se marier inacusativo (Zribi-Hertz 1987) representaría la versión anti-causativa14 del marier transitivo de (21). En realidad, hay incompatibilidad semántica entre (20) y (21): (21) no significa ni por asomo [El alcalde CAUSA [Lia y Max se casaron ayer]], sino más bien [El alcalde CAUSA ayer [Lia y Max están casados]]15. En el caso de mariage, nuestra propuesta será entonces atribuirle una estructura semántica similar a la de (21) preferentemente 16 , con un patrón subyacente de tipo [z CAUSA [x y y están casados]], lo cual viene a ser lo mismo que interpretar mariage de x et de y con el significado 'acción que hace que x e y están casados'. El tipo de hipótesis que contemplamos resulta clara: se trata de extender el anterior análisis de los sustantivos deverbales de verbos intransitivos inacusativos a sustantivos deverbales de verbos transitivos y agentivos. En ambos casos, el análisis es el mismo. El sufijo -age remite a una morfología causativa: sirve para derivar nombres de acción agentivos de significado global 'acción causa de que V (x, y, z).' Si el verbo V es inacusativo (décoller), pasamos de un solo argumento interno a dos argumentos, uno interno y el otro externo. Si el verbo es, en cambio, transitivo (marier), se conserva el esquema biargumental. En este último caso, nos decantamos además por un análisis en términos estativo-resultativos, una tesis que corrobora una observación de Ramchand (2008: 172 y ss.): constató que en varios idiomas, la morfología verbal causativa, cuando existe y es productiva, es posible solamente con raices verbales inacusativas. Para finalizar este apartado, examinaremos el caso de l'abordage du navire (par des pirates) 'el abordaje del barco por piratas'. El correspondiente verbo aborder es transitivo y agentivo y, sin embargo, tanto los hablantes como los corpus ofrecen la glosa pasiva 'le navire est abordé (par les pirates)' y no la activa 'les pirates abordent le navire', como en: (22) “[...] Dans les neuf premiers mois de 2003, la piraterie maritime a augmenté de 26% à travers le monde Une attaque sur quatre a été perpétrée –––––––— 13

14 15 16

El estatuto del se de se marier no es fácil de establecer. Por una parte, la posibilidad de (20) aboga por un se 'recíproco'. Por otra parte, la posibilidad paralela de Max se casó ayer parece indicar un se 'reflexivo'. Véanse Levin / Rappaport (1995), Lemmens (1998), Schäfer (2008), entre otros, para la relación entre transitividad, inacusatividad y causatividad. Resulta interesante observar que existe una versión nominal causativa de se marier 'casarse'. Se trata del sustantivo marieuse 'casamentera'. Mariage autoriza un argumento externo le mariage par le curé de la paroisse, como marier (être marié par le curé de la paroisse) pero no se marier (*se marier par le curé de la paroisse).

El sufijo -age en los sustantivos deverbales del francés moderno

61

dans des eaux indonésiennes Le 24 novembre, un pétrolier a été abordé par trois pirates au large de la partie indonésienne de Bornéo [...]” (Corpus Le Monde, 2007-2013). El ejemplo de (22) resultaría incluso un poco curioso si se sustituyera la construcción pasiva por la activa. Lo mismo ocurre con affichage: l'affichage de publicités est interdit significa 'il est interdit que des publicités soient affichées', o sea, que está prohibido fijar carteles en tanto que lleva a un resultado concreto. Y con le réglage: en le réglage du carburateur est facturé vingt euros, la factura remite al resultado del arreglo: en caso de que el mecánico no consiga arreglar el carburador en cuestión, no puede de ninguna de las maneras exigir que se le pague veinte euros por le réglage. En vista de todo lo anteriormente dicho, nuestra tesis de un sufijo -age agentivo y del que derivan sustantivos deverbales a partir de raices semánticamente inacusativas tiene visos de plausibilidad. Existe, no obstante, un tipo de deverbales en -age indudablemente intransitivos y aparentemente agentivos, que parecen venir a contrariar la generalización de nuestra tesis a la totalidad de los deverbales en -age. Se trata de sustantivos como braconnage 'caza furtiva', bricolage 'bricolaje', cabotage 'cabotaje', jardinage 'jardinería', jonglage 'juglaría', patinage 'patinaje', etc. Como señala Huyghe (2012), no permiten el genitivo adnominal subjetivo con interpretación agentiva. Por ejemplo, le bricolage de Max solo puede significar 'la manera que tiene Max de hacer bricolaje', como se aprecia en la oposición: (23) son bricolage n'a pas tenu/*son bricolage a duré deux jours en conformidad con el análisis de Kupferman (1991). Por otra parte, tienen un significado iterativo, habitual, genérico, y no eventivo, como queda ilustrado en la comparación: (24) Pour s'occuper, Lia jardine/Max bricole (25) *Le jardinage a eu lieu hier/*On va procéder au bricolage Los verbos base son inergativos: entre otras propiedades, existe el corespondiente nombre de agente: braconnier, bricoleur, caboteur, jardinier jongleur, patineur, etc. En cuanto a los deverbales en -age, denotan actividades, no son logros ni tampoco realizaciones, lo cual se manifiesta en distintas combinaciones: (26) faire du (braconnage + bricolage + cabotage + jardinage + jonglage + patinage) (27) des outils de jardinage/des conseils de bricolage/une activité de cabotage/... y explica que sean homogéneos y acepten el partitivo, como se puede apreciar en (26). Nos queda entonces por explicar por qué verbos intransitivos e inergativos como bricoler: a) autorizan derivados nominales en -age cuando nuestra tesis estipula que la base verbal de partida ha de ser de tipo inacusativo; b) dan lugar a sustantivos no

62

Jean-Claude Anscombre

eventivos e incluso genéricos. En realidad, este fenómeno se debe a que la vinculación semántica entre el verbo y el sujeto puede interpretarse de diversas maneras. Consideremos: (28) Los gatos cazan ratones. Dentro de la clasificación de Vendler, el verbo cazar es una actividad pero, no obstante, da lugar a dos interpretaciones en el caso de (27). Una interpretación es eventiva y corresponde a la posibilidad de la forma progresiva: Los gatos están cazando ratones, enunciado cuyo sujeto es agentivo. La segunda interpretación es la iterativa o habitual, que ve en (28) un enunciado genérico, cuyo significado es aproximadamente 'Los gatos tienen como característica la caza de ratones'. En este último empleo, la forma progresiva está excluida pero sí es posible la glosa atributiva 'Los gatos son cazadores de ratones', imposible en el caso de la interpretación eventiva. El sujeto 'los gatos' no es actante en un proceso sino una entidad cuya identidad incluye la propensión a cazar ratones. No hay entonces eventividad y, por lo tanto, no hay tampoco agentividad. Si se acepta la tesis estipulada -el sufijo -age opera exclusivamente sobre una base no agentiva (o bien una lectura no agentiva de la base)-, la única posibilidad en el caso de verbos como bricoler y jardiner, que son fundamentalmente procesivos es una lectura genérica de la base. En breves términos, detrás de bricolage por ejemplo, hay un esquema argumental de tipo [x CAUSA [x suele hacer bricolaje]]. El análisis completo de esta última clase de deverbales en -age excede con mucho nuestros objetivos inmediatos.

3.3. Los esquemas argumentales de los sustantivos deverbales en -ment Para finalizar esta sección, quisiéramos evocar brevemente el caso de los deverbales en -ment, especialmente en lo que les diferencia de los deverbales en -age que hemos estado analizado a lo largo del estudio. Dan lugar a la misma regularidad argumental que los derivados en -age: el sufijo -ment es 'conservador' del esquema argumental de la base. Los sustantivos deverbales en -ment tienen los mismos argumentos internos que el verbo base, como se puede comprobar fácilmente en los ejemplos: (29) “[...] Pour déblayer les rues étroites, les petits engins de nettoiement des trottoirs seront mobilisés [...]” (Corpus Le Monde, 2007-2013). (30) “[...] La politique d'accompagnement des programmes d'ajustement structurel que se propose d'appliquer la Communauté serait conçue en collaboration étroite avec la Banque mondiale et le FMI, ainsi qu' avec les Etats membres [...]” (Corpus Le Monde, 2007-2013). (31) “[...] 'L' autre bonhomme', c'est Rodin, que Claudel voulait entièrement responsable de l'internement de sa soeur Camille [...]” (Corpus Le Monde, 2007-2013).

El sufijo -age en los sustantivos deverbales del francés moderno

63

Al igual que el sufijo -age, el sufijo -ment autoriza la construcción sin argumento interno explícito: (32) “[...] Une comparaison rapide des structures des dépenses des ménages en France et au Japon révèle des différences étonnantes de modes d' existence, à niveau de vie équivalent les dépenses sont voisines pour l'alimentation et l'habillement [...]” (Corpus Le Monde, 2007-2013). Desde el punto de vista semántico, la diferencia entre los nombres de acción en -age y los nombres de acción en -ment es la siguiente: los deverbales en -age describen una acción como añadida a lo que por otra parte caracteriza al actante; mientras los deverbales en -ment la caracterizan como una dimensión esta vez constitutiva del actante.17 La palabra habillement remite a la manera usual de vestirse de una persona (enfoque constitutivo), frente a habillage que remite a circunstancias totalemente ocasionales y ajenas a la identidad del actante. Sin adentrarnos en las tecnicidades de un estudio completo, se pueden aducir tres argumentos en favor de nuestra tesis: a) Si el verbo base es reflexivo y, por lo tanto, inacusativo, el derivado es forzosamente en -ment: s'habiller/habillement, habiller (quelqu'un)/habillage; se déployer (les troupes)/déploiement, s'affoler/ affolement, se désintéresser/désintéressement, s'empresser /empressement, se mouvoir/mouvement, se recueillir/recueillement, etc., de tal modo que el derivado en –age es inaceptable; b) las manifestaciones sonoras típicas de humanos y animales (salen de ellos y no las controlan) suelen ser mayoritariamente en -ment: bafouillement, bégaiement, chuchotement, éternuement, hurlement, ricanement, sussurrement, trépignement, zézaiement, etc. para los humanos; aboiement, bêlement, braiement, caquètement, coassement, couinement, croassement, feulement, gazouillement, glapissement, grondement, halètement, hennissement, hululement, hurlement, meuglement, miaulement, pépiement, ricanement, rugissement, sifflement, etc. para los animales; así como para los objetos: bruissement (hojas), grincement (dientes), crissement (frenos), grésillement (fritura), crépitement (fuego, lluvia), craquement (madera), éclatement (obús), frémissement (líquido a punto de hervir), sifflement (viento), etc.; c) la gran mayoría de designaciones de sentimientos y actitudes que solo pueden ser internos al actante: abattement, accablement, acharnement, affolement, agacement, agrément, amusement, apitoiement, atermoiement, contentement, désenchantement, dévouement, ébahissement, effarement, égarement, harcèlement, harassement, ressentiment, etc. remiten a una manera de ser o de presentarse.

–––––––— 17

Sobre el origen indoeuropeo de esta distinción, véase Benveniste (1975).

64

Jean-Claude Anscombre

Referencias bibliográficas Alexiadou, Artemis (2001): Functional Structure in Nominals: Nominalization, and Ergativity. Amsterdam: John Benjamins. Anscombre, Jean-Claude (1986): «L'article zéro en français: un imparfait du substantif?», Langue française, 72, 4-39. — (2000): «Eléments de classification des noms processifs», Bulag, Lexique, Syntaxe et Sémantique: Mélanges offerts à Gaston Gross à l'occasion de son 60ème anniversaire, Hors série, 345-364. — (2001):«De las anáforas asociativas a la estructuración morfo-semántica: los nombres de agente en –or/-eur», en Jean-Claude Anscombre / Georges Kleiber, eds., Problemas de semántica y referencia. Oviedo: Universidad de Oviedo, 31-46. — (2003):«L'agent ne fait pas le bonheur: agentivité et aspectualité dans certains noms d'agent en espagnol et en français», Thélème, numéro spécial, 11-27. — (2013): «El sufijo –ón en español contemporáneo: morfología y prototipos», Oralia, 16, 1132. Benveniste, Emile (1974): Problèmes de linguistique générale II. Paris: Ed. Gallimard. — (1975): Noms d'agent et noms d'action en indo-européen. Paris: Maisonneuve. Cecchetto, Carlo (2002): Introduzione a la sintassi. Milano: Edizioni Universitarie di Lettere, Economia, Diritto. Davis, Anthony R. / Koenig, Jean-Pierre (2000): «Linking as Constraints on Word Classes in a Hierachical Lexicon», Language, 76, 1, 56-91. Godard, Danielle (1986): «Les déterminants possessifs et les compléments de nom», Langue française, 72, 102-122. Grimshaw, Jean (1990): Argument Structure. Cambridge (Mass.): The MIT Press. Haas, Pauline / Huyghe, Richard (2010): «Propriétés aspectuelles des noms d'activité», Cahiers Chronos, 21, 103-118. Huyghe, Richard (2012): «Noms d'objets et noms d'événements: quelles frontières linguistiques?», Scolia, 26, 81-104. Kiefer Ferenc (1998): «Les substantifs déverbaux événementiels», Langages, 32, 131, 56-63. Kupferman, Lucien (1991): «L 'aspect nominal et l’extraction en en», Le Français Moderne, 59, 2, 113-147. Laca, Brenda (1993): «Las nominalizaciones orientadas y los derivados españoles en -dor y ente», en Soledad Varela, coord., La formación de palabras. Madrid: Taurus, 180-204. Lemmens, Maarten (1998), Lexical Perspectives on Transitivity and Ergativity. Amsterdam/Philadelphia: John Benjamins Publishing Company. Levin, Beth (1993): English Verb Classes and Alternations. A Preliminary Investigation. Chicago (Illinois): University of Chicago Press. Levin, Beth / Rappaport, Malka (1995): Unaccusativity. At the Syntax-Lexical Semantics Interface. Cambridge (Mas.): The MIT Press. — (2005): Argument realization. Cambridge/New York: Cambridge University Press. Lieber, Rochelle (2004): Morphology and Lexical Semantics. Cambridge: Cambridge University Press. Pena, Jesús (1999): «Partes de la morfología. Las unidades del análisis morfológico», en Ignacio Bosque / Violeta Demonte, coord., Gramática descriptiva de la lengua española. Madrid: Espasa Calpe, III, 4305-4366. Piera, Carlos / Varela, Soledad (1999): «Relaciones entre morfología y sintaxis», en Ignacio Bosque / Violeta Demonte, coord., Gramática descriptiva de la lengua española. Madrid: Espasa Calpe, III, 4367-4422.

El sufijo -age en los sustantivos deverbales del francés moderno

65

Plénat, Marc (1988): «Morphologie des adjectifs en –able», Cahiers de grammaire, 13, Toulouse-Le Mirail, 103-132. Ramchand, Gillian Catriona (2008): Verb meaning and the Lexicon. A First-Phase Syntaxis. Cambridge: Cambridge University Press. Roché, Michel (2009): «Base, thème, radical», Recherches linguistiques de Vincennes, 38, 95-134. Schäfer, Florian (2008): The Syntax of (Anti-) Causatives. External Argument in change-of-state Contexts. Amsterdam/Philadelphia: John Benjamins Publishing Company. Tubino-Blanco, Mercedes (2011): Causatives in Minimalism. Amsterdam/Philadelphia: John Benjamins Publishing Company. Van Valin, Robert D. Jr. (2005): Exploring the Syntax-Semantics Interface. New York: Cambridge University Press. Zribi-Hertz, Anne (1987): «La réflexivité ergative en français moderne», Le français moderne, 55, 1-2, 23-54.

 

Los italianismos de las Bellas Artes en los diccionarios del gallego Benedict Buono Universidade de Santiago de Compostela / G.I. Italianística / Red de Lexicografía RELEX

Italianisms in the Fine Arts in Galician dictionaries Abstract This paper analyzes the presence of Italianisms in the vocabulary of the Fine Arts (painting, sculpture and architecture) in modern Galician. We collect terms belonging to two broad groups: first, strictly specialist words (such as aquarelle or archivolt); second, terms pertaining to the common language which have nevertheless found a place in artistic jargon (such as names of materials). Keywords Italianisms, Galician, art terms, specialist languages, loanwords.

1. Introducción1 En un reciente artículo dedicado a la difusión del italiano en el mundo, Claudio Giovanardi constata, casi con una cierta sorpresa, que la lingua del sì, a pesar de la imagen económica y política no siempre edificante de Italia en los últimos años, sigue siendo un idioma muy demandado en el extranjero: en la clasificación de las lenguas más estudiadas ocuparía el quinto lugar, junto al inglés, francés, español y alemán (Giovanardi 2012: 4). 2 Así lo demuestran los datos de una encuesta pormenorizada patrocinada por el Ministero degli Esteri y realizada materialmente en los Institutos italianos de Cultura de los distintos continentes y en las universidades extranjeras a las que les asigna un lector ministerial (Giovanardi / Trifone 2012). Y si es posible que los números de estudiantes pueden cambiar muy –––––––— 1

2

El presente estudio se ha realizado en el ámbito del Proyecto de Investigación INCITE09 204 129 PR («Terminoloxía galega e italiana: Belas Artes»: BelAr), Subvencionado por la Dirección Xeral de I+D de la Consellería de Economía e Industria de la Xunta de Galicia, dirigido por la Dra. Isabel González Fernández. Este es el ranking de los idiomas más estudiados: inglés 46,8%; francés 19,4%; español 11,8%; alemán 9,8%; e italiano 6,4% (Giovanardi 2012: 9).

68

Benedict Buono

rápidamente, debido al ascenso económico de algunos países, como Alemania o China, y a pesar de la cautela de la que hay que armarse manejando las estadísticas, es cierto que el motivo que empuja a acercarse al italiano reside principalmente en la «identificazione tra la lingua e la cultura millenaria e raffinatissima che esprime» (Giovanardi 2012: 7). Después de siglos, la cultura sigue siendo el “petróleo”3 que permite al italiano difundirse por el mundo, a pesar de quienes identifican la imagen de su nación principalmente con su desarrollo económico, tecnológico e industrial: questo va detto con buona pace di chi continua sterilmente a sostenere che la cultura non serve per mangiare, in un Paese che contiene una buona quota del patrimonio artistico planetario e che si è distinto nei secoli passati per l’eccellenza dei risultati letterari, ma anche musicali e scientifici.

No se trata, por lo tanto, de un simple tópico, sino de que la lengua italiana ha sido y está firmemente anclada en la imagen de su cultura y, en particular, de su arte. De hecho, Patrizia Bertini Malgarini, ocupándose de la presencia de italianismos en las lenguas extranjeras, relaciona este fenómeno en primer lugar con la difusión de la cultura italiana y del arte (1993: 891): L’idea che, dal Rinascimento in poi, connette in qualche modo l’Italia e l’italiano al bello è tutt’ora molto viva nell’immaginario collettivo: le tradizionali definizioni del nostro paese dell’arte per eccellenza hanno trovato negli ultimi decenni una seria rispondenza nel grande successo del made in Italy. 4

Los préstamos lingüísticos son, sin duda, una muestra significativa de la supremacía ejercida por un país en un determinado sector cultural o económicocomercial,5 y el arte ha representado durante siglos, en todos los idiomas europeos, uno de los campos más abiertos a las influencias procedentes de Italia (Bertini Malgarini 1993: 883-884; Zolli 1991: 2). La acogida masiva de términos artísticos del italiano, por ejemplo, se registra en el español a partir del siglo XVI6, cuando “el contacto constante que los españoles mantuvieron desde el principio con los artistas italianos, no pudo menos de influir en la terminología técnica de los varios dominios de las artes plásticas”, tanto que el lenguaje de muchos autores de tratados está “saturado de términos tomados directamente del italiano o por lo menos forjados –––––––— 3 4

5

6

Para el uso de esta expresión metafórica, véase Giovanardi / Trifone (2012: 11-15). Juicio parecido expresa Zolli (1991: 2): “La terminologia musicale ed artistica delle principali lingue europee, ad esempio, è di origine italiana, data la superiorità avuta per lunghi secoli dall'Italia nel campo delle belle arti”. Sobre el lenguaje de las artes en Italia, véase Motolese (2012). Como afirma Zolli (1991: 2): “È stato notato dai linguisti che hanno affrontato il problema del prestito linguistico, come il fenomeno sia strettamente legato alla superiorità di un popolo in un determinato campo”. Es un rasgo característico de los lenguajes sectoriales la “circolazione internazionale delle terminologie sia attraverso l'uso di un'unica lingua di comunicazione (oggi l'inglese), sia attraverso le traduzioni” (Cortelazzo 1994: 12).

Los italianismos de las Bellas Artes en los diccionarios del gallego

69

según los modelos corrientes en este idioma” (Terlingen 1943: 68)7. Sin embargo, si la difusión de italianismos, aunque no relacionados con el arte, ha sido ampliamente estudiada en el español8, poco se ha hecho para determinar su presencia en otras lenguas de la península ibérica, como el gallego. Faltan, lamentablemente, estudios de conjunto sobre la historia de los italianismos en el gallego, aunque es posible obtener interesantes informaciones del trabajo de Ferreiro (1997: 304 y ss.), sin olvidarse del listado de voces italianas de la primera mitad del siglo XIX recogidas por Mariño Paz (2003: 275-276).9 Por lo tanto, sería útil investigar sobre la presencia de italianismos en la lengua de Galicia, tierra cuya capital histórica, Santiago de Compostela, meta de un camino de peregrinación de fama mundial, ha mantenido, desde los orígenes, una estrecha vinculación con Italia, y Roma en particular. Y dado que el arte, acabamos de verlo, representa unos de los sectores más destacados y conocidos de la cultura italiana, limitaremos esta primera aproximación a los italianismos en el gallego, a los términos artísticos relativos a pintura, escultura y arquitectura.10 Cabe ahora detenerse para formular algunas reflexiones preliminares sobre los criterios de selección llevados a cabo para detectar estas voces. En primer lugar hay que destacar que, hasta el momento, faltan para el gallego obras históricolexicográficas de amplio espectro, sobre todo diccionarios etimológicos, situación comprensible, tratándose de una lengua que se ha convertido en oficial solo en época relativamente reciente y, por lo tanto, está aún en fase de constitución y estabilización de su material lexicográfico. Por lo tanto, para realizar nuestro estudio, nos hemos basado en los diccionarios monolingües que recogen la etimología de los lemas11: DXEL, DXEL2, DS21 y VOLGA, a pesar de que éste último registre solo de forma esporádica el idioma de origen de las palabras, mientras que el –––––––— 7 8 9

10

11

La introducción y el detallado repertorio sobre tecnicismos artísticos ofrecidos por Terlingen se encuentra respectivamente en las páginas 67-70 y 102-144. Me remito, por lo tanto, a González (2001) y Sanmarco (2001, 2006, 2009). Para una panorámica de los estudios en este campo, es fundamental la contribución de Isabel González publicada en este volumen, Panorámica de la lexicografía italiano-gallega; a la que añadimos Léxico específico en la lexicografía gallego-italiana, en prensa; sin olvidar, de la misma autora, El léxico científico-técnico en los diccionarios bilingües (con especial referencia al italiano-gallego), y de Ana Domínguez, La terminología gallego-italiana de la hostelería: presentación de un nuevo vocabulario, ambas de próxima publicación en las actas de Las Letras en las Ciencias. Settimana della lingua italiana. Il linguaggio scientifico; y, finalmente, de María Teresa Sanmarco, Tratamiento de los falsos amigos léxicos en los diccionarios italoespañoles, a punto de ser publicado en las actas del I Coloquio Internacional de Lexicografía: diccionarios e innovación. Este corte se ajusta a los criterios de edición de los tres volúmenes del Vocabulario galegoitaliano das Belas Artes (Arquitectura; Escultura y Pintura), dirigido por Isabel González, de próxima publicación. A la misma autora y a su grupo de investigación, al cual me honra pertenecer, hay que reconocer el mérito de haber profundizado la cuestión lexicografica entre gallego e italiano, con la publicación del DIGAL y de los dos volúmenes del Vocabulario galego-italiano: Gastronomia y Vocabulario galego-italiano: Hostelaría. Sin embargo, ninguno de los diccionarios consultados hacen referencia a la fuente bibliográfica utilizada para las etimologías de los lemas.

70

Benedict Buono

DRAG nunca lo indica. Puesto que no existen versiones informatizadas de dichos diccionarios se ha procedido a un examen manual y sistemático de las obras elegidas. Además, dado que ninguno de los diccionarios analizados registra la fecha del primer testimonio escrito de la palabra, tuvimos que recurrir a los repertorios informatizados, como el TILGA, que recoge las voces contenidas en textos literarios y no literarios escritos en gallego desde 1612 hasta 2002 (por un total de 1464 obras); el TMILG, tesoro informatizado del gallego antiguo (un período amplísimo, comprendido entre los siglos VIII-XVII), con ejemplos tomados de la prosa notarial, no notarial y de la poesía; y el CORGA, un banco de datos que contiene alrededor de treinta millones de formas recogidas de periódicos, revistas y libros publicados entre 1975 y 2010. Es obvio que el primer testimonio escrito (casi siempre fechable entre los siglos XIX y XX) tiene un valor puramente indicativo, consideración aún más evidente para un idioma, el gallego, que se ha transmitido de forma esencialmente oral en el transcurso de los siglos.12 En la recogida del material de este trabajo quisimos establecer criterios aptos no tanto para registrar los italianismos artísticos en su totalidad, sino para fijar, de una forma suficientemente sistemática, el reconocimiento de los lemas recopilados, estableciendo así su efectiva penetración en el idioma de llegada. De este modo se evitan todas aquellas palabras que, aún siendo familiares a los hablantes gallegos, se acogen simplemente por tendencias exóticas o modas y, por lo tanto, no se pueden considerar come verdadera prueba de una influencia lingüística estable. Lo que no impide, en un futuro, llevar a cabo investigaciones sobre términos presentes cotidianamente en los medios de comunicación o en las publicaciones sectoriales: sin embargo, en este caso, el enfoque sería distinto y terminaría privilegiando la faceta puramente sincrónica y “efímera” de los préstamos. En el repertorio de italianismos recogidos a continuación se encuentran voces pertenecientes a dos grandes grupos: el primero es el de palabras estrictamente sectoriales (como acuarela o arquivolta), el segundo de términos que, aún perteneciendo a la lengua común, han encontrado cabida en el lenguaje artístico (como, por ejemplo, los nombres de materiales).13 Por lo que se refiere a la presentación de las voces recopiladas, se indica en primer lugar la entrada en gallego, registrando las variantes gráficas, si las hay; la –––––––— 12

13

Para una historia del gallego y de sus séculos escuros, cfr. Mariño Paz (1998), Monteagudo (1999) y Freixeiro / Gómez (1998); sobre la componente culta del léxico entrado en el mismo idioma antes de 1975, cfr. Rodríguez Río (1998: 44-45). Si las palabras de los lenguajes especializados que pasan a la lengua común conservan “in qualche misura il fascino e il prestigio della loro specializzazione d'origine”, siendo a menudo usadas “in senso figurato o estensivo”, en el proceso inverso, es decir en el paso de la lengua común a la especializada, se vuelve a la “autonomia tecnica, al significato univoco [...] non ambiguo, non polivalente” (Beccaria 1988: 162-163). De hecho “il lessico delle lingue speciali è composto [...] da segni aggiuntivi rispetto a quelli facenti parte della lingua comune, perché deve essere in grado di rispondere alle esigenze di denominazione del settore di attività cui si riferisce, che sono più estese o più raffinate di quelle rappresentate, per quel settore, dalla lingua comune” (Cortelazzo 1994: 9).

Los italianismos de las Bellas Artes en los diccionarios del gallego

71

categoría gramatical 14 ; la correspondiente forma italiana de la que procede, añadiendo −si difiere del español o si se quiere destacar una particular acepción− el significado que ha adquirido en gallego15; la fecha del primer testimonio escrito del término, si está disponible; y, a continuación, los diccionarios en los que la palabra está registrada, señalando, además, si se le atribuye un étimo distinto del italiano.

2. Lemario 1.

acuarela s.f. < acquarello (1886: TILGA). Presente en DXEL, DRAG, DXEL 2, VOLGA y DS21. 2. altorrelevo s.m. < altorilievo (1905: TILGA). Presente en DXEL, DRAG, DXEL2, VOLGA y DS21; DS21 y DXEL2 no lo consideran italianismo. 3. arabesco s.m. < arabesco ‘dibujo de adorno compuesto de tracerías, follajes, cintas y roleos’ (1895: TILGA). Presente solo en DXEL, DXEL2, VOLGA y DS21. 4. arquitrabe s.f. < architrave (1927: TILGA). Presente en DXEL, DRAG, DXEL2, VOLGA y DS21. 5. arquivolta s.f. < archivolto (archivolta 1887, arquivolta 1928: TILGA). Presente en DXEL, DRAG, DXEL2, VOLGA y DS21. 6. augaforte s.f. < acquaforte (1932: TILGA). Presente en DXEL, DXEL2, VOLGA, DRAG y DS21, pero registrado como italianismo en DXEL y DXEL2. 7. aventurina s.f. < avventurina 'venturina, tipo de cuarzo con láminas de mica dorada en su masa'; y 'vidrio de color rojizo fundido con limaduras de cobre inventado en Venecia en el siglo XVII'; presente solo en VOLGA y DS21; éste último haría proceder el italianismo del francés aventurine o pierre aaventurine. 8. balaústre s.m. < balaustra (1894: TILGA). Presente en DXEL, DRAG, DXEL2, VOLGA y DS21, solo para DXEL2 es italianismo; según DS21 procede del latín pero con una probable influencia del italiano balaustro. 9. balcón s.m. < balcone ‘balcone’ (1347: TMILG). Presente en DXEL, DRAG, DXEL2, VOLGA y DS21; López Ferreiro (1997: 315); Mariño Paz (2003: 275). También con el valor de ‘belvedere, luogo elevato’. 10. baldaquino s.m. < baldacchino (baldiquí 1895, baldaquino 1920: TILGA). Presente en DXEL, DXEL2, VOLGA y DS21. 11. bronce s.m. < bronzo (1853: TILGA). Presente en DXEL, DRAG, DXEL2, VOLGA y DS21; para DS21 puede ser italianismo o francesismo. 12. busto s.m. < busto (1877: TILGA). Presente en DXEL, DRAG, DXEL2, VOLGA y DS21; para DXEL2 no es italianismo. –––––––— 14 15

Tratándose en su mayoría de sustantivos, la siglas se reducen a s.m. (sustantivo masculino) y s.f. (sustantivo femenino); solo un caso de adj. (adjetivo). En estos casos las definiciones están tomadas de la versión online del DRAE.

72

Benedict Buono

13. capricho s.m. < capriccio (1864: TILGA). Presente en DXEL, DRAG, DXEL2, VOLGA y DS21 y López Ferreiro (1997: 315). 14. caricatura s.f. < caricatura, también con valor figurado. (1884: TILGA). Presente en DXEL, DRAG, DXEL2, VOLGA y DS21. 15. cartela s.f. < cartella ‘decoración que enmarca una inscripción’ (1895: TILGA). Presente en DXEL, DXEL2 y VOLGA. 16. cartón s.m. < cartone con el valor específico de ‘dibujo preparatorio, en papel grueso, modelo de la obra definitiva’(1813: TILGA). Presente en DXEL, DRAG, DXEL2, VOLGA y DS21; DS21 propone una doble etimología italiana o francesa; cfr. también Mariño Paz (2003: 275). 17. casetón s.m. < cassettone (1992: TILGA). Presente en DXEL, VOLGA y DS21: para DS21 no es italianismo y procedería de casa. 18. caveto s.m. < cavetto ‘tipo de moldura’ (1895: TILGA). Presente en DXEL, VOLGA y DS21. 19. claroscuro s.m. < chiaroscuro (craro escuro 1880, crariescuro 1884, craroescuro 1884, craroscuro 1963, clarescuro 1983, claroscuro 1986: TILGA). Presente en DXEL, DRAG, DXEL2, VOLGA y DS21; para DXEL2 y DS21 no es italianismo. 20. coliseo s.m. < colosseo ‘sala construida para espectáculos públicos’ (1888: TILGA). Presente en DXEL, DRAG, DXEL2, VOLGA y DS21; para DXEL2 no es italianismo. 21. columnata s.f. < colonnato (columnata, colunata 1934: TILGA). Presente en DXEL, DRAG, DXEL2, VOLGA y DS21; para DXEL y DXEL2 no es italianismo. 22. contraforte s.m. < contrafforte (1888: TILGA). Presente en DXEL, DRAG, DXEL2, VOLGA y DS21; para DXEL y DXEL2 no es italianismo. 23. copela s.f. < coppella (1990: TILGA). Presente en DXEL, DXEL2, VOLGA y DS21; para DXEL procedería directamente del latín cuppa. 24. cornixa s.f. < cornice ‘parte superior del cornisamento de un pedestal, edificio o habitación’ (1857: TILGA). Presente en DXEL, DRAG, DXEL2, VOLGA y DS21; para DXEL2 procede dal greco koronis; para DS21 no es italianismo. 25. cúpula s.f. < cupola (1828: TILGA). Presente en DXEL, DRAG, DXEL2, VOLGA y DS21. 26. deseño s.m. < disegno ‘diseño’ (diseño 1888, deseño 1922: TILGA). Presente en DXEL, DRAG, DXEL2, VOLGA y DS21; para DS21 no es italianismo. 27. escaiola s.f. < scagli(u)ola (1922: TILGA). Presente en DXEL, DRAG, DXEL2, VOLGA y DS21. 28. escalinata s.f. < scalinata (1880: TILGA). Presente en DRAG, DXEL2, VOLGA y DS21. 29. escarpa s.f. < scarpa ‘plano inclinado que forma la muralla del cuerpo principal de una plaza, desde el cordón hasta el foso y contraescarpa’ (1983: TILGA). Presente en DXEL, DXEL2, VOLGA y DS21; para DXEL procede del germánico skarp.

Los italianismos de las Bellas Artes en los diccionarios del gallego

73

30. escorzo s.m. < scorcio (1894: TILGA). Presente en DXEL, DXEL2, VOLGA y DS21. 31. esfumar v.tr. < sfumare (1892: TILGA). Presente en DXEL2, VOLGA y DS21. 32. esfumino s.m. < sfumino (esfumiño 1990: TILGA y CORGA). Presente en VOLGA y DS21. 33. estuco s.m. < stucco (1905: TILGA). Presente en DXEL, DRAG, DXEL2, VOLGA y DS21. 34. fachada s.f. < facciata ‘facciata’, también con valore fig. (1853: TILGA). Presente en DXEL, DRAG, DXEL2, VOLGA y DS21; para DXEL no es italianismo. 35. filigrana s.f. < filigrana (1872: TILGA). Presente en DXEL, DRAG, DXEL2, VOLGA y DS21. 36. galería s.f. < galleria (1976: CORGA; López Ferreiro (1997: 316); presente en DXEL, DRAG, DXEL2, VOLGA y DS21; para DXEL, DEXL2 y DS21 no es italianismo. 37. graffiti s.m.pl. = 10 biobibliográfico (10), biocarburante (18), biodiesel (74), biodiversidade (124), biotecnoloxía (57), biotecnolóxico (10)

ciberespazo (17), ciberirmandade (19), cibermedio (11), cibernáutico (13)

La creación de neologismos en la lengua gallega: autonomía o dependencia



Neoprefijo e(46)

33

eco(22)

13

euro(51)

24

Frecuencia = 1 (hápax) e-adicto, e-banco, e-book, e-caderno, e-cancela, e-católico, e-comunicación, e-converxencia, e-coordinación, e-crime, e-desenvolvemento, e-dni, e-enciclopedia, e-factura, e-farmacia, e-iniciativa, e-libro, e-liña, e-macrobotellón, e-multa, e-negocio, e-petición, e-proxecto, e-publicidade, e-reader, e-revista, e-sexo, e-sociedade, e-tarxeta, e-título, e-trámite, e-votación, e-voto ecoagroturismo, ecoclima, ecocondición, ecodesenvolvemento, ecoeconomía, ecoeficiencia, eco-enerxía, ecolingüístico, ecopoema, ecosanitario, ecosistémico, eco-terrorista, ecozona euroacordo, euroaxencia, euroaxuda, eurobilla, euroboleto, eurobolsa, eurocaos, eurocidadán, euroconselleiro, eurócrata, eurodebate, euroeleccións, euroequipo, euroforza, euroinvestigación, euroislámico, euromandato, euromísil, eurooptimista, euroorzamento, europatente, europrotección, eurosocio, eurosusto, eurovisismo

133

0

Frecuencia >= 10 e-learning (9)

2

ecoplanta (18), ecotaxa (16)

10

eurobarómetro (15), eurocámara (41), eurodeputado (145), eurofondo (17), euromediterráneo (10) europarlamentario (15), europarlamento (13), eurorrexión (85), eurovisivo (18), eurozona (72)

Tabla 2: Hápax y neologismos frecuentes en gallego

El número total de neologismos que tienen un único registro es de 144, el 52,17% del total. Los que tienen 10 ocurrencias o más y, por tanto, una frecuencia relativamente alta, son solo 22, un 7,97% del total de neologismos observados. Estos datos muestran que hay un número elevado de neologismos que no consiguieron estabilizarse, ya que solo se registran una vez. Podemos entender que, pese a existir un número relativamente alto de neologismos creados por la regla, más de la mitad no están difundidos. Entre los no difundidos se encuentran creaciones expresivas, como eurosusto, e-católico, e-cancela, ciber-tara, ciber-verbena o ciber-barallete; lo



134

Ana Belén Crespo / Xosé María Gómez / Xavier Gómez

mismo que creaciones denominativas, como euroforza, e-multa, cibercampaña, bioacústico o bioantropólogo. 5.1.2. Análisis de productividad y frecuencia: español Los datos analizados para la lengua española a partir de de la base de datos Obneo proporcionan los siguientes resultados: del neoprefijo bio- se dan 804 ocurrencias; de ciber-, 820; de euro-, 1.096; de e-, 197 y de eco-, 525. Esto hace una media por neoprefijo de 688,4, lo que indicaría que la regla de composición está consolidada, incluso en el caso de e- que posee un número de ocurrencias comparativamente bajo. No pudimos obtener en la base de datos Obneo el número de neologismos diferentes por neoprefijo, sino únicamente los datos totales. En la Tabla 3 presentamos los datos correspondientes al español de aquellos neologismos coincidentes entre gallego y español, usando como fuente, además de Obneo, el corpus CREA de la RAE. Pretendemos con esto comprobar si hay alguna diferencia entre el comportamiento de los neologismos registrados en las dos lenguas y verificar si existe una creación autónoma del español en gallego, que se podría vislumbrar si se comprueba que no todas las palabras neológicas gallegas se documentan también en castellano:  Neoprefijo biocibereecoeuroTotal

Ocurrencias 2 109 797 130 552 1 222 4 810

Neologismos diferentes 46 (11 RAE) 35 (3 RAE) 13 (0 RAE) 10 (2 RAE) 23 (5 RAE) 127 (21 RAE: 16,53%)

Tabla 3: Neologismos en español (coincidentes con el gallego) por ocurrencias y tipos

De los 276 neologismos del gallego registramos 127 en las bases de datos y corpus del español (Obneo y CREA), lo que representa un 46,01% de las palabras originales con un total de 4 810 ocurrencias. No se registran en español 149 (53,99%). El neoprefijo con el que aparecen más neologismos en español es bio- (46) y también el que tiene más ocurrencias (2 109). Observamos que el número de registros de estos 127 neologismos es muy elevado (una media de 37,87 ocurrencias por neologismo), hecho que está motivado porque existen corpus muy grandes en esta lengua y, también, por una evidente consolidación del modelo compositivo. Los 127 neologismos del gallego coincidentes con el español son los siguientes: a) bio-: bioabsorbente, bioactivo, biocarburante, biocatalizador, biocida, biocidio, biociencia, biocombustíbel, bioconstrución, bioconstrutor, biochip, biodegradar(se), biodiésel, biodispoñibilidade, biodiversidade, bioenerxía, bioetanol, biofarmacéutico, biofilia, biofilmografía, biofiltro, biogás, bioindicador, bioinformática, bioinformático, biomarcador, biomecánico, biomedicina, biometanización, biométrico, biomolecular, biónico, bioplástico, biopoder, biopolímero, bioprospección, biosanitario, biosaudable,



La creación de neologismos en la lengua gallega: autonomía o dependencia

b)

c) d) e)



135

bioseguridade, biosensor, biotecnólogo, biotecnoloxía, biotecnolóxico, bioterrorismo, biotoxina, bioxeográfico ciber-: ciber, ciber adicción, ciberacción, ciberacoso, ciberactivismo, ciberanalfabeto, ciberataque, ciberaula, cibercafé, cibercampaña, cibercidade, cibercrime, cibercultura, cibercharla, ciberdelincuencia, ciberdelincuente, ciberdereito, ciberdisidente, ciberespacio, ciberespionaxe, ciberforza, cibermedio, cibermundo, cibernauta, cibernovela, ciberocupa, ciberoteca, ciberpolicía, ciberprogresista, ciberpunk, ciberseguridade, cibersexo, ciberterrorismo, ciberxornalismo, ciberxornalista e-: e-administración, e-banco, e-book, e-comercio, e-comunicación, e-correo, e-democracia, e-goberno, e-learning, e-libro, e-marketing, e-pago, e-reader eco-: ecodesenvolvemento, ecoeficiencia, ecofeminismo, ecólogo, ecoplanta, ecosistémico, eco-socialismo, ecosocialista, ecotaxa, ecoturismo euro-: eurobarómetro, eurocámara, eurocaos, eurocéntrico, eurocentrismo, eurocomisario/a, eurócrata, eurodeputado/a, euroeleccións, euroescepticismo, euroescéptico, eurofestival, euroliga, euromanifestación, euromediterráneo, euromísil, euroorde, euroorzamento, europarlamentario/a, europarlamento, eurorrexión, eurovisivo, eurozona

Los 149 neologismos gallegos no coincidentes con el castellano corresponden tanto a dominios especializados como a la lengua general, creados tanto por necesidades expresivas como denominativas. Aparte de ciberbarallete, ciberferrancho y cibermilleiral que, quizás, parezcan intraducibles al castellano por ser neologismos de autoría, el resto corresponden a conceptos extendidos en nuestro ámbito cultural y susceptibles de ser documentados en español. La lista completa es la siguiente: a) bio-: bioabsorbente, bioactivo, bioacumulábel, bioacústico, bioantropólogo, biobibliografía, bio-bibliográfico, biocampus, biocapacidade, biocarburante, biocatálogo, biocentro, biocida, biocidio, biociencia, bioclúster, bioconstrución, bioconstrutor, bioconsumo, biodefensa, biodegradar(se), biodiésel, biodispoñibilidade, bioedificio, bioenerxía, bioetanol, biofarmacéutico, biofilia, biofilmografía, biofiltro, biofuncional, bioindicador, bioinformático, bioinorgánico, bioinvasión, biomarcador, biomecanización, biometanización, biomolecular, biónico, bioplástico, biopoder, bioprospección, biorock, biorremedio, biosanitario, biosaudable, bioseguridade, biosensor, biosimulación, biotécnico, biotecnocientífico, biotecnólogo, biotecnolóxico, bioterror, bioterrorismo, biotipólogo, biotoxina, bioxeográfico, bioxeración b) ciber-: ciber axuda, ciber camposanto, ciber control, ciber convocatoria, ciber dependencia, ciber eiva, ciber mar, ciber mundo, ciber nominado, ciber paro, ciber policía, ciber tempo, ciber vía, ciber viaxe, ciber vixilancia, ciberacción, ciberacoso, ciberactivismo, ciberactivista, ciber-adicción, ciber-administración, ciberanalfabeto, ciberataque, ciberatleta, ciberaula, ciberbarallete, ciber-becho, cibercafé, cibercamión, cibercampaña, cibercandidato, cibercidade, ciberconsumidor, ciberconversa, cibercrime, cibercultura, cibercharla, ciberdebate, ciberdelincuencia, ciberdelincuente, ciberdereito, ciberdespido, ciberdespistado, ciberdisidente, ciber-encontro, ciber-enderezo, ciberescritor, cibereslán, ciberespionaxe, ciberferrancho, ciberfesta, ciberfesteiro, -a,



136

Ana Belén Crespo / Xosé María Gómez / Xavier Gómez

ciberforza, ciberinstituto, ciberirmandade, ciberliterario, -a, ciberliteratura, cibermedio, cibermilleiral, cibermundo, cibernáutico, -a, cibernavegación, cibernovela, ciberocupa, ciberoteca, ciberpersoeiro, ciberplaneta, ciberpostal, ciberprogresista, ciberpunk, ciberrede, cibersala, ciberseguridade, ciberserie, cibersexo, cibersocial, cibersociedade, ciberterrorismo, cibertrónico, -a, ciber-verbena, ciberxornal, ciberxornalismo, ciberxornalista c) e-: e-adicto, e-administración, e-aula, e-banco, e-book, e-caderno, e-cancela, e-católico, e-ciencia, e-comercio, e-comunicación, e-converxencia, e-coordinación, e-correo, e-crime, e-democracia, e-desenvolvemento, e-dni, e-enciclopedia, e-factura, e-farmacia, e-goberno, e-iniciativa, e-learning, e-libro, e-liña, e-macrobotellón, e-marketing, e-multa, e-negocio, e-pago, e-papeleo, e-petición, e-postal, e-proxecto, e-publicidade, e-reader, e-revista, e-revolución, e-sexo, e-sociedade, e-tarxeta, e-título, e-trámite, e-votación, e-voto d) eco-: ecoagroturismo, ecobiblioteca, ecoclima, ecocondición, ecodesenvolvemento, ecoeconomía, ecoeficiencia, eco-enerxía, ecofeminismo, ecolingüístico, ecólogo, ecoplanta, ecopoema, ecosanitario, ecosistémico, eco-socialismo, ecosocialista, ecotaxa, eco-terrorista, ecotraballo, ecoturismo, ecozona e) euro-: euroacordo, euroaxencia, euroaxuda, eurobarómetro, eurobilla, euroboleto, eurobolsa, eurocámara, eurocaos, eurocéntrico, eurocidadán, eurocidade, eurocomisario/a, eurocomisión, euroconselleiro, euroconstitución, eurodebate, euroeleccións, euroequipo, eurofestival, eurofondo, euroforza, eurofuturo, euroinvestigación, euroislámico, euroliga, euromandato, euromanifestación, euromediterráneo, euromesa, euromísil, eurooptimista, euroorde, euroorzamento, europarlamentario/a, europarlamento, europatente, europortal, europrotección, eurorrexión, eurorrexional, eurosocio, eurosusto, eurovisismo, eurovisivo, eurozona 

El diccionario de la RAE recoge 21 de los neologismos del español coincidentes con el gallego, lo que supone el 16,53% del total de los registrados en español. Se trata de los siguientes: a) bio-: biocatalizador, biochip, biocombustible, biodiversidad, biogás, bioinformática, biomecánico, biomedicina, biométrico, biopolímero, biotecnología b) ciber-: ciber, ciberespacio, cibernauta c) eco-: ecoturismo, ecólogo d) euro-: eurocentrismo, eurócrata, eurodiputado, euroescepticismo, euroescéptico Finalmente, en la Tabla 4, igual que hicimos para el gallego y en el mismo formato, se muestran los datos sobre los neologismos registrados una única vez en español (hápax) y más de diez veces.





La creación de neologismos en la lengua gallega: autonomía o dependencia

Neoprefijo bio(44)

8

Frecuencia = 1 (hápax) bioabsorbente, bioactivo, bioconstructor, biodegradar(se), biofiltro, biomarcador, biosensor, biotoxina

16

ciber(38)

9

ciberacción, ciberaula, cibercharla, ciberespionaje, ciberfuerza, cibernovela, ciberperiodista, ciberprogresista, ciber viaje

12

e(13)

6

2

eco(10)

1

e-banco, e-comunicación, ecorreo, e-democracia, emarketing, e-pago ecofeminismo

euro(23)

4

eurocaos, euromisil, europresupuesto, eurovisivo

12

5

137

Frecuencia >= 10 biocarburante (62), biociencia (11), biocombustible (12), bioconstrucción (15), biodiésel (152), biodisponibilidad (86), biodiversidad (695), bioenergía (19), bioetanol (48), biofilmografía (14), biogás (100), biogeográfico (14), bioindicador (11), bioinformática (34), biomedicina (76), biónico (14), biosanitario (22), bioseguridad (67), biotecnología (501), biotecnológico (27), bioterrorismo (29) ciber (47), ciberacoso (15), ciberataque (32), cibercafé (41), cibercrimen (19), cibercultura (14), ciberdelincuente (16), ciberespacio (479), cibernauta (28), ciberpunk (11), cibersexo (14), ciberterrorismo (15) e-learning (70), e-book (33)

ecodesarrollo (11), ecoplanta (18), ecosocialista (128), ecotasa (56), ecoturismo (265) eurocámara (39), eurocéntrico (11), eurocentrismo (35), eurocomisario (22), eurodiputado (318), euroescepticismo (80), euroescéptico (82), euroorden (63), europarlamentario (60), europarlamento (13), eurorregión (31), eurozona (431)

Tabla 4: Hápax y neologismos frecuentes en español

Los datos anteriores corresponden únicamente a los neologismos coincidentes entre gallego y español y, por lo tanto, no reflejan exactamente la situación de esta lengua con respecto a la composición con estos neoprefijos. Con todo, sí que se puede dar una visión aproximada: 28 neologismos, un 22,04% de los registrados tiene una única ocurrencia; los que tienen más de 10 son 47, un 37% de los



138

Ana Belén Crespo / Xosé María Gómez / Xavier Gómez

registrados. Si lo comparamos con los datos del gallego, vemos que el porcentaje de hápax en esta lengua es muy superior al del español (52,17% frente a 22,04%), mientras que el porcentaje de neologismos de frecuencia mayor que 10 es muy inferior (7,97% frente a 37%). Sin olvidar que la diferencia de datos puede estar motivada por la documentación, basada en grandes corpus para el español, el hecho de que los neologismos en español alcancen una mayor difusión permite afirmar que la regla compositiva está más consolidada en esta lengua. 5.1.3. Análisis de productividad y frecuencia: portugués Las ocurrencias totales de las bases de datos en que hay registros para el portugués son las siguientes: bio-, 71; eco-, 165; e-, 53; euro-, 64; y ciber-, 42. Los datos son muy poco significativos, sobre todo teniendo en cuenta que están tomados de las dos bases de datos sobre neologismos a las que se puede tener acceso (Neorrom y TermNeo). Desgraciadamente, con estos datos no es posible hacer una evaluación exacta sobre la consolidación de la regla compositiva. A continuación se presenta la documentación sobre los neologismos coincidentes en gallego y portugués con la misma finalidad que lo hicimos para el español:  Neoprefijo biocibereecoeuroTotal

Ocurrencias 638 321 5 78 57 + 1 425 (eurodeputado) 1 099 + 1 425= 2524

Neologismos diferentes 21 (9 Priberam) 14 (11 Priberam) 3 (1 Priberam) 3 (2 Priberam) 10 (5 Priberam) 51 (29 Priberam: 56,8%)

Tabla 5: Neologismos en portugués (coincidentes con el gallego) por ocurrencias y tipos

De los 276 neologismos que se intentaron documentar en portugués, aparecieron registros para 51 (18,47%) con un total de 1 099 ocurrencias. Desechamos los 1.425 ejemplos de eurodeputado. No se registran 225 (81,52%). El neoprefijo que da lugar a más neologismos es bio-¸ como en español, y es también el que registra más ocurrencias totales; eco- y e- tienen unos registros extremadamente bajos. La media de ocurrencias por neologismos es de 22,89, lo que permite hablar de una cierta consolidación de la regla. Los neologismos coincidentes entre gallego y portugués son los siguientes: a) bio-: biobibliografía, biocida, biociencia, biochip, biocombustible, biodiésel, biodiversidade, bioetanol, biofilia, biogás, bioinformática, biomedicina, biométrico, biomolecular, biónico, bioprospección, biotécnico, biotecnoloxía, biotecnolóxico, biotecnólogo, biotoxina b) ciber-: ciber, ciberataque, cibercafé, cibercrime, cibercultura, ciberespazo, ciberespionaxe, ciberliteratura, cibermundo, cibernauta, ciberpunk, cibersexo, ciberterrorismo, ciberxonal c) e-: e-book, e-comercio, e-sexo d) eco-: ecoeconomía, ecoturismo, ecotaxa



La creación de neologismos en la lengua gallega: autonomía o dependencia

139

e) euro-: eurobarómetro, eurocéntrico, eurocidadán, eurócrata, eurodeputado, eurofestival, euroforza, euromísil, europarlamento  Entre los neologismos no coincidentes con el portugués hay denominaciones que se refieren a conceptos generales y que pueden aparecer en cualquier lengua, pero también conceptos que solo aparecen en gallego o en el ámbito de la cultura española general y que, lógicamente, no pueden aparecer en portugués. La lista completa es la siguiente: a) bio-: bioabsorbente, bioactivo, bioacumulábel, bioacústico, bioantropólogo, bio-bibliográfico, biocampus, biocapacidade, biocarburante, biocatalizador, biocatálogo, biocentro, biocidio, bioclúster, bioconstrución, bioconstrutor, bioconsumo, biodefensa, biodegradar(se), biodispoñibilidade, bioedificio, bioenerxía, biofarmacéutico, biofilmografía, biofiltro, biofuncional, bioindicador, bioinformático, bioinorgánico, bioinvasión, biomarcador, biomecánico, biomecanización, biometanización, bioplástico, biopoder, biopolímero, biorock, biorremedio, biosanitario, biosaudable, bioseguridade, biosensor, biosimulación, biotecnocientífico, bioterror, bioterrorismo, biotipólogo, bioxeográfico, bioxeración b) ciber-: ciber axuda, ciber camposanto, ciber control, ciber convocatoria, ciber dependencia, ciber eiva, ciber mar, ciber mundo, ciber nominado, ciber paro, ciber policía, ciber tempo, ciber vía, ciber viaxe, ciber vixilancia, ciberacción, ciberacoso, ciberactivismo, ciberactivista, ciber-adicción, ciber-administración, ciberanalfabeto, ciberatleta, ciberaula, ciberbarallete, ciber-becho, cibercamión, cibercampaña, cibercandidato, cibercidade, ciberconsumidor, ciberconversa, cibercrime, cibercultura, cibercharla, ciberdebate, ciberdelincuencia, ciberdelincuente, ciberdereito, ciberdespido, ciberdespistado, ciberdisidente, ciber-encontro, ciber-enderezo, ciberescritor, cibereslán, ciberespacio, ciberespionaxe, ciberferrancho, ciberfesta, ciberfesteiro, -a, ciberforza, ciberinstituto, ciberirmandade, ciberliterario, -a, ciberliteratura, cibermedio, cibermilleiral, cibermundo, cibernauta, cibernáutico, -a, cibernavegación, cibernovela, ciberocupa, ciberoteca, ciberpersoeiro, ciberplaneta, ciberpostal, ciberprogresista, ciberpunk, ciberrede, cibersala, ciberseguridade, ciberserie, cibersexo, cibersocial, cibersociedade, ciberterrorismo, cibertrónico, -a, ciberverbena, ciberxornal, ciberxornalismo, ciberxornalista c) e-: e-adicto, e-administración, e-aula, e-banco, e-caderno, e-cancela, e-católico, e-ciencia, e-comunicación, e-converxencia, e-coordinación, e-correo, ecozona, e-crime, e-democracia, e-desenvolvemento, e-dni, e-enciclopedia, e-factura, e-farmacia, e-goberno, e-iniciativa, e-learning, e-libro, e-liña, e-macrobotellón, e-marketing, e-multa, e-negocio, e-pago, e-papeleo, e-petición, e-postal, e-proxecto, e-publicidade, e-reader, e-revista, e-revolución, e-sociedade, e-tarxeta, e-título, e-trámite, e-votación, e-voto d) eco-: ecoagroturismo, ecobiblioteca, ecoclima, ecocondición, ecodesenvolvemento, ecoeficiencia, eco-enerxía, ecofeminismo, ecolingüístico, ecólogo, ecoplanta, ecopoema, ecosanitario, ecosistémico, eco-socialismo, ecosocialista, eco-terrorista, ecotraballo



140

Ana Belén Crespo / Xosé María Gómez / Xavier Gómez

e) euro-: euroacordo, euroaxencia, euroaxuda, eurobilla, euroboleto, eurobolsa, eurocámara, eurocaos, eurocidade, eurocomisario/a, eurocomisión, euroconselleiro, euroconstitución, eurodebate, euroeleccións, euroequipo, euroescepticismo, euroescéptico, eurofondo, eurofuturo, euroinvestigación, euroislámico, euroliga, euromandato, euromanifestación, euromediterráneo, euromesa, eurooptimista, euroorde, euroorzamento, europarlamentario/a, europatente, europortal, europrotección, eurorrexión, eurorrexional, eurosocio, eurosusto, eurovisismo, eurovisivo, eurozona El diccionario portugués manejado de Priberam recoge 29 de los 51 neologismos documentados (56,8%). Es reseñable este dato, que se aleja claramente de los porcentajes registrados para gallego y para español, especialmente si lo comparamos con los diccionarios académicos de estas lenguas. Los neologismos incluidos en el diccionario de Priberam son los siguientes: a) bio-: biobibliografía, biodegradar(se), biodiésel, biodiversidade, biofilia, biométrico, biónico, bioprospección, biotecnoloxía b) ciber-: ciber, ciberataque, cibercafé, cibercrime, cibercultura, ciberespazo, ciberespionaxe, ciberliteratura, cibernauta, cibersexo, ciberterrorismo c) e-: e-book d) eco-: ecotaxa, ecoturismo e) euro-: eurocéntrico, eurocentrismo, eurócrata, eurodeputado/a, euromísil La Tabla 6, a continuación, muestra los datos de las frecuencias mínimas e iguales o superiores a 10 en portugués, en el mismo formato que las tablas anteriores correspondientes al gallego y al español: Neoprefijo bio(21)

10

Frecuencia = 1 (hápax) bioprospección, biodiésel, biotecnólogo, biotecnolóxico, biométrico, biochip, biofilia, biodegradarse, bioetanol, bioinformática ciberxornal

ciber(11)

1

e(3) eco(3) euro(10)

1

e-sexo

0

1

ecoeconomia

2

5

eurocentrismo, eurobarómetro, eurocidadán, eurofestival, euromísil

3

Tabla 6: Hápax y neologismos frecuentes en portugués



4

4

Frecuencia >= 10 biodiversidade (270), biogás (98), biomedicina (16), biotecnologia (226)

cibercafé (16), ciberespaço (243), cibernauta (19), cibersexo (15) e-book (2), e-comercio (2) ecotaxa (42), ecoturismo (35) eurocéntrico (11), eurócrata (36), eurodeputado (1425)

La creación de neologismos en la lengua gallega: autonomía o dependencia

141

Hay 18 neologismos que son hápax (un 35,2%) y 13 con una recurrencia superior a 10 (25,49%). El número de hápax en portugués es muy elevado si lo comparamos con los porcentajes del español, aunque inferior al caso gallego. No podemos dar una idea clara sobre la consolidación de la regla compositiva en portugués por la poca documentación encontrada, tanto en las bases de datos como en la que se deriva del análisis de la coincidencia de neologismos entre el gallego y esta lengua. Con todo, entendemos que hay un número significativo de unidades léxicas creadas con estos formantes que no se difunden en portugués, algo que ocurre también en gallego. 5.1.4. Dependencia del inglés? Como ya mencionamos anteriormente, siempre que se considera la dependencia entre dos lenguas a nivel del léxico queda la duda de si existe una tercera lengua que pueda ser el origen común de las unidades analizadas. Para intentar descubrir alguna clave sobre este tema, analizamos los neologismos documentados en el gallego presentes en el diccionario inglés Dictionary.com en línea, 13 y obtuvimos los resultados que se presentan a continuación en la Tabla 7, donde los neologismos se acompañan de su primera documentación, cuando esta es conocida:  bio-

33 (11,95%)

ciber-

14 (5,07%)

e-

14 (5,07%)

eco-

6 (2,17%)

bioactive (1970-75), bio-bibliographic (1955-60), biobibliography (1995-60), biocatalyst (1930-35), biochip (1980-85), biocide (1945-50), biodefence (2006), biodegrade (1970-75), biodiesel (1992), biodiversity (1985-90), bioenergy (1975-80), bioethanol, biogas (1975-80), biogeographic (1890-95), bioindicator (1963), bioinformatic, bioinorganic (1970-75), bioinvasion, biometric (2009), bionic 1955-60), biopharmaceutic, bioplastic (1980-85), bio-polymer (1960-65) biopower, bioscience (1960-65), biosensor (1995) biosimulation, biotechnology, biotechnological (1940-45), bio-technology (1940-45), bio-terror (1998), bio-terrorism (1998) cyber, cyberattack, cybercafé (1990-95), cybercrime, cybercriminal, cyberculture (2006), cyber-dissident, cybernaut, cyberpunk, cybersecurity, cybersex (1985-90), cyberspace (1985-90), cyberterrorism, cyberworld e-billing, e-book (1985-90), e-business (2003), e-card, e-commerce, e-crime (2009), e-government (2009), e-learning (1997), e-mail (1982), e-marketing, e-payment, e-reader, e-voting eco-efficiency, ecofeminism, ecoterrorist, ecotourism (1985-90), eco-socialism, eco-socialist



–––––––— 13



142 euro-

Ana Belén Crespo / Xosé María Gómez / Xavier Gómez 7 (2,53%)

eurocentric (1960-65), eurocentrism (1960-65), eurocrat 1960-65), eurofestival, europatent 1970-75), euro-scepticism, eurozone

Tabla 7: Neologismos en inglés

Un total de 74 de los 276 neologismos recogidos en gallego aparecen recogidos también en inglés, es decir, un 26,81% del total analizado. Como todas las fechas de la primera documentación en esta lengua (las que se pudieron documentar) son anteriores al gallego, al español y al portugués, podemos inferir que el inglés podría ser el origen común y que no hay, en principio, influencias mutuas entre las tres lenguas, por lo menos para una parte significativa de los neologismos que se registran en inglés. Es posible, también, que sobre todo el español fuese la lengua interpuesta y que el gallego no tomase estos neologismos básicamente denominativos directamente del inglés.

5.2. Análisis comparativo de productividad y frecuencia Basamos el análisis comparativo de los datos en gallego, español y portugués en los siguientes tres aspectos: a) Análisis del número de ocurrencias totales en las tres lenguas, para ver la consolidación de la regla compositiva en cada una de ellas. b) Análisis de la diferencia de registros en las tres lenguas, partiendo de los neologismos gallegos para evaluar posibles dependencias. c) Análisis de los hápax partiendo del gallego para evaluar las razones de la coincidencia o divergencia. 5.2.1. Análisis del número de ocurrencias totales Primero analizaremos las ocurrencias totales de los neologismos en las tres lenguas. Con esto comprobaremos en qué lengua parece que está más consolidada la regla. La Tabla 8 recoge los siguientes datos al respecto para cada lengua:  1) Número de neologismos diferentes (bases de datos). 2) Número de neologismos diferentes (coincidentes con el gallego). 3) Número de ocurrencias totales (bases de datos). 4) Número de ocurrencias totales (coincidentes con el gallego). 5) Media por neoprefijo (bases de datos). 6) Media por neoprefijo (coincidentes con el gallego). 7) Ocurrencias por neologismo (bases de datos). 8) Ocurrencias por neologismo (coincidentes con el gallego).  



La creación de neologismos en la lengua gallega: autonomía o dependencia



Gallego Español Portugués

1 276 ND ND

2 127 48

3 1 383 3 442 395

4 4 810 1 099

5 276,6 688,4 79

6 962 219,8

7 5 ND ND

143

8 33,87 22,89

Tabla 8: Ocurrencias en gallego, español y portugués

El número de neologismos diferentes en gallego (columna 1 de la Tabla 8) es relativamente elevado, 276, con un número de ocurrencias también reseñable. En español y portugués, en lo que atañe a las bases de datos, no tenemos datos de neologismos diferentes pero sí de ocurrencias (columna 3) que son numerosas. Para los neologismos coincidentes, hay una diferencia significativa entre gallego, español y portugués (columna 2) ya que en estas dos lenguas no se registran muchos de los neologismos gallegos. Con todo, hay un número elevado de ocurrencias totales de los neologismos coincidentes (columna 4). La media de ocurrencias por neoprefijo en las bases de datos (columna 5) es muy alta en español, por la existencia de corpus más amplios, mientras que es relativamente alta en gallego y baja en portugués, ya que para esta lengua no hay muchos registros en Neorrom y TermNeo. Para las ocurrencias de los neologismos que existen español y portugués coincidentes con los gallegos (columna 6) vemos que las medias por neoprefijo son muy elevadas en español y menos en portugués, por la diferencia existente en la documentación. Por neologismo, las ocurrencias en gallego son relativamente bajas (columna 7) y relativamente elevadas en español y portugués (columna 8), también por la diferencia en la documentación. Con estos datos, podemos afirmar que en las tres lenguas la regla compositiva está consolidada, aunque debido a la documentación manejada destacan los datos para el español. 5.2.2. Análisis comparativo de la diferencia de registros Pueden comprobarse las diferencias de registros entre las tres lenguas con los datos de la Tabla 9 que se muestran a continuación:  biocibereecoeuroTotal

Galego 71 86 46 22 51 276

Español 46 (64,78%) 35 (40,69%) 13 (28,26%) 10 (45,45%) 23 (45,09%) 127 (46,01%)

Portugués 21 (29,57%) 14 (16,27%) 3 (6,52%) 3 (13,63%) 10 (19,60%) 51 (18,47%)

Tabla 9: Neologismos distintos en gallego, español y portugués

La diferencia de registros puede estar motivada por la distinta documentación que se manejó (siempre bases de datos publicadas y corpus en línea) pero también por la creación autónoma en gallego, representada muchas veces a través de un hápax. Hay que destacar las diferencias que existen en las tres lenguas con respecto al neoprefijo e-. Parece que el gallego crea un número relativamente elevado de



144

Ana Belén Crespo / Xosé María Gómez / Xavier Gómez

neologismos que no coinciden en las otras lenguas. Esto apunta, lógicamente, a considerar la independencia del gallego en los procesos de creación de este tipo de compuesto híbrido. Como muestra de lo anterior, hay un total de 138 registros del gallego que no se registran ni en español, ni en portugués. Es interesante destacar en el neoprefijo ciber- la vitalidad en la creación expresiva y en bio- la denominativa. La lista de neologismos gallegos que no se recogen en las otras dos lenguas es la siguiente: a) ciber-: ciber axuda, ciber camposanto, ciber control, ciber convocatoria, ciber dependencia, ciber eiva, ciber mar, ciber nominado, ciber paro, ciber tempo, ciber vía, ciber vixilancia, ciber-administración, ciberatleta, ciberbarallete, ciber-becho, cibercamión, cibercandidato, ciberconsumidor, ciberconversa, ciberdebate, ciberdespido, ciberdespistado, ciber-encontro, ciber-enderezo, ciberescritor, cibereslán, ciberferrancho, ciberfesta, ciberfesteiro, -a, ciberirmandade, ciberliterario, -a, ciberliteratura, cibermilleiral, cibernáutico, a, cibernavegación, ciberpersoeiro, ciberplaneta, ciberpostal, ciberrede, cibersala, ciberserie, cibersocial, cibersociedade, cibertrónico, -a, ciber-verbena b) eco-: ecopoema, eco-terrorista, ecoagroturismo, ecoclima, ecocondición, ecoenerxía, ecolingüístico, ecotraballo, ecosanitario, ecozona, ecobiblioteca c) bio-: biocatálogo, biorock, biotipólogo, bio-bibliográfico, biodefensa, biotecnocientífico, bioantropólogo, bioterror, biofuncional, biomecanización, bioacumulábel, bioinvasión, bioacústico, bioinorgánico, bioconsumo, biorremedio, bioedificio, bioxeración, biocampus, bioclúster, biosimulación, biocentro, biocapacidade d) euro-: euroaxencia, eurofondo, euroequipo, eurodebate, eurocomisión, eurobolsa, eurobilla, euroconstitución, euroaxuda, euroacordo, euroislámico, eurorrexional, eurofuturo, euroconselleiro, euroboleto, euromesa, eurocidade, europortal, euroinvestigación, europrotección, eurosocio, europatente, eurooptimista, eurosusto, eurovisismo, euromandato e) e-: e-crime, e-multa, e-liña, e-factura, e-adicto, e-farmacia, e-enciclopedia, e-negocio, e-desenvolvemento, e-macrobotellón, e-coordinación, e-converxencia, e-aula, e-ciencia, e-católico, e-caderno, e-dni, e-sexo, e-cancela, e-voto, e-votación, e-trámite, e-título, e-tarxeta, e-sociedade, e-revolución, e-revista, e-proxecto, e-papeleo, e-petición, e-publicidade, e-postal 5.2.3. Análisis comparativo de los hápax El número de neologismos con frecuencia 1 en las tres lenguas es el siguiente: gallego, 144; español, 28; y portugués, 18. Como ya hemos dicho, los datos del español y el portugués corresponden a los neologismos documentados partiendo del gallego. Arriba comentamos que la presencia de los hápax podía indicar una debilidad en la consolidación de la regla compositiva, pero también que se podía evaluar para dar una idea sobre la independencia o dependencia entre lenguas partiendo de la siguiente hipótesis: si los neologismos con frecuencia 1 no coinciden entre varias lenguas podemos hablar de un alto grado de independencia; si, por el contrario, coinciden, las dependencias entre ellas son más evidentes. Esto se explica



La creación de neologismos en la lengua gallega: autonomía o dependencia

145

por el hecho de que en este grupo pueden estar aquellos neologismos expresivos, creados por personas concretas, que son una muestra de la vitalidad de la lengua y de la creación individual, pero también otros denominativos creados autónomamente en gallego o adaptados de lenguas que no son el español y el portugués. De los 144 neologismos registrados solo una vez en gallego, los coincidentes con el español son los 40 que se recogen a continuación: a) bio-: bioabsorbente, biocidio, biociencia, bioconstrutor, biodegradar(se), bioenerxía, biofiltro, bioindicador, biometanización, biónico, bioprospección, biotecnólogo b) ciber-: ciberacoso, ciberadicción, ciberanalfabeto, ciberataque, cibercampaña, cibercharla, cibercidade, ciberdelincuencia, ciberforza, cibernovela, ciberpolicía, ciberprogresita, ciberpunk, ciberoteca, ciberviaxe c) e-: e-banco, e- book, e-comunicación, e-iniciativa, e-libro, e-reader d) eco-: ecodesenvolvemento, ecoeficiencia, ecosistémico e) euro-: eurocaos, eurócrata, euroeleccións, euromísil, euroorzamento  Por otra parte, los hápax del gallego no coincidentes con el español son 104: f) bio-: bioacumulábel, bioacústico, bioantropólogo, biocatálogo, bioclúster, biodefensa, bioedificio, biofuncional, bioinorgánico, bioinvasión, biorock, biorremedio, biosimulación, biotécnico, biotecnocientífico, bioxeración g) ciber-: ciber axuda, ciber camposanto, ciber convocatoria, ciber dependencia, ciber eiva, ciber mar, ciber nominado, ciber paro, ciber tempo, ciber vía, ciberbecho, ciber-encontro, ciber-verbena, ciberatleta, ciberbarallete, cibercandidato, ciberconsumidor, ciberdespido, ciberdespistado, ciberescrito, ciberferrancho, ciberfesteiro, ciberinstituto, ciberliteratura, cibermilleiral, ciberpersoeiro, ciberpostal, ciberrede, ciberserie, cibersocial, cibertrónico, ciberxornal a) e-: e-adicto, e-caderno, e-cancela, e-católico, e-converxencia, e-coordinación, e-crime, e-desenvolvemento, e-dni, e-enciclopedia, e-factura, e-farmacia, e-liña, e-macrobotellón, e-multa, e-negocio, e-petición, e-proxecto, e-publicidade, e-revista, e-sexo, e-sociedade, e-tarxeta, e-título, e-trámite, e-votación, e-voto b) eco-: ecoclima, ecocondición, ecoeconomía, eco-enerxía, ecolingüístico, ecopoema, ecosanitario, eco-terrorista, ecozona c) euro-: euroacordo, euroaxencia, euroaxuda, eurobilla, euroboleto, eurobolsa, eurocidadán, euroconselleiro, eurodebate, euroequipo, euroforza, euroinvestigación, euroislámico, euromandato, euromesa, eurooptimista, europatente, europrotección, eurosocio, eurosusto, eurovisismo  Así mismo, podemos comprobar que de los 144 neologismos que tienen frecuencia 1 en gallego, 128 no se registran en portugués (frente a los 104 del español). Con estos datos, se puede concluir que el gallego muestra un grado relativamente alto de autonomía. La mayor parte de los neologismos del tipo hápax no se registran en las otras dos lenguas. Entendemos que hay creación expresiva



146

Ana Belén Crespo / Xosé María Gómez / Xavier Gómez

autónoma pero también neología denominativa no registrada en español y en portugués. Recogemos a continuación los neologismos coincidentes en las tres lenguas. Se puede observar que muchos de ellos son conceptos especializados, o de uso común, sin mucho espacio para la creación expresiva de autoría individual: cibermundo, cibercultura, ciberterrorismo, ciber, cibersexo, cibercafé, cibernauta, ciberespazo, ecoturismo, ecotaxa, biotécnico, biotoxina, biodegradarse, bioetanol, biotecnolóxico, bioinformática, biochip, biocida, biotecnoloxía, biométrico, biomedicina, biodiversidade, bioprospección, biogás, eurocéntrico.

5.3. Análisis de las dataciones Analizamos ahora las diferencias en las dataciones del primer registro entre el gallego, por un lado, y el español y portugués, por el otro, intentando descubrir posibles modelos para la neología del gallego. Si una palabra se registra antes en portugués o español, existe la posibilidad teórica de la imitación. Somos conscientes de que el modelo para el gallego no tiene que partir únicamente de estas dos lenguas y que puede hacerlo de otras, por ejemplo, el inglés, que sean realmente el origen de los neologismos. La comparación se establecerá solo entre aquellos neologismos coincidentes entre gallego, español y portugués. 5.3.1. Comparación de primeras dataciones en gallego y español De los 127 neologismos coincidentes entre gallego y español, hay 29 que se registran antes en nuestra lengua que en español y 87 que se registran antes en español; 11 se registran en la misma fecha. Presentamos los datos agrupados por neoprefijos en la Tabla 10:  Neoprefijo cibereuroecobioeTotal

Antes en gallego 9 4 1 11 4 29 (22,83%)

Antes en español 23 16 8 33 7 87 (68,50%)

Misma fecha 3 3 1 2 2 11 (8,66%)

Tabla 10: Datación comparada en gallego y en español

Los neologismos son concretamente los siguientes: a) Antes en gallego: biocombustíbel, bioconstrución, bioconstrutor, biodegradar(se), biodiversidade, biofiltro, biomarcador, biopoder, biosanitario, biosaudable, biotoxinaciberacción, ciberactivismo, ciberaula, cibercampaña, ciberdereito, ciberdisidente, ciberespionaxe, ciberoteca, ciberseguridade, eadministración, e-correo, e-democracia, e-learning, ecólogo, eurocéntrico, eurofestival, euromanifestación, eurovisivo



La creación de neologismos en la lengua gallega: autonomía o dependencia

147

b) Antes en español: bioabsorbente, bioactivo, biocarburante, biocatalizador, biocidio, biociencia, biochip, biodiésel, biodispoñibilidade, bioenerxía, bioetanol, biofarmacéutico, biofilia, biofilmografía, biogás, bioindicador, bioinformática, bioinformático, biomecánico, bio-medicina, biometanización, biométrico, biomolecular, biónico, bioplástico, biopolímero, bioprospección, bioseguridade, biosensor, biotecnólogo, biotecnoloxía, biotecnolóxico, bioxeográfico, ciber, ciber adicción, ciber policía, ciberacoso, ciberanalfabeto, ciberataque, cibercafé, cibercidade, cibercrime, cibercultura, cibercharla, ciberdelincuencia, ciberdelincuente, ciberespacio, ciberforza, cibermedio, cibermundo, cibernauta, cibernovela, ciberpunk, ciberterrorismo, ciberxornalismo, ciberxornalista, e-banco, e-book, e-comercio, e-comunicación, e-goberno, e-libro, e-pago, ecodesenvolvemento, ecoeficiencia, ecofeminismo, ecosistémico, eco-socialismo, ecosocialista, ecotaxa, ecoturismo, eurobarómetro, eurocámara, eurocentrismo, eurocomisario/a, eurócrata, eurodeputado/a, euroeleccións, euroescepticismo, euroescéptico, euroliga, euromísil, euroorzamento, europarlamentario/a, europarlamento, eurorrexión, eurozona c) Misma fecha: biocida, bioterrorismo, ciberocupa, ciberprogresista, cibersexo, ecoplanta, e-marketing, e-reader, eurocaos, euromediterráneo, euroorde  Si nos fijamos en los datos numéricos, comprobamos que el 68,50% de los neologismos coincidentes entre las dos lenguas se registran antes en español. Esto, en principio, es un dato que apunta a tres posibilidades:  a) Que las reglas compositivas tuvieron efecto antes en español que en gallego. b) Que existe la posibilidad de que, por las razones sociolingüísticas de contacto entre las dos lenguas en Galicia, el gallego importase las palabras directamente del español. c) El tamaño de los corpus puede afectar a las dataciones.  Con respecto a la primera opción, existe la posibilidad de que las reglas comenzaran a ser productivas antes en castellano que en gallego y que, además, esto motivase que el gallego se inspirara en esa lengua. Con todo, lo anterior podría matizarse ya que vemos que hay un 31,49 % de palabras que se registran antes o al mismo tiempo que el español. Es un dato importante, ya que se ve que el modelo compositivo neoprefijo+base era productivo en nuestra lengua sin necesidad de acudir al español. Podíamos añadir aquí el hecho de que aproximadamente 74 de los neologismos registrados en gallego están registrados en inglés antes que en español. Por lo tanto, la influencia sobre el gallego puede venir de esa tercera lengua directamente, o a través del español, que también sufrió esa influencia. En cuanto a la segunda opción, es posible que por razones sociolingüísticas (el español es una lengua en contacto interferente con el gallego) y sociopolíticas (Galicia es una parte del Estado español) el modelo que se imitara fuera el español. Y con respecto a la tercera opción, hay que reconocer que la comparación entre gallego y español es desigual por el distinto tamaño de los corpus, aunque comenzamos a comprobar a partir del mismo año de 1975, fecha en que se inician los registros del CORGA.



148

Ana Belén Crespo / Xosé María Gómez / Xavier Gómez

Los neologismos registrados antes en español son de tipo variado. Responden tanto a necesidades denominativas (biodiversidade, ecotaxa, eurorde, ciberespacio) como a necesidades más o menos expresivas (cibercharla, ciberanalfabeto, einiciativa). Por lo tanto, no se puede afirmar que se registre antes lo que responde a necesidades puramente denominativas y que este hecho, por su relevancia, condicione al gallego. ¿El análisis de las primeras dataciones puede darnos indicios de la dependencia del gallego con respecto al español? Para acabar de contestar esta pregunta, compararemos los neologismos que se registran en inglés con los que se registran en español. Si se registran en inglés, es decir antes, llegaremos a la conclusión de que la dependencia con el español no es tan grande. De los 87 neologismos coincidentes entre español y gallego y registrados antes en español, los siguientes (34) ya estaban registrados previamente en inglés y esta lengua puede ser considerada la fuente primera: bioactivo, biocatalizador, biochip, biociencia, biodiésel, bioenerxía, bioetanol, biofarmacéutico, biogás, bioindicador, bioinformático, biométrico, biónico, bioplástico, biopolímero, biosensor, ciber, ciberataque, cibercafé, cibercultura, ciberespacio, cibermundo, cibernauta, ciberpunk, ciberterrorismo, e-book ecoeficiencia, ecofeminismo, eco-socialismo, ecosocialista, ecoturismo, eurocéntrico, eurocentrismo, eurócrata, eurodeputado, euroescepticismo, eurozona. Por tanto, podemos afirmar que el inglés es una fuente relativamente importante de neologismos y que relativiza la dependencia del español. Las ventajas, o inconvenientes, de una dependencia del inglés podrían ser objeto de una reflexión más demorada. 5.3.1. Comparación de primeras dataciones en gallego y portugués Solo 4 neologismos de los 51 coincidentes se registran antes en gallego que en portugués. Los datos por neoprefijos son los que se recogen en la Tabla 11:  Neoprefijo cibereuroecobioeTotal

Antes en gallego 0 0 0 4 0 4 (7,84%)

Antes en español 15 8 3 19 2 47 (92,15%)

Misma fecha 0 0 0 0 0 0

Tabla 11: Datación comparada en gallego y en español

Los neologismos registrados en portugués antes que en gallego son: biogás, biomedicina, biotecnoloxía, biodiesel, ecoeconomía, biodegradar(se), bioetanol, biofilia, ecotaxa, ecoturismo, eurocéntrico, eurócrata, eurodeputado/a, biónico, biotécnico, eurobarómetro, eurocidadán, biochip, bioinformática, biotecnolóxico, biotecnólogo, bioprospección, eurofestival, europarlamento, biobibliografía, biocida, biotoxina, euroforza, eurocentrismo, cibercultura, ciberterrorismo, ciberxornal, cibermundo, cibercafé, cibersexo, ciber, ciberespacio, cibernauta, ciberpunk, e-book, e-comercio.



La creación de neologismos en la lengua gallega: autonomía o dependencia

149

Antes en gallego que en portugués: biodiversidade, biométrico, biomolecular, eurocéntrico. El corpus CetemPúblico manejado para el portugués tiene 190 millones de palabras, pero solo de 1991 a 1998. Los neologismos registrados antes en portugués que en gallego son básicamente de carácter denominativo. No se registra la neología expresiva asociada a parte de las palabras formadas con ciber- y e-. Vemos que el 92,15% de los neologismos coincidentes entre gallego y portugués se registra antes en esta segunda lengua. Esto podría indicar, en principio, que el portugués sirvió de modelo para el gallego. Con todo, para llegar a alguna conclusión hay que volver a introducir al castellano en la comparación. Debemos hallar aquellos neologismos que solo coinciden en gallego y portugués, sin coincidir con el español, y ver su fecha de primer registro. Los neologismos coincidentes entre gallego y portugués, que no se registran en español, son muy pocos: ciberxornal, ecoeconomía, eurocidadán, euroforza. Todos ellos están registrados antes en portugués que en gallego. Con estos datos, hay que reconocer que la influencia del portugués sobre el gallego es muy débil porque es muy evidente que si un neologismo gallego coincide con el portugués y el español y se registra por influencia de una de estas dos lenguas, la lengua que más influye es, por fuerza, el español, debido a factores sociolingüísticos y extralingüísticos.

6. Conclusiones Llegados a este punto, procederemos a comprobar las hipótesis iniciales:  a) Productividad de las reglas de composición: Los neoprefijos analizados son capaces de generar un número relativamente elevado de unidades neológicas en las tres lenguas con número elevado de ocurrencias. En gallego, es muy significativo el dato de los hápax (144) que son unidades que demuestran la rentabilidad de las reglas de formación de palabras con estos neoprefijos pero también la incapacidad de que se extiendan en la lengua. El número de unidades registradas una única vez en español y portugués es menor, lo que puede indicar, con la documentación manejada por nosotros, que en estas lenguas es más fácil extender el uso de ciertos neologismos. Hay que reconocer que nuestros datos muestran una cierta incapacidad del gallego para generalizar el uso de este tipo de compuestos híbridos. b) Coincidencia de los neologismos en las lenguas: De los neologismos documentados en gallego (276) solo encontramos registrados 127 en español y 51 en portugués. Estos datos apuntan a un grado de autonomía claro de nuestra lengua con respecto a las otras dos. Resulta extraño, por el tipo de unidades registradas en gallego, muchas de ellas denominativas, que no se registren en estas otras dos lenguas, especialmente en portugués. c) Primeras dataciones de los neologismos: Es muy evidente que cuando un neologismo gallego se registra también en castellano o portugués la primera ocurrencia corresponde a estas lenguas. Se confirma una mayor dependencia



150

Ana Belén Crespo / Xosé María Gómez / Xavier Gómez

del castellano (neologismos expresivos y denominativos) que del portugués, ya que en realidad hay muy pocos neologismos que no coincidan también con el español y que se registren antes en aquella lengua. Con todo, hay que tener en cuenta el inglés como fuente común para las tres lenguas, lo que matiza la posible dependencia que se deriva del análisis de las primeras dataciones.  ¿Puede afirmarse entonces que el gallego es una lengua dependiente en la creación de nuevas palabras o, por el contrario, se demuestra que es una lengua independiente en ese terreno? Está muy claro, como ya dijimos, que la regla compositiva en gallego está consolidada, y que se observa un elevado grado de autonomía con respecto a las otras dos lenguas en la comparación neologismo a neologismo. El gallego no precisa del español ni del portugués para crear o para adaptar este tipo de compuestos. Pese a ello, parece que el español sigue siendo un modelo relativamente usado para el gallego, como se desprende a partir de la comparación de las dataciones. Sin embargo, la existencia de influencias en este tipo de compuestos híbridos no se debe considerar nunca un préstamo interferente. En lo que atañe al portugués, podemos decir que su influencia sobre nuestra lengua es prácticamente inexistente. Como era previsible, parece que las cuestiones políticas son determinantes a la hora de establecer relaciones lingüísticas, incluso entre dos lenguas con estrecho parentesco. 

Referencias bibliográficas Cabré, M. Teresa (2000): «La neologia com a mesura de la vitalitat interna de les llengües», en La neologia en el tombant de segle. I Simposi sobre neologia (18 de desembre de 1998). I Seminari de neologia (17 de febrer del 2000). Barcelona: Institut Universitari de Lingüística Aplicada, Universitat Pompeu Fabra, 85-108 — (2002): «Evaluación de la vitalidad de una lengua a través de la neología: a propósito de la neología espontánea y de la neología planificada», en Lèxic i neologia. Barcelona: Observatori de Neologia, Institut Universitari de Lingüística Aplicada, Universitat Pompeu Fabra, 159-201. Crespo Bastos, Ana Belén / Gómez Clemente, Xosé María (2008): «Novos criterios para a elaboración dun dicionario de neoloxismos», en Ernesto González Seoane / Antón Santamarina / Xavier Varela, eds., A lexicografía galega moderna. Recursos e perspectivas. Santiago: Consello da Cultura Galega, 183-195. Freixa, Judit (2009): «La interferència en la innovació lèxica del català: anàlisi dels neologismes amb ciber- i homo-», Llengua i Dret, 51, 259-281. Gestido de la Torre, Eloi / Gómez Clemente, Xosé María (2003): «Neoloxía, neoloxismos e diccionarios», en Ernesto González Seoane / María Álvarez de la Granja, eds., A estandarización do léxico. Santiago: Consello da Cultura Galega, 465-469. Gómez Clemente, Xosé María (2001): «O Observatorio de Neoloxía da Universidade de Vigo», en Anxo Lorenzo Suárez / Henrique Monteagudo Romero, eds., Traballos presentados nos V Encontros para a Normalización Lingüística. Santiago de Compostela: Consello da Cultura Galega, 46-65.



La creación de neologismos en la lengua gallega: autonomía o dependencia

151

Gómez Clemente, Xosé María / Rodríguez Guerra, Alexandre (2003): «Neoloxismos na lingua xornalística galega», en Neoloxía e lingua galega: Teoría e práctica. Vigo: Servicio de Publicacións da Universidade de Vigo, 95-169. González González, Manuel / Santamarina Fernández, Antón (2004): Vocabulario Ortográfico da Lingua Galega. A Coruña/Santiago: Real Academia Galega/Instituto da Lingua Galega. López Fernández, Susana et al. (2005): Novas palabras galegas. Repertorio de creacións léxicas rexistradas na prensa e en Internet. Vigo: Servizo de Publicacións da Universidade de Vigo. López Fernández, Susana / Gómez Guinovart, Xavier / Gómez Clemente, Xosé María / Crespo Bastos, Ana Belén (2010): «A avaliación da neoloxicidade en terminoloxía», en M. Teresa Cabré et al., eds., Actes del I Congrès Internacional de Neologia de les Llengües Romàniques. Barcelona: Universitat Pompeu Fabra, Institut de Lingüística Aplicada, 241-252. Navaza Blanco, Gonzalo (coord.) (1993): Diccionario Xerais da Lingua. Vigo: Xerais. Pena, Xosé A. (dir.) (2005): Gran dicionario Século 21 da lingua galega. Vigo: Galaxia e Edicións do Cumio. Real Academia Galega (1997): Diccionario da Real Academia Galega. A Coruña: RAG.



 Lexicografía ladina moderna Vittorio Dell'Aquila Centre d'Études Linguistiques pour l'Europe-Vaasan Yliopisto

Gabriele Iannàccaro Università degli Studi di Milano - Bicocca

Modern Ladin lexicography Abstract This article provides an overview of current lexicographic studies of Dolomitic Ladin. A summary of the geolinguistic situation of Ladin and the role of institutions in the development of reference works is followed by a review of representative dictionaries and projects, with observations on the importance of modern technology in dictionary production. Keywords Lexicography, vocabularies, Ladin.

1. Este estudio tiene como finalidad ofrecer una orientación crítica de las nuevas herramientas lexicográficas a disposición de la comunidad ladina de los Dolomitas. Es oportuno considerar, antes de nada, el hecho de que el denominado ladino dolomítico es una lengua que solo recientemente ha adquirido el estatus efectivo de variedad escrita y para la cual son necesarios instrumentos lexicográficos orientados al gran público. Naturalmente, textos escritos ladinos, y también diccionarios del tipo que será definido más adelante dialectal, existen desde hace más de un siglo, pero una lexicografía modernamente entendida que no sea específicamente de tipo lingüístico-dialectológico o al contrario popular-espontáneo, existe solo desde la mitad de los años noventa. Es también oportuno señalar desde este momento que, quizá justamente a causa del carácter fuertemente orientado a la planificación de la moderna lexicografía ladina, no existe, actualmente, ningún diccionario monolingüe que no esté dirigido a un público infantil y que no se presente, por tanto, felizmente ilustrado pero con un léxico extremadamente reducido. En consecuencia, la lexicografía ladina moderna corre el peligro de verse afectada por prejuicios, habituales en la investigación lingüística y, a menudo, justificados, según los cuales la intervención directa de alteración del statu quo sociolingüístico y la explícita elaboración interna de un código son operaciones de por sí sospechosas si no condenables. La lexicografía, como instrumento de planificación lingüística, es



154

Vittorio Dell'Aquila / Gabriele Iannàccaro

acusada, en función de los casos, de valerse de procedimientos en gran medida arbitrarios y, en general, basados en criterios estéticos y no en efectivas necesidades funcionales (cfr. Thomas 1991; Iannàccaro 2009) o de voluntad de predominio sobre las formas espontáneas locales de las cuales aceleraría su decadencia y posterior desaparición. La actitud descriptiva de la lingüística moderna considera particularmente arriesgada, y alejada de sus propios intereses y objetivos, cualquier operación con la lengua que no sea un intento de explicar sus estructuras, sus orígenes históricos y su relación con la cultura y la sociedad. La prudencia a la que se ha hecho alusión está ampliamente justificada, al menos de acuerdo a los resultados de la mayor parte de las actividades de planificación lingüística acometidas – tanto en lenguas minoritarias come en grandes lenguas internacionales – pero en absoluto hay que negar, sin embargo, al menos teóricamente, la importancia real de tales operaciones si se realizan con criterios científicamente objetivos, lingüísticamente compartibles y sociolingüísticamente apropiados y, por consiguiente, aceptables por la comunidad (cfr. Dell'Aquila / Iannàccaro 2004).

2. Ahora, sabiendo que cada diccionario está construido de acuerdo a una idea subyacente, una teoría general de la lengua, aun sin resultar esta teoría siempre explícita, podemos aventurar una taxonomía operativa de los productos lexicográficos más comunes y, en base a esta, reagrupar las obras del panorama lingüístico de la Ladinia Dolomítica publicadas en los últimos decenios. De este modo tenemos, en primer lugar, diccionarios descriptivos; es decir, aquellos que representan precisamente el estado del léxico de una lengua en particular y que tratan de identificar los usos exactos que de las palabras hacen los hablantes de esa lengua, así como las relaciones recíprocas que se crean entre los términos. En este grupo se encuentran los diccionarios que podemos denominar de referencia, o sea, aquellos que fundamentalmente describen la lengua pero que son concebidos para ser de ayuda a quienes, por desconocimiento o por olvido, buscan la acepción exacta de un término poco frecuente. Los diccionarios descriptivos pueden ser monolingües o, y esto los hace menos equilibrados en clave operativa, bilingües: en general, al menos para las lenguas vivas, con entradas en las dos lenguas descritas. Otro grupo es el formado por los diccionarios dialectales, destinados a recoger, y eventualmente a salvar de la obsolescencia, (partes del) léxico de variedades geográficamente determinadas y, con frecuencia, percibidas como en decadencia. Algunas veces se presentan bajo la forma de un (parcial) Ergänzungswörterbuch (cfr. Iannàccaro / Dell'Aquila 2008), es decir, incluyendo solamente aquellas entradas que son consideradas como típicas o características de la comunidad con respecto a la lengua estándar que domina en el territorio. Tales diccionarios pueden ser de tipo popular-espontáneo, o sea, redactados por expertos locales o promovidos tanto por estudiosos de la lingüística como por instituciones de investigación. Por lo general tienen la entrada en la lengua “menor” y el artículo en la lengua de mayor difusión en el área. Una variedad muy difundida de este grupo es la del diccionario etnográfico, preocupado no ya únicamente de la salvaguardia de cada palabra, sino también del mundo semántico y de valores que

Lexicografía ladina moderna

155

tiene asociado. No concierne a esta exposición el análisis y la posible distinción en subtipos de los diccionarios dialectales de ámbito románico correspondientes a los siglos XVIII y XIX, cuya modalidad y finalidad serían reconocidas como peculiares y que constituyen una especie de puente con la categoría expuesta a continuación. Particularmente extendidos e insidiosos son luego los diccionarios normativos, es decir, aquellos cuya función principal es, sustancialmente, demarcadora o regulativa: o sea, aquella encargada de delimitar los ámbitos y las fronteras de la buena lengua, de la bella lengua, de la lengua que se debe usar; y, en los casos límite, de lo que es considerado lengua y de lo que no. En el extremo están las obras que ratifican que las palabras bien formadas del léxico de una comunidad son todas y solo aquellas que se encuentran en el diccionario –las otras “cosas”, que podrían, para un hablante normal, parecer palabras posibles, son consideradas errores si no están presentes en estas obras. Típicamente son monolingües o tienen la entrada en la lengua de la norma no local pero de tradicional referencia para el territorio. Muchos diccionarios que son el resultado de esfuerzos de planificación lingüística acaban siendo, al menos en sus intenciones, normativos. De ahí la cautela del lingüista. Es precisamente la presunción de enseñar a los hablantes la lengua correcta el error más insidioso que el lingüista individua en las iniciativas de planificación lexical– es decir, en la creación de diccionarios. Y esto, sobre todo, en una situación (la típica en Europa), en la cual la variedad objeto de estandarización es una lengua local, que está dotada de escaso prestigio oficial, pero a la que están unidos, de manera muy fuerte, los sentimientos de identificación comunitaria y/o personal de una población que, sin embargo, ya está alfabetizada en otra variedad. En el mundo románico europeo, cada lengua de nueva estandarización se apoya en otras ya existentes que se reparten completamente todas las funciones que una sociedad puede necesitar. En este sentido, las lenguas de nueva estandarización no tienen una utilidad práctica inmediata, sino más bien algunas obligaciones para con sus hablantes, en particular la de respetar las expectativas identitarias. Nacida para facilitarlo y para otorgarle algunos derechos más en su desarrollo, la lengua propuesta debe parecer natural, apropiada, fácil para quienes la usan; en particular, si el léxico propuesto se percibe como difícil y diferente al usual, presenta las desventajas de no ser el de la lengua mayoritaria, útil en la práctica y al cual el hablante está habituado, ni tampoco ese genuino y espontáneo de la comunicación familiar y grupal. De ahí el riesgo innato de querer crear una norma, de indicar cuáles son las palabras correctas y cuáles son las erróneas; lo que, como se ve fácilmente, implica por un lado una visión estética, no funcional, de la actividad lingüística y, por el otro, que, en materia de lengua, las cosas pueden cambiarse por decreto, con un diccionario o, en cualquier caso, de manera teórica. Una alternativa puede ser representada por aquellos que denominaremos diccionarios de propuestas (cfr. Iannàccaro 2002), cuya característica fundamental es la convalidación de todas las variedades comprendidas en el diccionario. La entrada figura, a menudo, en una forma perteneciente a la lengua local (y en este caso se ofrecen léxicos inversos) a la que se pueden vincular las variedades realmente presentes en el territorio, y el contenido del artículo se desarrolla de tal manera que se pueda apoyar una posible variante de forma sin por ello excluir otras. A la luz de

156

Vittorio Dell'Aquila / Gabriele Iannàccaro

los hechos, un diccionario de propuestas es aquel que presenta lemas de una lengua explícitamente dirigida a la competencia pasiva del hablante, elaborada para satisfacer las exigencias funcionales de la relación diglósica que media entre las variedades presentes en la zona. Un diccionario de este tipo se preocupa de proponer formas coherentes de léxico que sirvan de fuente adaptable para cubrir los ámbitos lingüísticos por los cuales el hablante se vería obligado a recurrir a préstamos de la lengua dominante o incluso a cambiar de código de comunicación. En el mejor de los casos, estos diccionarios son una especie de protección oficial de las variedades territoriales, a la que los hablantes pueden, si así lo desean, recurrir para encontrar neologismos, tecnicismos, pero también geosinónimos y expresiones que no poseen, o construcciones sintácticas poco habituales. Si se ha cuidado especialmente la cuestión de la comparación entre las variantes locales, podemos hablar en estos casos de diccionarios polilectales. Los diccionarios de propuestas polilectales son un producto lexicográfico relativamente reciente cuya realización es solo posible gracias al tratamiento automático de la información: su frecuencia, en fuerte crecimiento, es, sin embargo y como se ha señalado, muy minoritaria en el panorama de las lenguas romances y, en este sentido, la Ladinia dolomítica, junto a otras variedades románicas menores, es un terreno de análisis privilegiado justamente por su demora inicial a la hora de proveerse de diccionarios de referencia. Los usuarios privilegiados de los diccionarios modernos ladinos son, ante todo, las administraciones públicas de los distintos municipios, obligadas por ley a producir documentos también en versión ladina; los docentes, igualmente sujetos a dicha obligación, con ciertas diferencias en función de la provincia en la que se sitúe la escuela, de conocer la variante local incluso en su forma escrita y, en ocasiones, de producir materiales escolares directamente en ladino; los periodistas, en particular aquellos de la casi centenaria publicación semanal Usc di Ladins (Usc), que cuenta con alrededor de 3 000 abonados e incluye páginas específicas acerca de cada valle escritas en las distintas variedades locales, y la RAI Ladina – la sección de lengua ladina del servicio radiotelevisivo del Estado – que garantiza diariamente transmisiones radiofónicas y televisivas. El ladino es también utilizado, en variantes distintas, para obras literarias, para traducciones y para la presentación de iniciativas culturales y artísticas.

3. El llamado ladino dolomítico no tiene, por el momento, una variante única de referencia comúnmente aceptada a pesar de las tentativas, en ese sentido, de los años noventa y de los primeros años del nuevo milenio y de los cuales hablaremos en breve. La actividad lexicográfica, entonces, está compuesta predominantemente por la reflexión y la sistematización de las denominadas variedades de valle; el gardenese y el badiotto son oficiales en sus respectivos valles de la provincia autónoma de Bolzano - Alto Adigio junto al alemán y al italiano, mientras el fassano lo es en los siete municipios del valle de Fassa, en la provincia de Trento, junto al italiano solamente. Las variantes de los municipios históricamente ladinos de la provincia de Belluno (en la región del Véneto), el fodom y el ampezzano, no poseen un estatus oficial completo si bien su uso, a nivel escolar y administrativo, está creciendo

Lexicografía ladina moderna

157

gradualmente. Debemos, por tanto, ocuparnos principalmente de diccionarios paralelos de variedades diferentes. Es interesante subrayar que casi la totalidad de la lexicografía ladina reciente está directamente producida, o al menos es promovida y respaldada, por instituciones públicas locales, en particular por los institutos culturales ladinos, cuya existencia, al menos para las provincias de Trento y Bolzano, está asegurada gracias a específicas disposiciones legislativas. El primero por orden de fundación (1975), el Istitut Cultural Ladin “Majon di Fascegn” (ICL), situado en Vigo di Fassa, es el motor de las actividades culturales y lexicográficas relativas al valle de Fassa, mientras que para los valles de Gardena y Badia, el centro de referencia es el Istitut Ladin “Micurá de Rü” (IL), ubicado en el valle de Badia y fundado en el año 1977. Los valles de Belluno cuentan, a partir de la llegada del nuevo milenio, con el Istitut Cultural Ladin “Cesa di Jan”, sin embargo, esta institución no está respaldada por ninguna legislación específica ni tampoco mediante financiación pública garantizada por ley. Entre la última década del siglo pasado y el inicio de este, los institutos de Badia y de Fassa, junto a la Union Generela di Ladins dla Dolomites e l'Istitut Pedagogich Ladin (entidad provincial del Alto Adigio ocupada de la instrucción escolar trilingüe de Gardena y Badia), han puesto en marcha una estructura científica común de apoyo y coordinación de las actividades de planificación lingüística, llamada Servisc de Planificazion y Elaborazion dl Lingaz Ladin (SPELL), constituida por lingüistas provenientes de los diferentes valles bajo la supervisión de un consejo formado por investigadores y profesores universitarios. Esta última institución tenía como objetivo, entre otros, el completar la elaboración de una grafía común a las cinco variantes de valle y, siguiendo las directrices de Heinrich Schmid (1994¹, 2000²), de la Universidad de Zúrich, de una forma ladina escrita unificada que debería haber sido empleada de manera general en el lenguaje administrativo para las relaciones entre los distintos valles y entre estos y las administraciones provinciales. A raíz de posiciones políticas contrarias a una excesiva unidad lingüística ladina, el proyecto ha sido sustancialmente abandonado a finales de la pasada década, no obstante, como veremos, trabajos lexicográficos reconducibles a la experiencia del SPELL continúan siendo acometidos. Los modelos de grafía común para cada una de las variantes locales, por el contrario, han entrado establemente en el uso: para una panorámica sobre la cuestión de las grafías ladinas desde los orígenes hasta la actualidad, véanse Kattenbusch (1994), Bernardi (1993), Dell'Aquila / Iannàccaro (2001), Valentini (2002), Chiocchetti (2004a), Chiocchetti (2004b) y Dell'Aquila (2006).

4. Consideremos ahora, individualmente, las principales obras lexicográficas. Conviene comenzar por el Vocabolario di Cortina d’Ampezzo (Comitato 1997) se trata de una obra, en muchos sentidos, excéntrica respecto a las que serán consideradas a continuación y forma parte, por más de una característica, del grupo de los diccionarios que anteriormente hemos denominado dialectales; iniciado ya a mediados de los años setenta y redactado originariamente por un grupo de voluntarios (el Comitato del Vocabolario delle Regole d’Ampezzo) que

158

Vittorio Dell'Aquila / Gabriele Iannàccaro

posteriormente se benefició de la colaboración del SPELL, es esencialmente un diccionario ampezzano-italiano de corte más bien clásico, que se presenta, sin embargo, con las entradas invertidas, es decir, desde el italiano, y que usa una grafía ad hoc, de tipo fundamentalmente fonético para transcribir las voces ladinas (para los valores sociolingüísticos de los tipos de grafía véase Iannàccaro / Dell'Aquila 2008). El objetivo principal de la obra es conservar el patrimonio lexical, y tradicional, de la comunidad, pero, con fines prácticos, ofreciendo la entrada en italiano resulta más accesible a quienes desean utilizar la variante ampezzana en la escritura. Es notable la ausencia de un repertorio inverso del ampezzano, teniendo en cuenta, además, que este ha sido el motor de la obra lexicográfica. También descriptivo en parte, y esto lo confirma su lemario en ladino, es el Ennebergisches Wörterbuch (Videsott / Plangg 1998), un diccionario de la variante del badiotto hablada en el valle de Marebbe. Redactado por lingüistas de ámbito universitario, filólogos y dialectólogos, tiene como objetivo principal recoger el léxico de dicha comunidad, glosado e ilustrado en lengua alemana. El Ennebergisches Wörterbuch puede ser considerado un diccionario dialectal científico, que, con todo, es utilizado por la comunidad local, a veces, en sentido regulativo. A la actividad del IL se deben los dos diccionarios estándar de los valles ladinos del Alto Adigio. Para el valle de Gardena tenemos el Wörterbuch Deustch – GrödnerLadinisch (Forni 2002), normativo y tradicional al mismo tiempo, cuya realización ha sido posible gracias a una base de datos lexicográfica común a los dos valles ladinos del Alto Adigio. Es el diccionario de referencia para el gardenese (única variedad ladina oficial del valle de Gardena), facilitado en dicha variante por la escasa diferenciación dialectal de los cuatro municipios de valle – las pocas diferencias existentes, en cualquier caso, están registradas – y la grafía propuesta se rehace en base a un modelo ladino común (cfr. más adelante SPELL). El diccionario es particularmente rico en entradas ya que registra, como lemas, una gran cantidad de compuestos en alemán, que, con todo, pueden ser – como es normal en esta lengua – creaciones improvisadas o volátiles, traducidas a través de expresiones pluriverbales o incluso de frases. Esto refleja una orientación específica del autor, más favorable a la sustitución de las formas que faltan en ladino mediante expresiones formularias que a la creación ex novo de calcos o neologismos. En el valle de Badia, el punto de referencia es el Wörterbuch DeustchGadertalisch (Mischì 2000), que se ha valido de los mismos soportes informáticos que Forni (2002) y es igualmente tradicional a la vez que normativo. Con sus 36 000 entradas en alemán (incluidos los lemas compuestos) y con un índice inverso de 16 000 entradas univerbales ladinas, es, a diferencia de su homólogo gardenese, muy rico en neologismos proponentes calcados del alemán, del italiano o de otra de las grandes lenguas de cultura europeas. El diccionario sirve de estándar lexical para las variedades del badiotto, que, sin embargo, son bastante diferentes entre ellas; para superar esta dificultad Mischì (2000) propone una variante única de valle, al menos en el plano gráfico. El fassano tiene como referencia lexicográfica moderna el Dizionario italiano ladino fassano (DILF 1999¹), una obra colectiva coordinada por el ICL. El DILF tiene las mismas funciones que Mischì (2000) y Forni (2002), es decir, parte de la

Lexicografía ladina moderna

159

semántica de la lengua de cultura no local más difundida – en este caso el italiano – para proponer en ladino formas de las que el hablante podría no estar seguro, y de las que a menudo tiene en mente justo el lexema italiano. El diccionario tiene también una función explícitamente normativa con respecto a la ortografía de la lengua: las formas ladinas son propuestas mediante una grafía estándar del fassano que busca cubrir con una sola forma todas las variantes fonéticas locales de un mismo lema. La tercera edición de la obra (DILF 2013³) – la segunda no es más que una reimpresión de la primera – es una rica ampliación del original: comprende alrededor de un 20% de lemas más en entradas y duplica casi el índice inverso del ladino. Dicha ampliación se ha llevado a cabo gracias al tratamiento informático semiautomatizado de textos periodísticos y administrativos en fassano publicados durante los últimos diez años y se basa en una herramienta informática de lexicografía y de análisis textual completamente nueva y creada ad hoc. Con todo, a diferencia de los diccionarios semejantes correspondientes al Alto Adigio, el DILF está orientado intencionalmente al léxico moderno y reduce al mínimo el de carácter tradicional (pero véase VoLF más adelante). Más reciente es el Dizionar Fodom-Talián-Todësch (Masarei 2005), una labor personal de Sergio Masarei, maestro ya de la escuela de Livinallongo, apoyada firmemente por el SPELL y por los institutos ladinos: el diccionario tiene una estructura particular, con entradas en fodom (ladino de Livinallongo) y traducción tanto en italiano como en alemán. La obra pretende ser un diccionario de propuestas –es rica, de hecho, en neologismos, cuya creación está basaba en los mismos principios del DILF (1999) e de Mischì (2000)– y, al mismo tiempo, de selección del léxico tradicional del valle. Los índices inversos, desde el italiano y desde el alemán, permiten la función proponente a aquellos que quieren escribir en fodom. En estos diccionarios de valle, compilados por lexicógrafos profesionales que reciben el apoyo de instituciones públicas y de correctores externos, el objetivo fundamental es ofrecer una moderna herramienta de consulta a quienes buscan escribir en alguna de las variedades de ladino. Es sintomático de las condiciones culturales del Trentino y del Véneto por un lado, y del Alto Adigio por otro, que la lengua considerada estándar y la que sirve de medio para la comprensión y llegada a las estructuras ladinas sean, respectivamente, italiano y alemán. Estas obras, si las consideramos en su conjunto, no se proponen, por tanto, reunir y documentar solamente el léxico ladino tradicional, sino, sobre todo, “ladinizar” el mundo semántico correspondiente a la entrada en la lengua de cultura internacional; es decir, ofrecer al hablante una idea o una norma para poder hablar y escribir en la propia variante incluso de temas no locales o tradicionales. Un diccionario dialectal de segunda generación – por su estructura parcialmente polilectal – será el Vocabolar Ladin fascian (VoLF), objetivo final del homónimo proyecto lexicográfico del ICL, que consiste en una selección exhaustiva del léxico tradicional de las variedades del fassano. Está basado en datos ya informatizados por el proyecto SPELL y ampliados con el análisis sistemático (en parte automatizado gracias al mismo software usado para el DILF) de la literatura fassana; la obra tendrá las entradas en fassano estándar y el artículo en italiano contendrá todas las posibles formas locales.

160

Vittorio Dell'Aquila / Gabriele Iannàccaro

De la tipología de los diccionarios de propuestas polilectales forma parte, a todos los efectos, el Dizionar dl Ladin Standard (DLS 2002) con sus índices inversos desde el alemán (DLS 2003a) y desde el italiano (DLS 2003b) que, junto a la Gramatica dl Ladin Standard (GLS 2001), pone en marcha las pautas de normalización ortográfica unitaria del ladino dolomítico propuestas por Heinrich Schmidt (1994¹, 2000²) paralelamente a lo ya realizado con el romantsch grischun (Schmid 1989) durante los años anteriores. La finalidad de esta intervención de planificación lingüística es la de crear un código escrito de referencia percibido de manera no demasiado diferente de cada una de las variantes territoriales de base y, al mismo tiempo, unívoco en la grafía para poder, contemporáneamente, representarlas todas. Esto, en el léxico, se traduce fundamentalmente en la selección y comparación objetiva del mayor número de formas posibles: detrás del DLS, por así decirlo, existe un archivo que recoge no solo las formas espontáneas y registradas del lema que se está tratando, sino también una documentación, realmente notable por vastedad, del uso que de estas formas se ha hecho en la producción lingüística espontánea (artículos de prensa, resoluciones, escritos varios) en las distintas tradiciones ortográficas de valle. En el DLS, cada lema de una palabra ladina es una especie de “máximo común denominador” de palabras espontáneas, usadas naturalmente en textos de las diferentes variedades ladinas – sin que quien las ha utilizado supiese que después serían incorporadas a un diccionario. Las formas, en sus grafías y en sus variantes fonéticas locales, están, en cualquier caso, registradas en el artículo antes de las traducciones en alemán e italiano. El DLS reúne y profundiza pedacitos diseminados de ladino, proponiendo una unidad lingüístico-ortográfica que hasta el momento no existía. Esta idea es, precisamente, el motivo por el cual el DLS está lejos de caer en tentaciones de tipo impositivo, “forjador” diremos, con respecto a la lengua; y esto es importante incluso más allá de la posibilidad que tiene el usuario de hacerse una idea comparativa cuando lleva este diccionario al ámbito de las obras científicas: de hecho, para los estudiosos de ladino, es la primera ocasión de encontrar una panorámica sinóptica de sus variedades, utilísima desde el punto de vista tipológico y dialectológico. En este sentido, el DLS puede emparentarse, incluso en sus proporciones necesariamente reducidas, a otras obras lexicográficas esencialmente comparativas, como –solo para permanecer en el área– el Handwörterbuch des Rätoromanischen (HWR 1994) que precisamente tiene como subtítulo Wortschatz aller Scriftsprachen, einschliesslich Rumantsch Grischun, mit Angaben zur Verbreitung und Herkunft o el Lessico Dialettale della Svizzera Italiana, publicado in cinco volúmenes en el 2004. El DLS es, como se dice explícitamente en la cubierta, un work in progress, un trabajo de investigación y de experimentación continuos, por un lado, para ampliar y, en caso necesario, corregir el léxico propuesto y, por otro, para chequear y verificar el prototipo de grafía ladina unitaria a nivel de uso y de práctica de la escritura. En particular, se invita al usuario a utilizar el vocabulario de manera creativa, experimentando soluciones léxicas y gráficas, nuevas y originales, que por distintas razones no fuesen previstas por el mismo DLS. La atención se centra, ante todo, en la ampliación del léxico mediante la inclusión de palabras nuevas y de

Lexicografía ladina moderna

161

terminología moderna – técnica, científica, administrativa; necesaria para aumentar la capacidad operativa del ladin standard (cfr. también Videsott 1996). Siguiendo esta óptica, ha sido publicada en el 2012 la Enjonta al Dizionar dl Ladin Standard, un breve léxico cuyas entradas fueron extrapoladas de manera semiautomática a través de un software creado ad hoc (el mismo también usado, más tarde, para el DILF) de un corpus de textos escritos en ladin standard. Dicho corpus lo componen 676 textos con un total de casi 800 000 palabras –incluidas las formas declinadas y conjugadas– que constituyen la gran mayoría de los textos publicados en ladin standard entre los años 2002 y 2011– artículos de prensa, traducciones y narrativa original. La lista de palabras nuevas presentadas en la Enjonta es pues el resultado de un trabajo de selección, análisis y clasificación de formas ortográficas de palabras patrimoniales incluidas en los diccionarios de valle –en grafía local– y de neologismos, registrados o no en las transcripciones de las hablas. 5. Las obras citadas anteriormente están disponibles en soporte papel; sin embargo, debido al clima cultural y tecnológico en el que la lexicografía ladina moderna ha dado sus primeros pasos, se han elaborado, como hemos señalado, con la ayuda de procedimientos informáticos. Esto ha hecho posible un proyecto, iniciado ya a principios de la década de los noventa, que contempla la digitalización en una única base de datos de todos los diccionarios ladinos, modernos e históricos, junto a otros materiales lexicales aún inéditos. La Banca Lessicala Ladina (BLad) ha tomado la forma de un diccionario de segunda generación o, si se prefiere, de un diccionario de diccionarios, o sea, la reelaboración mediante modernas herramientas informáticas de todo el thesaurus lexical ladino (cfr. también Lurà / Moretti / Zoli 2010). El diccionario está disponible en la red () o bajo forma de bases de datos locales. Esto ha requerido la concepción y la preparación de específicas metodologías lexicográficas oportunamente estudiadas por la lexicografía polilectal, así como la recopilación y el análisis de los datos lingüísticos que constituyen las fuentes. Su naturaleza de diccionario polilectal prevé una estructura jerárquica organizada en árbol, en la cual el lema de una variante considerada primaria se propaga progresivamente hacia todas las lenguas puntuales correspondientes a cada uno de los diccionarios o a cada una de las localidades; entre estos dos extremos se pueden, eventualmente, interponer distintas lenguas de áreas intermedias, ubicadas en varios grados de inclusión progresiva: en nuestro caso, puede ser interesante unificar más diccionarios relativos a una misma localidad, de manera que exista un testimonio único y más amplio o de tipo diacrónico; o, por ejemplo, podríamos tener un “área Fassa”, resultado de la selección de los diccionarios disponibles para este valle o un área cazet, si lo que buscamos es el subdialecto concreto del valle de Fassa. BLad es, por tanto, el conjunto de un número potencialmente ilimitado de diccionarios distintos (cada uno, en principio, autónomo), estrechamente unidos y consultables individualmente, pero también y, sobre todo, como si fuesen uno solo. El particular tratamiento informático aplicado no es únicamente funcional para la catalogación y presentación específica de todas las informaciones lingüísticas resumidas en la base

162

Vittorio Dell'Aquila / Gabriele Iannàccaro

de datos, sino que también permite recomposiciones que, progresivamente, se focalizan en determinadas aproximaciones y puntos de vista; en concreto, el sistema es capaz de generar diccionarios sectoriales, locales o específicos, cuya tipología varía en función de la colocación sobre el árbol de las lenguas de la variedad tomada en consideración. En resumen, la obra permite el acceso simultáneo a todas las variedades ladinas documentadas, consintiendo su consulta, en diferentes grados y con distintas finalidades, a una enorme cantidad de información lingüística, antropológica, literaria e histórica. Una salida posible para la base de datos BLad debería ser su transformación en diccionario de papel, panladino y pancronico (sincrónico-diacrónico), el Dizionar General dl Lingaz Ladin (DGL).

Referencias bibliográficas Bernardi, Rut (1993): «L ladin dla Dolomites: planificazion, elaborazion y normalisazion tres standardisazion», Mondo Ladino, 3-4, 37-66. BLad [s.d.]: Banca dac Lessicala Ladina. Disponible en . Chiocchetti, Fabio (2004a): «Lengac polinomics e stardardisazion», en AA.VV., Bilinguism aministratif te Fascia. Vich-Vigo di Fassa: Comprenjorie Ladin de Fascia, 183-222. — (2004b): «Ladin dolomitan y standardisazion interladina», en AA.VV., Bilinguism aministratif te Fascia. Vich-Vigo di Fassa: Comprenjorie Ladin de Fascia, 265-275. Comitato = Comitato del Vocabolario delle Regole d'Ampezzo (ed.) (1997): Vocabolario Italiano-Ampezzano. Cortina d'Ampezzo/Anpezo: Cassa Rurale ed Artigiana di Cortina d'Ampezzo e delle Dolomiti. DILF = Chiocchetti, Fabio / Valeruz, Nadia (eds.) (1999¹, 2013³): Dizionario Italiano - Ladino fassano / Dizionèr Talian — Ladin fascian. Vich-Vigo di Fassa: Istitut Cultural Ladin «Majon di Fascegn». DLS = Valentini, Erwin (coord.) / Chiocchetti, Fabio / Chiocchetti, Nadia / Valentin, Daria / Stuflesser, Mathias (redac.) (2002): Dizionar dl ladin standard. Vich-Vigo di Fassa/San Martin de Tor/Bozen-Bolzano: SPELL. DLS = Valentini, Erwin (coord.) / Della Giacoma, Donatella / Dell'Aquila. Vittorio (redac.) (2003a): Dizionar dl ladin standard - Indesc todesch – ladin. Vich-Vigo di Fassa/San Martin de Tor/Bozen-Bolzano: SPELL. DLS = Valentini, Erwin (coord.) / Chiocchetti, Nadia / Chiocchetti, Bernardino (redac.) (2003b): Dizionar dl ladin standard - Indesc talian – ladin. Vich-Vigo di Fassa/San Martin de Tor/Bozen-Bolzano: SPELL. Dell'Aquila, Vittorio (2006): «L Ladin dolomitan: propostes de svilup», en Rita Caprini / Michele Contini, eds., Motivazione e continuità linguistica. Per Mario Alinei in occasione dei suoi 80 anni. Quaderni di Semantica, 53-54. Clueb: Bologna Dell'Aquila, Vittorio / Iannàccaro, Gabriele (2001): «Quali standard per il ladino? Riflessioni a partire dalla Survey Ladins», Mondo Ladino, 25, 137-168. — (2004): La pianificazione linguistica. Lingue, società, istituzioni. Roma: Carocci. Enjonta = Chiocchetti, Nadia / Dell'Aquila, Vittorio/ Irsara, Siegfried / Valentin Erwin (2012): Enjonta al Dizionar dl Ladin Standard. Vasa: Forskningscentrum för Europeisk Flerspråkighet. Forni, Marco (2002): Wörterbuch Deustch – Grödner-Ladinisch / Vocabuler Tudësch - Ladin de Gherdëina. Sëlva/Wolkenstein/San Martin de Tor: Istitut «Ladin Micurà de Rü».

Lexicografía ladina moderna

163

GLS = Valentini, Erwin (coord.) / Chiocchetti, Nadia (redac.) (2001): Gramatica dl ladin standard. Vich/Vigo di Fassa/San Martin de Tor/Bozen-Bolzano: SPELL. HWR = Bernardi, Rut / Decurtins, Alexi / Eichenhofer, Wolfgang / Saluz, Martina/ Vögeli, Moritz (1994): Handwörterbuch des Rätoromanischen. Zürich: Offizin Verlag. Iannàccaro, Gabriele (2002): «L Dizionar dl ladin standard y l linguist», prefazione a DLS: xivxxii. — (2009): «Le belle parole. Appunti di purismo», Mondo Ladino, 32, 45-66. Iannàccaro, Gabriele / Dell'Aquila, Vittorio (2008): «Per una tipologia dei sistemi di scrittura spontanei in area romanza», Estudis Romanics, 30, 301-331. Kattenbusch, Dieter (1994): Die Verschriftung des Sellaladinischen. Von den ersten Schreibweisen bis zur Einheitsgraphie. San Martin de Tor: Istitut Ladin «Micurà de Rü». LSI = Lurà, Franco (dir.) / Moretti, Michele (eds.) (2004): Lessico dialettale della Svizzera italiana. Bellinzona: Centro di Dialettologia e di etnografia. Lurà, Franco / Moretti, Michele / Zoli Carlo (2010): «Dalla carta al web; la versione informatica del lessico dialettale della Svizzera italiana», en Giovanni Ruffino / Mari D'Agostino, eds., Storia della lingua italiana e dialettologia. Atti del VIII Convegno Internazionale dell'Associazione per la Storia della Lingua Italiana, Palermo, 29-31 ottobre 2009. Palermo: Centro di studi filologici e linguistici siciliani, 503-515. Masarei, Sergio (2005): Dizionar Fodom-Talián-Todësch con indesc italiano-fodom e Deutschfodom. Col / Colle Santa Lucia: Istitut Cultural ladin «Cesa de Jan» - SPELL. Mischì, Giovanni (2000): Wörterbuch Deustch-Gadertalisch / Vocabolar Todësch - Ladin (Val Badia). San Martin de Tor: Istitut Ladin «Micurà de Rü». Schmid, Heinrich (1989): «Richtlinien für die Gestaltung einer gesamtbündnerromanischen Schriftsprache Rumantsch Grischun», Annalas da la Societad Retorumantscha, 102. Disponible en [Consulta: 24/09/2014]. — (1994¹): Wegleitung für den Aufbau einer gemeinsamen Schriftsprache der Dolomitenladiner. Vich-Vigo di Fassa/San Martin de Tor: Istitut Ladin «Micurà de Rü» - Istitut Cultural Ladin «Majon di Fascegn». — (2000²): Criteri per la formazione di una lingua scritta comune della ladinia dolomitica. VichVigo di Fassa/San Martin de Tor: Istitut Ladin «Micurà de Rü» - Istitut Cultural Ladin «Majon di Fascegn» (versione italiana ampliata di Schmid 1994¹). Thomas, George (1991): Linguistic Purism. London/New York: Longman. Usc [s.d.]: La Usc di Ladins. Disponible en [Consulta: 20/09/2014]. Valentini, Erwin (2002): Ladin standard. N lingaz scrit unitar per i ladins dles Dolomites. VichVigo di Fassa/ San Martin de Tor/Bozen-Bolzano: SPELL. Videsott, Paul (1996): «Wortschatzerweiterung im Ladin Dolomitan», Ladinia, 20, 163-173. Videsott, Paul / Plangg, Guntram (1998): Ennebergisches Wörterbuch: Ennebergisch-Deutsch. Mit einem rückläufigen Wörterbuch und einem deutsch-ennebergischen Index / Vocabolar Mareo: Mareo - Todësch. Con en vocabolar invers y en indesc todësch. Mareo/Enneberg/ Innsbruck: Universitätsverlag Wagner. VoLF = Chiocchetti, Fabio (coord.) / Botolotti, Evelyn / Dell'Aquila, Vittorio (redac.) [en prep.], Vocabolar Ladin fascian. Vich-Vigo di Fassa: Istitut Cultural Ladin «Majon di fascegn».

 Hábitos de uso de los diccionarios entre los estudiantes universitarios europeos: ¿nuevas tendencias? María José Domínguez Vázquez Universidade de Santiago de Compostela / Red de Lexicografía RELEX / HUMBOLDT

Carlos Valcárcel Riveiro Universidade de Vigo / Red de Lexicografía RELEX

Dictionary use among European university students: new trends? Abstract Within the framework of the consideration of the role of dictionary users developed by some researchers in lexicography over the last two decades, this study focuses on two main themes. First, it provides an overview of the methods of analysis and new trends in research on the proficiency of dictionary users, presenting an innovative design for an online data survey for a pilot study on dictionary use by Spanish university students. The paper’s second core issue relates to the presentation and analysis of the data collected. Special attention is paid here to linguistic diversity, consultation of electronic dictionaries in various formats, correlations between internet use patterns and dictionary consultation, and parameters that help to assess respondents’ use and mastery of dictionaries. The paper’s findings point to the need for more effective teaching of dictionary use and the development of new lexicographic products. Keywords dictionary user, data collection, online dictionaries, paper dictionaries.

1. Introducción La relación entre una obra de consulta y su usuario1 se puede entender igual que la relación existente entre el significante y el significado de un signo lingüístico, esto es, –––––––— 1



Los resultados de la investigación están en relación con el proyecto «Portal Lexicográfico: Diccionario online modular multilingüe y corpus informatizado anotado de la frase nominal» (PORTLEX) (cofinanciado con cargo a una ayuda del Ministerio de Economía y Competitividad, FFI2012-32456, y FEDER 2007-2013) y con la «Red de Lexicografía RELEX» (CN 2012/290). María José Domínguez ha realizado este trabajo durante una estancia de investigación en el Institut für Deutsche Sprache (Mannheim) al amparo de una

166

María José Domínguez Vázquez / Carlos Valcárcel Riveiro

tanto el diccionario como su usuario son diferentes caras de la misma moneda. El diccionario ha sido en el marco de esta relación binaria el protagonista principal, por no decir casi exclusivo en los estudios lexicográficos y metalexicográficos – objeto de estudio desde hace siglos ha sido su tipología y concepción así como los problemas derivados de la descripción lexicográfica o la crítica lexicográfica; sin embargo el interés por el papel que desempeña el usuario en el proceso de consulta de la obra lexicográfica junto con los condicionantes internos y externos (Wiegand 1987, 2008) despunta básicamente a partir de los años 80 (Chen 2011; Domínguez / Mirazo / Vidal 2013; Hulstijn / Atkins 1998; Müller-Spitzer / Koplenig en este volumen; Ripfel / Wiegand 1988; Rossenbeck 2006; Scharnhorst 2004; Tono 2011; Wang 2001; Welker 2006, 2010 y Wiegand, 1987, 1998, 2008, 2010, entre otros). 2 Nos encontramos, por tanto, ante una de las más jóvenes disciplinas en el campo de la lexicografía actual.3 El desequilibrio en la atención científica prestada a ambos – obra de consulta y usuario – parece pues evidente y resulta cuanto más llamativa, en especial, si tenemos en cuenta dos factores fácilmente constatables que parecen estar en oposición. En la actualidad se observa una carencia de estudios empíricos que arrojen datos sobre el grupo receptor de una obra de consulta previamente a su diseño y elaboración; sin embargo, en la introducción de los diccionarios es un apartado común hacer referencia explícita al destinatario al que va dirigido la obra. Pero ¿cómo se pueden evaluar las necesidades del usuario si no existen estudios previos al respecto? Parece, pues, que el lexicógrafo se sigue viendo obligado a “intuir” las necesidades y expectativas del usuario a la hora de elaborar una obra, si bien, a su vez, este no tiene por qué coincidir necesariamente con el usuario real de la obra concebida. En esta línea, nuestro trabajo, junto con un breve panorama sobre la investigación en torno al diccionario y su uso, aporta datos resultantes de un sondeo piloto sobre el uso de diccionarios entre alumnos universitarios sin un perfil académico filológico o traductológico (vid. 2.2). Así, en la primera página de la encuesta diseñada consta lo siguiente: «Queremos saber cómo usas los diccionarios, no solo los impresos, sino también los que existen en internet o los que descargas como aplicaciones en tu teléfono.» (Domínguez / Valcárcel, Encuesta UsoDEU). Ya que el sondeo se realizó principalmente para comprobar la validez del cuestionario elaborado, nos detendremos también en presentar sus características y el contexto en el que se puso a prueba su pertinencia. Seguidamente, abordaremos de modo detallado los resultados más significativos referentes a a) frecuencia de uso y formato de diccionario, b) grado de satisfacción con el resultado de la búsqueda y formato de diccionario, c) finalidad del uso y tipo de búsqueda, d) motivos para el –––––––—

2

3

beca de investigación concedida por la Fundación Alexander von Humboldt. Este aspecto es además fácilmente constatable si comparamos el apartado dedicado a los diccionarios y su uso (Teil II: Lexikographie und Gesellschaft II: Wörterbücher und ihre Benutzer, en Wörterbücher: Ein internationales Handbuch zur Lexikographie (Hausmann et al. 1989) con otros bloques centrales de este estudio. Este cambio de tendencia se observa, por ejemplo, en la selección temática del congreso de Afrilex (2006) y del congreso de Euralex en 2014.

Hábitos de uso de los diccionarios entre los universitarios europeos

167

uso del diccionario online y sus dificultades y e) uso de blogs y finalidad. La encuesta resulta también novedosa por plantear preguntas tanto sobre el uso del diccionario en la lengua/s materna/s como en la/s extranjera/s. La pregunta que se plantea es si la estructura, diseño e información del diccionario junto con su representación cumple las expectativas del público al que va dirigido o si existen desequilibrios entre los objetivos del lexicógrafo y las necesidades del usuario. Asimismo pretendemos elaborar un catálogo de conclusiones con perspectiva de futuro, no sin dejar de mencionar posibles mejoras del cuestionario diseñado.

2. La encuesta como método de análisis 2.1. Consideraciones iniciales La propia metodología para la extracción y análisis de los datos sobre el usuario del diccionario se constituye en sí misma como objeto de estudio, tal y como se observa en la bibliografía especializada (Hartmann 2001: 94; Kromann 1995: 503; Wiegand 2008).4 Entre los procedimientos aplicados destacan especialmente la observación, la encuesta, las actas y diferentes experimentos,5 e incluso se desarrollan métodos que combinan diferentes opciones, como es, por ejemplo, el caso del Estudio de Exeter (Hartmann 1999), del cual se han hecho eco numerosas investigaciones (Sánchez Ramos 2005 y Ekwa Ebanéga / Tomba Moussavou 2008, entre otros). Como procedimientos empírico-analíticos novedosos se han de considerar el `Simultaneous Feedback´ (de Schryver / Prinsloo 2011) y el análisis de `log files´ (Bergenholtz / Johnsen 2005; Kemmer 2010). Entre los métodos, el más extendido es el de la encuesta, si bien tanto el número de encuestados que conforman la base del estudio como los objetivos e ítems de la misma difieren en gran medida. Así, en los trabajos de Domínguez / Mirazo / Vidal (2013), Tu (2000), Ripfel (1989b) y de Schryver / Prinsloo (2011) recae el acento en la relación lenguas extranjeras, lingüística contrastiva y uso de diccionario, mientras que en las aportaciones de Wang (2001), Muráth (2005), Sánchez Ramos (2005), Mackintosh (1998) y Taljard / Prinsloo (2011) se aborda la temática en relación con –––––––— 4

5



Se constatan diferentes aproximaciones a esta temática, las cuales resumimos a continuación: a) un número considerable de estudios se centra en una tipología diccionarística según las diferentes posibilidades de uso (Engelberg / Lemnitzer 2009 o Kühn 1989; b) para los déficits de información y las dificultades del manejo del diccionario así como para para su optimización contamos con las obras de Gouws / Prinsloo (2005, cap. 4), Kemmer (2010), Ripfel (1989a), Wiegand (1995), etc.; c) otras aproximaciones se centran en simulaciones de situaciones de uso típicas (Kromman 1995; Tarp 2008), como, por ejemplo, la recepción textual, la producción, la traducción, la enseñanza y el aprendizaje de lenguas extranjeras). Para información detallada véase Heid / Zimmermann (2012), Hartmann (2001), Welker (2006) y Wiegand (1987, 2008).

168

María José Domínguez Vázquez / Carlos Valcárcel Riveiro

diccionarios específicos, situaciones académicas y traducción. Muy pocos estudios focalizan el uso del diccionario por hablantes nativos (Ripfel 1990; Retti 2004; Ekwa Ebanéga / Tomba Moussa 2008).

2.2. Cuestionario UsoDEU: objetivo, características y desarrollo del estudio piloto. Antes de describir las características del sondeo piloto realizado con el cuestionario UsoDEU, es necesario señalar que con este se pretendía principalmente completar la fase inicial de una línea de investigación más amplia. Se trataba de comprobar la validez de un modelo de cuestionario encaminado a obtener, en el contexto del Espacio Europeo de Educación Superior, datos empíricos sobre el uso, en términos de frecuencia, preferencias y dificultades, que los estudiantes hacen de los principales tipos de diccionarios disponibles a su alcance, y, en especial, de los diccionarios electrónicos en línea. Este objetivo principal queda reflejado en el acrónimo UsoDEU (Uso [de] D[iccionarios por parte de] E[studiantes] U[niversitarios]), escogido para denominar el estudio y la encuesta en el que se basa. La elección de los jóvenes universitarios como universo para nuestro estudio se debe, en buena medida, a la facilidad que tenemos, siendo nosotros mismos profesores de universidad, para acceder a este sector de la población. Sin embargo, tampoco debemos olvidar que los estudiantes constituyen uno de los segmentos más importantes del mercado lexicográfico y que los diccionarios juegan un papel importante en el proceso de aprendizaje de las lenguas. Esto, unido al hecho de que el desarrollo de competencias comunicativas en una o más lenguas es uno de los principales objetivos de los currículos educativos, explica que buena parte de la producción lexicográfica actual se encamine a los estudiantes, particularmente a los de idiomas (Swanepoel 2001, 160-161). No es de extrañar, pues, que los hábitos de uso de los diccionarios por parte de los estudiantes universitarios ya hayan sido objeto de varios estudios (Al-Salami / Hattab 2008: 32; Domínguez / Mirazo / Vidal 2013; Ekwa Ebanéga / Moussavou 2008; Hartmann 1999; Maridé / Pihler 2004; Ripfel 1989b; Tu 2000). La muestra de nuestro estudio se tomó en el Campus de Pontevedra de la Universidad de Vigo, el más pequeño de los tres que conforman esta universidad. Durante el curso 2012-2013, se habían matriculado en las titulaciones de grado y postgrado del campus 3 931 estudiantes. Partiendo del objetivo fijado y del universo seleccionado, se elaboró un cuestionario cuyas características se presentan en 2.3. Para facilitar su cumplimentación por parte de los estudiantes y para agilizar el tratamiento estadístico de los datos recogidos, se albergó la encuesta en un servicio de estadísticas en línea. Para ello, y siguiendo la metodología aplicada para las encuestas del proyecto Elexiko (Müller-Spitzer / Klopenig / Töpel 2012: 429), se escogió el portal Unipark6, en el que, además de almacenar los datos obtenidos, se puede realizar la gestión estadística de los mismos. –––––––— 6

Para más información sobre Unipark vid. .

Hábitos de uso de los diccionarios entre los universitarios europeos

169

La encuesta se lanzó el 1 de mayo de 2013 y permaneció abierta durante un mes. Para animar a los estudiantes del campus a cumplimentar el cuestionario en línea se hizo público el enlace del mismo en diferentes grupos de trabajo en las redes sociales.7 Asimismo, en la difusión de la encuesta también colaboraron los decanatos de las diferentes facultades del campus de Pontevedra, que enviaron correos electrónicos a todo su alumnado con el enlace del cuestionario. En el momento de cerrar la encuesta en línea, la habían completado correctamente 171 estudiantes, lo que supone un margen de error elevado, ±7,3% para el total de la muestra con un margen de confianza del 95%. Por lo tanto, los resultados presentados aquí deben considerarse como un sondeo y asumirse con cierta cautela.8 Sin embargo, como veremos posteriormente, en ciertos aspectos los resultados aquí analizados apuntan tendencias de uso claramente definidas y, a veces, sorprendentes.

2.3. Cuestionario UsoDEU: postulados teóricos y diseño Desde un punto de vista teórico nuestra encuesta se fundamenta en la teoría desarrollada por Wiegand (1987: 180 y ss., 2008: 5 y ss.) para la investigación en el uso del diccionario, en la que se propone una estructuración de la misma basada en los actos de habla. Por tanto, según Wiegand nos encontramos ante una actividad – “utilizar un diccionario” – que tiene como objetivo “usar un diccionario como obra de consulta”. A este tipo de actividad se le adjudican una serie de elementos propios de la misma, que son los que, a su vez, merecen atención a la hora de diagnosticar el uso del diccionario atendiendo a diferentes factores: a) el sujeto (¿quién?), b) el resultado (¿qué?), c) la modalidad (¿cómo?), d) la frecuencia (¿con qué regularidad?), e) contexto externo de uso (circunstancia: ¿en qué circunstancias?, tiempo: ¿cuándo?, duración: ¿durante cuánto tiempo?, lugar: ¿en dónde?, f) contexto interno de uso (finalidad: ¿para qué?, causa: ¿por qué?) y g) resultados: ¿con qué consecuencias?). Además del trabajo de Wiegand, resultaron fundamentales los estudios sobre el uso de los diccionarios online llevados a cabo en el marco del proyecto Elexiko, desarrollado por el Institut für Deutsche Sprache9 (Müller-Spitzer / Klopenig / Töpel 2012 y Müller-Spitzer / Klopenig en este volumen10) y el estudio de Domínguez / Mirazo / Vidal (2013), los cuales sirvieron de punto de partida para diseñar un –––––––— 7

8

9 10

Al igual que otras universidades, la creación de diferentes grupos de trabajo de profesores y estudiantes en las redes sociales, especialmente en Facebook, es una práctica cada vez más frecuente en la Universidad de Vigo. A este respecto, no podemos dejar de recordar que el objetivo de este primer sondeo exploratorio era más el de comprobar la validez de un cuestionario piloto que el de recoger y analizar datos estadísticamente representativos. Se puede consultar información más detallada sobre este proyecto en el siguiente enlace: . Agradecemos a Carolin Müller-Spitzer y Alexander Klopenig, ambos del Institut für Deutsche Sprache, que nos hayan dado acceso libre a la encuesta y a sus trabajos en prensa.

170

María José Domínguez Vázquez / Carlos Valcárcel Riveiro

cuestionario específico para el presente estudio. En concreto, el catálogo de preguntas plantea ítems para los siguientes ejes o bloques temáticos: - Datos personales: marco y población objeto - Repertorio lingüístico: nivel de dominio de diferentes lenguas atendiendo a las cuatro destrezas lingüísticas. - Uso de internet: tiempo de conexión, dispositivos de conexión, lugar de la conexión y finalidad de la misma.11 - Uso de diccionario impreso y electrónico En primer lugar, era necesario conocer una serie de datos personales básicos de los encuestados –edad, sexo y estudios realizados–, los cuales constituyen variables independientes susceptibles de influir en los patrones de uso de los diccionarios. Junto a preguntas relacionadas con estas variables, se incluyeron una serie de ítems relacionados con el repertorio lingüístico de las personas encuestadas. Como sabemos, los procesos de globalización, y más concretamente el de integración europea, multiplica los intercambios comunicativos en contextos bilingües y plurilingües, lo que a menudo conlleva el recurso a la traducción y la consulta de diccionarios o glosarios terminológicos. Estas prácticas son especialmente habituales en Galicia, ya que se trata de un territorio oficialmente bilingüe. 12 De este modo, y para el estudio que nos ocupa aquí, resultaba de especial interés conocer la lengua inicial y habitual de los encuestados, así como su grado de conocimiento y uso de las lenguas extranjeras (compárese también Ekwa Ebanéga / Tomba Moussavou 2008: 352). Para la selección de las variables independientes de este bloque de ítems se tuvieron en cuenta los cuestionarios diseñados por el Seminario de Sociolingüística de la Real Academia Galega en su estudio sobre el repertorio lingüístico inicial de la población gallega (González 2007). Por otro lado, para la redacción de las preguntas relacionadas con la competencia en las diferentes lenguas seleccionadas se tomaron como índices capacidades clave que forman parte de los descriptores del nivel B2 del MECRL (MECD 2002: 31). Los hábitos de internet por parte de las personas encuestadas constituyen también un factor importante a tener en cuenta ya que uno de los principales objetivos de este estudio consiste precisamente en conocer el grado de utilización de diccionarios en línea. Factores como la frecuencia, dispositivos y lugar de conexión, así como la finalidad de la misma, constituyen variables que inciden, sin lugar a dudas, en el nivel y formas de uso de los diferentes tipos de recursos lexicográficos disponibles en internet. Para la concepción de este conjunto de ítems para nuestro –––––––— 11 12

Con este bloque de ítems se pretende averiguar datos sobre el uso de los diccionarios en red ligados a aspectos técnicos y condicionantes externos. La Comunidad Autónoma de Galicia, donde se encuentra el Campus de Pontevedra, cuenta con dos lenguas cooficiales: gallego y castellano. Si bien las dos no constituyen las lenguas iniciales de la mayoría de la población, sino sólo una de ellas, su aprendizaje se extiende durante toda la enseñanza obligatoria. Ambas lenguas se usan prácticamente en todos los contextos sociales, aunque con marcados desequilibrios en algunos de ellos (Valcárcel / Pino / Froján 2012).

Hábitos de uso de los diccionarios entre los universitarios europeos

171

cuestionario resultaron de gran utilidad los cuestionarios diseñados por el Instituto Nacional de Estadística (INE 2012) y Eurostat (2012). Tras las preguntas centradas en el perfil de los encuestados y en sus hábitos como internautas, el cuestionario pasa a centrarse en el objeto de estudio, es decir, el uso de los diccionarios por parte de los encuestados. Se distinguen aquí tres tipos de diccionario en función del formato: diccionarios impresos, en CD-ROM y en línea.13 Con respecto a los diccionarios en línea, la diversidad de recursos de consulta lexicográfica en línea hizo necesaria una delimitación del concepto. Para ello, tomamos como referencia los trabajos de Storrer (2010: 156) y Mann (2010: 24),14 incluyendo, además de los diccionarios en formato web, las aplicaciones para dispositivos móviles. En función del tipo de diccionario, los ítems de este bloque temático perseguían obtener datos precisos sobre las lenguas consultadas y el proceso de consulta (finalidad, tipo de información consultada y resultados). Además, en el caso de los diccionarios en red, se incluyeron ítems sobre el contexto externo de uso –aspecto muy poco analizado hasta el momento-como, por ejemplo, el lugar de consulta. Por otro lado, también se incluyen preguntas sobre los foros de los diccionarios en red (Domínguez 2013), ya que en los mismos se le adjudica al usuario un nuevo rol como partícipe en la redacción, corrección y/o elaboración de las entradas gramaticales.15 Esta mayor atención prestada al usuario no ha de entenderse como una mera coincidencia o casualidad: por una parte, se enmarca en la tendencia de focalizar al usuario de la obra de consulta (vid. 1) y por otra, entronca con el aumento de uso de nuevos medios sociales, tecnológicos, etc. para la transmisión de la información y la comunicación. Por tanto, resulta interesante, cuanto menos, observar la influencia del usuario en la concepción y el diseño de obras y productos lexicográficos, así como la interacción entre usuarios y de estos con los equipos responsables de edición de los diccionarios. El encuestado también tiene la posibilidad de señalar las dificultades encontradas durante el proceso de búsqueda, las ventajas y desventajas de este tipo de diccionarios, los recursos –––––––— 13 14

15

Si bien todos los ítems de este apartado del cuestionario atendían al uso de los diccionarios en línea, en la mayoría también se tuvieron en cuenta los otros dos tipos de diccionarios. Según estos autores, se pueden diferenciar en general tres tipos de diccionarios en línea: a) los diccionarios digitalizados de corte tradicional, donde los usuarios pueden realizar consultas pero no interacciona con el equipo de redacción; b) diccionarios dirigidos por un equipo de redacción de la editorial y en los que el usuario puede hacer propuestas, correcciones, etc., siempre bajo la vigilancia de un equipo redactor (normalmente de la editorial) (Leo GmbH 2006-2013; Pons GmbH 2001-2013); c) diccionarios colaborativos generados por el usuario, como los wikicionarios (Meyer / Gurevych 2012), en donde el usuario puede generar entradas nuevas (las cuales son también controladas por una instancia superior). Sobre lexicografía online véase también Kemmer (2010), Klosa (2008) y Hass / Schmitz (2010), entre otros. La idea que subyace a la inclusión de este bloque es que, en caso de que el resultado de la búsqueda sea insatisfactorio, parece interesante saber si el usuario echa mano de los foros de modo activo o pasivo y además si, al observar alguna carencia, intenta participar de modo activo en la elaboración / corrección de las entradas.

172

María José Domínguez Vázquez / Carlos Valcárcel Riveiro

lexicográficos más utilizados o su grado de satisfacción con el resultado de las consultas, entre otros. El diseño de estos bloques temáticos, tomando como base los objetivos fijados y al universo seleccionado, dio lugar a un cuestionario de 33 preguntas con una estimación de tiempo medio de realización que ronda los diez minutos16 (vid. también el apartado 2.2).

3. Presentación y discusión de los principales datos recogidos 3.1. Perfil de los usuarios sondeados El perfil tipo de estudiante que contestó al sondeo responde al de una mujer (81,29%) que realiza estudios de grado (97,66%). En cuanto a su repertorio lingüístico, la mayoría de los estudiantes sondeados eran hispanohablantes: un 73,68% tuvo el castellano como lengua inicial exclusiva o predominante, un 71,35% se expresa habitualmente en esta lengua y un 76% la prefiere para escribir, tanto en contextos formales como informales. Por lo tanto, y esto es importante para poder explicar ciertas tendencias de uso de los diccionarios, la mayoría adquirió el gallego como lengua segunda.17 Solo un 24,56% de los estudiantes sondeados adquirió el gallego como lengua inicial predominante o exclusiva. La preferencia por esta lengua en los usos orales (26,32%) y escritos (28,65%) es también minoritaria. Otro aspecto del repertorio lingüístico de los estudiantes sondeados que se revelará esencial para entender sus hábitos de uso de diccionarios lo constituye su adquisición y competencia en lenguas extranjeras. La mayoría ha estudiado al menos, dos lenguas además del gallego y el castellano: el inglés (98,83%), y el francés (84,21%). 18 En ambas lenguas los encuestados señalan que la competencia de expresión escrita es la que peor dominan.

–––––––— 16

17

18

Agradecemos a José Vicente Novegil Souto, profesor del Departamento de Estadística e Investigación Operativa de la Universidad de Vigo, su asesoramiento en el diseño de esta encuesta y su cuestionario. Usamos aquí el término lengua segunda en el sentido que se le da en los países francófonos. Así, lengua segunda sería aquella que se adquiere mediante un alto grado de contacto o exposición social, normalmente en situación de inmersión sociolingüística y/o escolar. Sería, por ejemplo, el caso del francés en países como Costa de Marfil o del alemán para los emigrantes turcos o españoles residentes en Alemania o Suiza (Cuq / Davin-Chnane 2007). Sin embargo, y dado que el inglés lengua se enseña de manera obligatoria junto a las dos cooficiales en todas las etapas educativas no universitarias, esta lengua se suele adquirir durante más años que el francés. Así, el 89,94% de los estudiantes sondeados que había aprendido inglés lo había hecho durante más de cinco años, mientras que entre los estudiantes de francés este porcentaje se queda en un discreto 18,75%.

Hábitos de uso de los diccionarios entre los universitarios europeos

173

3.2. Hábitos de uso de internet A la vista de los resultados obtenidos se puede afirmar que conectarse a internet es un hábito cotidiano para la mayoría de los estudiantes sondeados. Así, el 69% se conecta a internet más de 30 minutos de media diaria y un 22,81% permanece conectado de media más de dos horas y media al día. Sin embargo, los datos relacionados con los dispositivos que utilizan para conectarse y los lugares desde donde lo hacen parecen sugerir que los estudiantes pasan más tiempo conectados a internet de lo que en realidad admiten. Así, la inmensa mayoría de los sondeados se conecta a internet desde dispositivos portátiles y, por lo tanto, ubicuos: casi un 93% utiliza el ordenador portátil y un 81,87% se conecta con el teléfono móvil. Por otro lado, los estudiantes se conectan desde los lugares donde pasan la mayor parte del día, es decir, su casa (98,25%) y su facultad (62,57%), donde, precisamente, acostumbran a tener acceso a la red.19 Si bien los porcentajes aportados no son motivo de sorpresa, estos datos referentes a la facilidad y la frecuencia con la que los estudiantes acceden a internet confirma que los diccionarios en línea –a diferencia de los impresos– están ya a su disposición en cualquier lugar o momento. Esta diferencia en la facilidad de acceso entre un tipo y otro de diccionarios explica en buena medida ciertas tendencias de uso observadas tras el análisis de los datos recogidos en el sondeo y que comentaremos a continuación.

3.3. Hábitos de uso de los diccionarios A la hora de elaborar el cuestionario y ponerlo a prueba en el sondeo exploratorio, partimos de la hipótesis de que la frecuencia de uso del diccionario en línea arrojaría los porcentajes más elevados. Los datos obtenidos no solo confirman claramente nuestro punto de partida, sino que además señalan el desuso del diccionario CDROM.20 A su vez, los diccionarios impresos se siguen consultando, presentando estos el índice más alto en un tipo de consulta ocasional (opción “a veces”).21 La siguiente –––––––— 19

20

21

Es necesario señalar aquí que los estudiantes disponen de un servicio wi-fi de conexión libre a internet en el perímetro de los tres campus de la universidad. Por otro lado, según el Instituo Galego de Estatística, el 76% de los hogares gallegos con estudiantes disponía de conexión a internet en 2012 (IGE 2013). Así, en la pregunta sobre el grado de satisfacción de la información aportada por el diccionario ante una consulta concreta, un 67,3% de los estudiantes sondeados dice no haber usado nunca un diccionario en CD-ROM. Por otro lado, más de un 25% no ofreció una respuesta sobre la frecuencia de uso de diccionarios en este formato, quizá porque estos estudiantes no lo conocen y, por tanto, no lo han usado nunca. Estas frecuencias de uso de los diccionarios en función del formato se observan de nuevo cuando se analizan los datos obtenidos en relación a la lengua objeto de las consultas realizadas. Cabe señalar aquí que el encuestado no diferencia entre un diccionario online y un producto en red que le sirva para la misma finalidad de búsqueda, o por lo menos esto se

174

María José Domínguez Vázquez / Carlos Valcárcel Riveiro

gráfica ofrece una panorámica de la frecuencia de uso en relación con el formato de diccionario: 100%

75,4%

75%

67,3% 60,2%

50% 39,8% 25,7%

25% 15,2% 5,3% 4,1% 0%

Diccionario impreso

6,4% 0,0% 0,0%

Diccionario online

0,6%

Diccionario CD_ROM

Gráfica 1: Frecuencia de uso por formato de diccionario

Al confirmarse la hipótesis de que los diccionarios más usados son ya los disponibles en línea (aplicaciones para móviles y herramientas en formato web), parece pertinente mantener en el cuestionario las diferentes preguntas acerca de los motivos de preferencia de los mismos frente a los otros formatos de diccionario, así como sobre los dispositivos de uso. Asimismo, consideramos oportuno recabar información sobre las actividades de uso y la información consultada, tanto en los diccionarios online como en los diccionarios impresos, con el objetivo de conseguir resultados comparativos atendiendo a las diferentes finalidades y consultas. Antes de abordar los datos concretos a este respecto, cabe aquí recordar el trabajo de Hass / Schmitz (2010: 3), quienes proponen una explicación sobre las ventajas del uso de los diccionarios en internet, y en definitiva, sobre el aumento de su manejo y consulta. Estos autores señalan que los puntos fuertes de estos diccionarios son, en especial, la constante actualización de los datos, la diversidad de los campos de información y los enlaces con otros diccionarios, corpus y obras de consulta. Pues bien, como de la gráfica 2 se desprende, existe un manifiesto desequilibrio entre el diagnóstico realizado por el lexicógrafo y los motivos que apuntan los encuestados para el uso de este tipo de materiales de consulta:

–––––––— desprende de los ítems en los que se pregunta por las herramientas de consulta utilizadas.

Hábitos de uso de los diccionarios entre los universitarios europeos

175

Gráfica 2: Motivos de uso del diccionario en línea

Como desencadenantes principales de uso se perfilan, según los datos obtenidos en el sondeo y por este orden, la búsqueda rápida y cómoda de la información, la gratuidad y el hecho de que se pueda acceder a estos diccionarios desde cualquier lugar. Por otro lado, aspectos como un formato atractivo o la oferta de material multimedia destacan por tener el índice más bajo de entre todas las opciones propuestas. Además, llama la atención el hecho de que sea la fiabilidad de los contenidos, un aspecto especialmente importante para determinar la calidad de un diccionario, el menos valorado por los estudiantes sondeados. Además, las ventajas de los diccionarios en internet señaladas por Hass y Schmitz tampoco parecen despuntar especialmente en los resultados del sondeo. Así, en el caso de la continua actualización se obtiene un porcentaje del 41,5% y en el de la interconexión con otros diccionarios y bases de datos un 33,3%. A continuación presentamos los datos estadísticos relativos a las actividades de uso (gráfica 3) y al tipo de información consultada (gráfica 4) en diccionarios impresos y en diccionarios en red, posteriormente nos centraremos en un análisis conjunto de ambas: 

176

María José Domínguez Vázquez / Carlos Valcárcel Riveiro

100% 84,2% 74,9%

75%

64,3%

62,0%

58,5%

50%

56,7% 55,0%

52,0%

54,4%

40,9%

25%

0% Al traducir

Al redactar un texto

Al corregir un texto

Diccionarios online

Al leer

Por simple curiosidad

Diccionarios impresos

Gráfica 3: Actividades de uso

Gráfica 4: Tipo de información consultada22



–––––––— 22

Las diferentes categorías que figuran en esta gráfica se refieren a los siguientes ítems del

Hábitos de uso de los diccionarios entre los universitarios europeos

177

El análisis de los datos, atendiendo en especial al contraste entre ambos tipos de diccionarios, nos permite extraer las siguientes conclusiones: 1. En todos los parámetros propuestos, con la salvedad de una consulta “por simple curiosidad”, se vuelve a evidenciar la preferencia de los estudiantes por los diccionarios online. 2. En ambos formatos de diccionario, los parámetros de uso más elevados se constatan en la competencia “escribir”, esto es, en la traducción y en la redacción, lo cual creemos que puede tener que ver con la tradición en el modo de enseñar las lenguas segundas y extranjeras, donde la traducción de textos y la memorización de glosarios bilingües juegan todavía un papel importante23 (Sánchez Iglesias 2009). En esta línea, también se ha de entender el uso del traductor automático de Google, en especial del inglés al castellano y del castellano al gallego, como el recurso más manejado por parte de los encuestados. En el caso de la traducción se observa una ligera ventaja (vid. gráfica 4) en la orientación de la traducción desde la lengua extranjera a la lengua materna, la cual, por ejemplo, no se observa en la encuesta realizada por Domínguez / Mirazo / Vidal (2013) entre hispanófonos que estudian alemán como lengua extranjera, en donde en ambos casos los porcentajes son iguales.24 3. Atendiendo a las lenguas, se observa que el mayor número de consultas afectan al español, gallego e inglés. Así, un 72,5% de los estudiantes encuestados afirma haber realizado en el último mes búsquedas relacionadas con el inglés en recursos online. El mismo porcentaje corresponde al castellano, mientras que para el gallego desciende hasta un 61,4%. Ya que, a su vez, las actividades de uso en las que recae el mayor peso son la traducción y la redacción de textos no extraña que la ortografía, en primer lugar, y la sinonimia y antonimia, en segundo lugar, sea el tipo de información lingüística consultada con un índice mayor de frecuencia en ambos formatos de –––––––—

23 24

cuestionario UsoDEU: quiero expresar en una lengua palabras de significado igual o contrario (sinónimos, antónimos); quiero traducir de la lengua extranjera a mi lengua habitual; quiero expresar en una lengua extranjera una palabra de mi lengua habitual; quiero buscar frases hechas, expresiones, refranes o proverbios, etc.; quiero saber con qué otras palabras se combina una palabra; quiero conocer la procedencia de una palabra; quiero saber el género de una palabra, clase de palabra, etc.; quiero saber cómo se pronuncia una palabra; quiero saber cómo se escribe una palabra. Esperamos poder verificar esta hipótesis con datos de encuestados de las mismas características pero en otros países. En el caso del presente estudio, es ya el inglés la primera lengua extranjera de los sondeados. Como se sabe, el inglés mantiene una presencia en los medios y en la red (películas, serie, música, juegos webs, etc.). Los datos obtenidos en este estudio piloto revelan, como se indica en el texto, que esta lengua extranjera es objeto de búsquedas lexicográficas en la red al mismo nivel que el castellano e incluso por encima del gallego. Estas razones podrían explicar la mayor importancia de las consultas relacionadas con prácticas da traducción inversa con respecto al estudio de Domínguez / Mirazo / Vidal (2013).

178

María José Domínguez Vázquez / Carlos Valcárcel Riveiro

diccionarios (vid. gráfica 4). Por la misma razón tampoco sorprende que – en este orden – la información etimológica y de carácter oral productivo presenten los datos de frecuencia de búsqueda más bajos. Más llamativos resultan los bajos índices de consulta referentes a la combinatoria de las palabras, que en la redacción y producción de textos así como en su traducción parecen a priori relevantes. Quizá esto se pueda explicar porque, como señalábamos anteriormente, el mayor índice de consulta es para las lenguas cooficiales y aquí los estudiantes parecen no tener dificultades de carácter sintáctico-combinatorio. La principal lengua extranjera, el inglés, tampoco parece plantear grandes problemas, ya que el tipo de búsqueda mayoritario es del inglés al castellano. Otras lenguas propuestas en la encuesta presentan un índice de consulta muy bajo. Como ya se ha señalado anteriormente, el grado de satisfacción con la obra de consulta constituye otro aspecto contemplado en el cuestionario UsoDEU. El grado de satisfacción depende en gran medida de si el usuario encuentra, o no, la información requerida, y de las dificultades en el manejo de la obra de consulta. En el primer caso, tanto para los diccionarios impresos como para aquellos en red, no hay ningún estudiante sondeado que afirme no haber encontrado nunca la información que buscaba, por lo que no se refleja esta opción en los resultados de la gráfica 5. Los porcentajes en los parámetros “siempre” y “nunca” son semejantes, si bien destaca nuevamente un mayor índice da satisfacción en los diccionarios online: 100%

75%

56,1% 50%

53,2% 40,9%

43,3%

25%

0,6%

0%

Siempre

A veces Diccionarios online

5,8%

NS/NC

Diccionarios impresos

Gráfica 5: Respuesta a la pregunta de si el usuario encuentra la información consultada.

El porcentaje del parámetro “a veces” y, por tanto, el grado de insatisfacción en el manejo del diccionario online puede deberse a diferentes factores que abordaremos a continuación en relación con los datos resultantes sobre las causas de uso de los

Hábitos de uso de los diccionarios entre los universitarios europeos

179

diccionarios en red. Si recordamos que el parámetro “búsqueda rápida y cómoda de la información” se perfilaba con un 97% como el principal motivo para el uso de los diccionarios en internet, podemos entender que, en especial, todos aquellos aspectos que entorpezcan la rapidez y comodidad de la búsqueda se consideren insatisfactorios, por ejemplo, la excesiva publicidad (39,7%), los enlaces rotos (28%) y los errores de código (23,9%). La insatisfacción originada por las dificultades a la hora de encontrar información en una entrada concreta (30,4%), el exceso de la misma (25,1%) o la falta de información (29%) son problemas de otro cariz, que remiten al diseño y a la microestructura del diccionario. Sin embargo, a estos aspectos los estudiantes no les prestan gran atención a la hora de citar las causas de uso de los diccionarios de internet, tal y como se observa, por ejemplo, a través del parámetro “fiabilidad de los contenidos” (18,7%). Otro de los factores que puede explicar la insatisfacción debida al exceso o al defecto de la información aportada y su difícil comprensión ha de ser observado también atendiendo al hecho de que, por norma general, existe un gran desconocimiento sobre tipología diccionarística (Domínguez / Mirazo / Vidal 2013), lo cual hace que en numerosas ocasiones el usuario maneje una obra de consulta poco adecuada para el tipo de búsqueda realizada. Asimismo, existe cierta confusión entre la información encontrada y el tipo de diccionario, esto es, un razonamiento tal como “si encuentro esta información en este diccionario, entonces este es un diccionario de tipo X” no es extraño. Esta observación se constata también al observar las respuestas reflejadas en la columna de la izquierda de la tabla 1: aquí se les pedía a los encuestados que citaran los diccionarios online que más usaban a la hora de buscar un significado o una traducción de una palabra. Así, al lado de diccionarios en línea de corte más o menos tradicional, los estudiantes mencionan diferentes servicios gratuitos de traducción, en particular el ofrecido por Google:25 

Formato web

Menciones

Formato app

Menciones

DRAE

99

Google Translate

51

Wordreference.com

92

DRAE

37

Google Translate

69

Wordreference

18

DRAG

49

DRAG

7

Traductor automático. El Mundo (Reverso)

18

Larousse

5

Larousse

11

Traductor automático. Xunta de Galicia

10

–––––––— 25

En varias ocasiones también se nombra el servicio gratuito de traducción automática de la Xunta de Galicia, lo cual revela la importancia de la traducción entre el gallego y castellano, que, junto con el inglés, son las lenguas sobre las que se realizan más consultas.

180

María José Domínguez Vázquez / Carlos Valcárcel Riveiro

Wikipedia

8

Bab.la

5

Traductor automático. El País (Bing)

5

Tabla 1. Herramientas lexicográficas en línea más mencionadas en 5 o más ocasiones.

Los resultados obtenidos en el estudio piloto sugieren, por tanto, la pertinencia de haber incluido como opciones de nuestro cuestionario las aplicaciones para dispositivos móviles junto con herramientas en formato web. Hoy en día, para las búsquedas lexicográficas en Internet los estudiantes usan una gran diversidad de recursos: diccionarios online en formato app o web, diccionarios colaborativos como Wordreference y portales lexico-traductológicos26 como Bab.la (Kellogg 1999-2013, Bab.la GmbH 2007-2013). Además, para los dos formatos de herramientas (web y app) las tres herramientas más mencionadas son las mismas: el diccionario de la Real Academia Española, el portal Wordreference y el servicio de traducción automática de Google, que es, además, la herramienta en formato app más mencionada. Sin embargo, los resultados también revelan que los encuestados todavía emplean más el ordenador y, por tanto, las herramientas en formato web que las aplicaciones disponibles para teléfonos móviles y tabletas. A la luz de los resultados recabados en el sondeo, queda claro que: a) los servicios gratuitos de traducción automática, y muy especialmente el de Google, son utilizados por los estudiantes al lado de los diccionarios para buscar la traducción de una palabra; b) los diccionarios bilingües, mucho menos mencionados en los resultados, encuentran un fuerte competidor en la traducción automática gratuita, c) el criterio de autoridad que siguen los estudiantes sondeados se reparte entre las academias de la lengua y los hablantes o usuarios. Así, dentro de los diccionarios utilizados en ambos formatos, destaca la preferencia por los realizados por las academias de la lengua, tanto castellana como gallega, y por los portales lexicográficos (Wordreference) con foros donde los usuarios comparten y resuelven dudas. Estas dos tendencias “gruesas” identificadas en c) (recurso a la traducción automática y a la ayuda de otros usuarios), y que se observan tanto en los datos aportados en la Tabla 1 como en el gráfico 6, reflejan los recursos empleados por los estudiantes sondeados cuando no encuentran en los diccionarios la información que necesitan. Como se puede ver, el uso del traductor de Google y trasladar la duda a otros usuarios son las estrategias más frecuentes. Sin embargo, entre los usuarios, se prefiere recurrir a los más conocidos y presencialmente accesibles. Así, y por este orden, los estudiantes sondeados prefieren preguntar antes a un compañero o a un profesor que a un hablante nativo o a buscar ayuda en las redes sociales o los foros:

–––––––— 26

Con este término nos referimos a los diccionarios online que ofrecen ejemplos extraídos de corpus traductológicos. No encontramos esta tipología diccionarística en los trabajos consultados (vid. n. 14).

Hábitos de uso de los diccionarios entre los universitarios europeos

181

Gráfica 6: Recursos cuando la consulta no resulta satisfactoria

Nuestra hipótesis de que los diccionarios que permiten la interacción entre los usuarios y de estos con el contenido serían los más consultados por los estudiantes nos llevó a incluir en el cuestionario UsoDEU un bloque de preguntas centradas en el uso de foros como nueva herramienta de comunicación y consulta electrónica. En esta línea, Storrer (2010: 3) señala como una ventaja de los diccionarios en Internet (vid. 2.3) el hecho de que el usuario se pueda implicar en la redacción, corrección, etc. de los recursos lexicográficos. Sin embargo, el bajo uso que los estudiantes sondeados hacen de los foros para solventar dudas de tipo lexicográfico no avala esta hipótesis inicial. Así, y aunque el portal Wordreference, que se caracteriza precisamente por ofrecer foros para usuarios, es uno de los recursos más mencionados por los estudiantes sondeados, casi la mitad (48%) señala que nunca lee los foros de los diccionarios y, de entre los que lo hacen (52%), la gran mayoría se limita a leer los comentarios con diferentes finalidades. Así, un 94,2 % afirma no participar activamente en estos foros. Solo algo menos del 6% de los estudiantes sondeados decide integrarse en una comunidad virtual para compartir o solucionar dudas lexicográficas. Revisando la bibliografía sobre la participación en comunidades virtuales para encontrar una explicación, vemos que los datos obtenidos en nuestro estudio piloto responden, en realidad, a la tendencia habitual. Así, según lo que se da en llamar la “Regla del 1%”, solo una pequeña minoría de los miembros de una comunidad virtual, alrededor del 1%, son los que generan la mayor parte de los contenidos, mientras que un 9% solo participa de vez en cuando. Frente a ellos, el 90% de las comunidades virtuales estarían constituidas por los llamados lurkers (literalmente, acechadores), usuarios que se limitan a observar la actividad de los miembros activos o intermitentes de la comunidad y a aprovecharse de los contenidos que generan (McConnell 2006; Nielsen 2006).



182

María José Domínguez Vázquez / Carlos Valcárcel Riveiro

4. Conclusiones Ya que el principal objetivo del estudio piloto realizado en Pontevedra consistía en testar la validez del cuestionario UsoDEU, para con ello, de ser el caso, llevar a cabo mejoras que nos permitan aplicarlo en futuras investigaciones, pasamos a resumir algunos aspectos sobre su diseño, aplicación y difusión. Cabe señalar en primer lugar que: a) no se han detectado problemas de accesibilidad al mismo como tampoco dificultades en el manejo o gestión estadística de los datos almacenados en el portal Unipark, y b) la difusión del mismo a través de redes sociales ha tenido buena acogida. Entre las mejoras que se deberían incorporar al cuestionario UsoDEU inicial, y en la línea de cuestionarios con objetivos similares (Al-Salami / Hattab 2008), señalamos la necesidad de perfilar algunas preguntas, para con ello conseguir un análisis más fiable de algunas de las cuestiones planteadas: un ejemplo sería la participación de los encuestados en los foros de los recursos lexicográficos. Así en nuestro cuestionario planteamos la pregunta de si los encuestados participan en los foros. El cuestionario nos permite aquí observar frecuencias de participación pero no el tipo de información consultada y/o aportada ni tampoco en calidad de qué se realiza la consulta o se participa en el foro. Los datos apuntan que nos encontramos ante usuarios periféricos, en términos de A. Jo Kim (2000), los cuales pueden estar registrados o no en la comunidad, algo por lo que no se pregunta en el cuestionario UsoDEU inicial. Dentro de una comunidad virtual, el registro distingue, precisamente, a un visitante de un miembro, independientemente de que este siga siendo o no un observador-lector. Evidentemente, el hecho de registrarse y crear un perfil constituye, dentro del ciclo de vida de la participación en una comunidad virtual, un aspecto fundamental sin el cual no puede haber participación en la misma. Por los datos obtenidos en nuestro estudio piloto, no podemos precisar qué estatus tienen los estudiantes que afirman leer, interactuar con usuarios o generar contenidos en comunidades lexicográficas virtuales como la profusamente mencionada Wordreference. Se impone, por tanto, una mejora de nuestro cuestionario inicial para precisar el rol de los usuarios en las herramientas lexicográficas 2.0. Para ello será preciso tener en cuenta las taxonomías de usuarios de comunidades virtuales, como, por ejemplo, la propuesta por Li / Bernoff (2008). También observamos la necesidad de incluir en nuestro cuestionario algunas preguntas nuevas referentes a la adquisición y empleo de los diccionarios impresos. Aunque parece que estos están pasando a ser una herramienta de consulta secundaria, sigue siendo necesario saber si los estudiantes continúan comprándolos, qué tipos les parecen más útiles o atractivos y cómo complementan su uso con las herramientas online. A este respecto, y dada la crisis que parece atravesar el concepto de autoridad lexicográfica en el contexto actual, resultaría especialmente interesante saber si los estudiantes recurren a los diccionarios impresos cuando los resultados de sus búsquedas online no son satisfactorios. Asimismo, con la finalidad de detectar diferencias en cuestiones de uso externo del diccionario atendiendo a los diferentes formatos, sería interesante plantear, por ejemplo, si los encuestados poseen diccionarios CD-ROM o impresos y cuál es su lugar habitual de consulta. En

Hábitos de uso de los diccionarios entre los universitarios europeos

183

cuanto a los recursos electrónicos parece pertinente consultar sobre el tipo de conexión más usado, por ejemplo un 3G o Wi-Fi, ya que esta cuestión está en relación directa con el lugar de conexión: este será no solo el espacio de trabajo habitual, sino aquel en donde la conexión sea más rápida, tal y como confirma, además, el hecho de que entre los principales motivos de uso del recurso lexicográfico electrónico se encuentran la búsqueda rápida y cómoda (97,1%) y el fácil acceso (76,6%). A pesar del carácter exploratorio de este estudio, los datos obtenidos revelan cambios profundos en los hábitos de uso de los diccionarios por parte de los estudiantes universitarios, uno de los principales segmentos de mercado de la industria lexicográfica. Sin duda, la generalización del uso de internet y de dispositivos portátiles de acceso a esta red, cada vez más potentes e interconectados, constituye el desencadenante de estas transformaciones. Si bien los datos del sondeo llevado a cabo en el campus de Pontevedra no pueden ser considerados como definitivos, la puesta a prueba del cuestionario inicial UsoDEU nos ha permitido identificar una serie de tendencias de calado que representan no solo amenazas, sino también oportunidades para el mercado lexicográfico. En nuestra opinión, estas tendencias, aunque deberán ser confirmadas en posteriores estudios empíricos basados en un cuestionario mejorado, esbozan para la lexicografía y sus especialistas un nuevo panorama en el que, más allá de las innovaciones tecnológicas, los usuarios y las comunidades virtuales cobran cada vez mayor importancia. La primera observación destacable se relaciona con el hecho que las herramientas de consulta online son ya más usadas por los estudiantes universitarios que los diccionarios impresos, al menos en lo que se refiere al grupo encuestado.27 Por otro lado, se constata aquí que los diccionarios electrónicos en formato CD-ROM se han quedado claramente obsoletos como producto de mercado. En lo referente al medio de acceso a los diccionarios online, el ordenador portátil constituye todavía el principal dispositivo utilizado, lo que redunda en una mayor utilización de las herramientas lexicográficas en formato web. Sin embargo, el teléfono móvil es ya un dispositivo de acceso utilizado por la mayoría. Si a esto se le añade la constante mejora de la conexión a la red desde teléfonos y tablets más allá de los servicios wi-fi, se podría prever para un futuro cercano, y al igual que en otros ámbitos (Meeker / Wu 2013), una mayor expansión del uso de herramientas lexicográficas en formato app. Esta previsión se ve apoyada, además, por el hecho de que los tres diccionarios web más mencionados en nuestro estudio disponen ya de aplicaciones para móviles y de que estas son también las aplicaciones más mencionadas. Se observa, además, una diferencia en las preferencias de uso de herramientas online en función del tipo de búsqueda. Por un lado, en las búsquedas sobre las lenguas cooficiales, inicial o segunda, los estudiantes sondeados prefieren claramente los diccionarios online de las academias de la lengua a otros recursos. En este caso, parece que los usuarios siguen un criterio de autoridad claro. Sin embargo, cuando –––––––— 27

En el estudio de Al-Salami / Hattab (2008) realizado en Irak, se observaba ya un uso incipiente de este tipo de herramientas.

184

María José Domínguez Vázquez / Carlos Valcárcel Riveiro

se trata de búsquedas de tipo bilingüe, los estudiantes muestran una preferencia clara por los servicios de traducción automática, muy particularmente por el traductor de Google, o por herramientas lexicográficas que incorporan foros colaborativos, fundamentalmente Wordreference. Si la fiabilidad de los resultados de la traducción automática todavía dista de ser aceptable, la de los diccionarios colaborativos online no es menos cuestionada, especialmente por los lexicógrafos (Green 2012; Rundell 2012). Como vemos en los resultados de nuestro estudio, esto no parece preocupar demasiado a los estudiantes, para los que, precisamente, la fiabilidad de los contenidos no es un criterio relevante a la hora de escoger las herramientas online para realizar sus consultas de tipo lexicográfico. Como advertíamos en la introducción, en el contexto de rápido cambio que dibujan estos resultados, el protagonismo que cobran los usuarios de los diccionarios implica la apertura de nuevos centros de interés en lexicografía. Además de tenerlos cada vez más en cuenta en el diseño de nuevas herramientas que respondan a sus necesidades actuales, consideramos también necesario comprender la emergencia de las comunidades virtuales creadas por y/o para ellos. Para esto, podrían ser de gran ayuda las investigaciones ya desarrolladas sobre esta cuestión en diferentes disciplinas como la sociología, la psicología social o incluso la etnografía (Cora et al. 2009). Por otro lado, la profusión de herramientas y recursos online que se está produciendo sitúan cuestiones como las habilidades digitales y la toma de decisiones de los usuarios durante el proceso de búsqueda lexicográfica en la agenda de la lexicografía. Así, los datos de nuestro estudio, en especial la tendencia a usar la traducción automática en las búsquedas bilingües, señalan una vez más la importancia de saber escoger y usar la herramienta digital adecuada para cada determinado tipo de búsqueda. En relación con todo esto, cabe recordar que los datos recogidos parecen apuntar, además, a una reformulación del concepto de autoridad lexicográfica entre los estudiantes, que en la web 2.0 podría aparecer cada vez más asociado al de reputación digital (Del Fresno 2011). Todo ello sugiere una última reflexión de ámbito didáctico. El hecho de que los estudiantes adquieran competencias digitales sólidas relacionadas con la selección de herramientas lexicográficas adecuadas y contenidos fiables o relevantes se convierte cada vez más en una necesidad, ya no solo para un mercado lexicográfico en vías de reconversión, sino para garantizar el desarrollo y la gestión eficaces del repertorio lingüístico de los llamados nativos digitales. Como hemos indicado ya en varias ocasiones, los datos de nuestro estudio esbozan una utilización inadecuada o ineficaz, cuando no el desconocimiento en diferentes aspectos y a diferentes niveles, de las herramientas lexicográficas online. Ante esto, resulta imprescindible introducir un cambio decidido en la formación de los estudiantes en ciclos educativos más tempranos encaminados a garantizar la adquisición de habilidades cognitivas superiores mediante las herramientas digitales. De lo contrario, y asumiendo la metáfora de Dolors Reig (2010)28, más que de nativos digitales, convendría hablar más bien de náufragos digitales. –––––––— 28

Refiriéndose a los nativos digitales, Reig (2010) afirma que el cambio que proponemos no

Hábitos de uso de los diccionarios entre los universitarios europeos

185

Referencias bibliográficas Al-Salami, Nadhum Raheem / Hattab, Hudaa Abid Ali (2008): «The Dictionary Use at the University of Kufa: A Case Study», Adab Al-Kufa, 1, 3, 29-71. Bab.la GmbH (2007-2013): Bab.la. Disponible en [Consulta: 29/06/ 2013]. Bergenholtz, Henning / Johnsen, Mia (2005): «Log Files as a Tool for Improving Internet Dictionaries», Hermes. Journal of Language and Communication Studies, 34, 117–141. Chen, Yuzhen (2011): «Studies on bilingualized dictionaries: the user perspective», International Journal of Lexicography, 24, 161-197. Cora, Angela / Standlee, Alecea / Bechkoff, Jennifer / Cui, Yan (2009): «Ethnographic Approaches to the Internet and Computer-Mediated Communication», Journal of Contemporary Ethnography, 38, 1, 52-94. Cuq, Jean-Pierre / Davin-Chnane, Fatima (2007): «Français langue seconde: un concept victime de son succès?», en Michèle Verdelhan-Bourgade, dir., Le français langue seconde: un concept et des pratiques en évolution. Bruselas: De Boeck, 11-28. Del Fresno, Miguel (2011): «Cómo investigar la Reputación Online en los medios sociales de la web 2.0», Cuadernos de comunicación Evoca, 5, 29-34. De Schryver, Gilles-Maurice / Prinsloo, Danie J. (2000): «Dictionary-Making Process with ‘Simultaneous Feedback’ from the target Users to the Compilers», en Ulrich Heid et al., eds., Proceedings of the Ninth EURALEX International Congress, EURALEX 2000, Stuttgart, Germany, August 8th-12th, 2000. Stuttgart: Institut für Maschinelle Sprachverarbeitung, Universität Stuttgart, 197-209. — (2011): «Do Dictionaries Define on the Level of Their Target Users? A Case Study for Three Dutch Dictionaries», International Jounal of Lexicography, 24/1, 5-28. DomínguezVázquez, María José (2013): «Die Rolle der syntagmatischen Information bei der Übersetzung: Ein Gesamtüberblick sowie eine Auseinandersetzung mit online Wörterbüchern und Valenzwörterbüchern», Lexicographica. International Annual of Lexicography, 29, 43-68. Domínguez Vázquez, Mª José / Mirazo Balsa, Mónica / Vidal Pérez, Vanessa (2013): «Wörterbuchbenutzung: Erwartungen und Bedürfnisse. Ergebnisse einer Umfrage bei Deutsch lernenden Hispanophonen», en Mª José Domínguez Vázquez, ed., Trends in der deutsch-spanischen Lexikographie. Frankfurt: Peter Lang, 135-172. East, Martin (2008): Dictionary Use in Foreign Language Writing Exams. Impact and implications. Amsterdam / Philadelphia: John Benjamins. Ekwa Ebanéga, Guy-Modeste / Tomba Moussavou, Fatima (2008): «Survey of Dictionary Use: Case Studies of Gabonese Students at the University of Stellenbosch and the Cape Peninsula University of Technology», Lexikos, 18, 349-365. Engelberg, Stefan / Lemnitzer, Lothar (2009): Lexikographie und Wörterbuchbenutzung. Tübingen: Stauffenburg. Eurostat (2012): Community survey on ICT usage in households and by individuals 2012 Eurostat Model Questionnaire (version 3.2). Disponible en [Consulta: 13/06/2013]. González, Manuel, dir., (2007): Mapa Sociolingüístico de Galicia 2004. Volume I. Lingua inicial e competencia lingüística en Galicia. A Coruña: Real Academia.

–––––––— va a suceder de forma espontánea si dejamos que naveguen solos, que naufraguen [...], no de la forma rápida y permanente que muchos/as deseamos.

186

María José Domínguez Vázquez / Carlos Valcárcel Riveiro

Green, Jonathon (2012): «Dictionaries are not democratic», en The Guardian. Books Blog. Disponible en [Consulta: 13/06/2013]. Gouws, Rufus H. / Prinsloo, Danie J. (2005): Principles and Practice of South African Lexicography. Stellenbosch: Sun Press. Hartmann, Reinhard R. K. (1989): «Sociology of The Dictionary User: Hypotheses and Empirical Studies», en Franz Joseph Hausmann et al., eds., Wörterbücher: ein Internationales Handbuch zur Lexikographie, vol. 1. Berlin/New York: de Gruyter, 649-657. — (1999): «Case Study: The Exeter University Survey of Dictionary Use [Thematic Report 2]», en Reinhard R. K. Hartmann, ed., Dictionaries in Language Learning. Recommendations, National Reports and Thematic Reports from the TNP Sub-Project 9: Dictionaries. Berlin, Thematic Network Project in the Area of Languages, 36-52. Disponible en [Consulta: 09/03/2013]. — (2000): «European Dictionary Culture. The Exeter Case Study of Dictionary Use among University Students, against the Wider Context of the Reports and Recommendations of the Thematic Network Project in the Area of Languages (1996-1999)», en Ulrich Heid et al., eds., Proceedings of the Ninth EURALEX International Congress, EURALEX 2000. Stuttgart: Institut für maschinelle Sprachverarbeitung, Universität Stuttgart, 385-391. — (2001): Teaching and Researching Lexicography. London: Pearson Longman. Haß, Ulrike ed. (2005): Grundfragen der elektronischen Lexikographie. elexiko – das OnlineInformationssystem zum deutschen Wortschatz. Berlin: de Gruyter. Haß, Ulrike / Schmitz, Ulrich (2010): «Lexikographie im Internet 2010 – Einleitung», Lexicographica, 26, 1-18. Heid, Ulrich / Zimmermann, Jan Timo (2012): «Usability testing as a tool for e-dictionary design: collocations as a case in point», en Julie Matilde Torjusen / Ruth Vatvedt Fjeld, eds., Proceedings of the 15th EURALEX International Congress 2012. Oslo: Department of Linguistics and Scandinavian Studies, University of Oslo, 661-671. Hulstijn, Jan H. / Atkins, Beryl T. Sue (1998): «Empirical research on dictionary use in foreignlanguage learning: survey and discussion», en Beryl T. Sue Atkins, ed., Using Dictionaries. Tübingen: Max Niemeyer Verlag, 7–19. IGE [Instituto Galego de Estatística] (2013): «Fogares que dispoñen de ordenador e conexión a internet segundo haxa ou non estudantes no fogar», en Enquisa de condicións de vida das familias. Disponible en [Consulta: 29/06/2013]. INE [Instituto Nacional de Estadística] (2012): Encuesta sobre Equipamiento y Uso de Tecnologías de Información y Comunicación en los Hogares (TIC-H). 2012. Cuestionario. Disponible en [Consulta: 13/06/2013]. Jo Kim, Amy (2000): Community Building on the Web: Secret Strategies for Successful Online Communities. Berkeley: Peachpit Press. Kellogg, Michael (1999-2013): Wordreference.com. Disponible en [Consulta: 29/06/2013]. Kemmer, Katharina (2010): «Onlinewörterbücher in der Wörterbuchkritik. Ein Evaluationsraster mit 39 Beurteilungskriterien», OPAL, 2/2010. Mannheim: IDS. Disponible en . Klosa, Annette (ed.) (2008): Lexikographische Portale im Internet, OPAL-Sonderheft 1/2008. Mannheim: IDS. Disponible en [Consulta: 09/05/2011]. Kromann, Hans-Peder (1995): «Deutsche Wörterbücher aus der Perspektive eines fremdsprachigen Benutzers», en Heidrun Popp, ed., Deutsch als Fremdsprache. An den

Hábitos de uso de los diccionarios entre los universitarios europeos

187

Quellen eines Faches. Festschrift für Gerhard Helbig zum 65. Geburtstag. München: Iudicium, 501-512. Kühn, Peter (1989): «Typologie der Wörterbücher nach Benutzungsmöglichkeiten», en Franz Joseph Hausmann, ed., Wörterbücher: ein Internationales Handbuch zur Lexikographie, Bd. 1. Berlin/New York: de Gruyter, 111-127. LEO GmbH (2006-2013): LEO. Ein Online-Service der LEO GmbH. Disponible en [Consulta: 29/06/2013]. Li, Charlene / Bernoff, Josh (2008): Groundswell: Winning in a World Transformed by Social Technologies. New York: Harvard Business School Press. Mackintosh, Kristen (1998): «An empirical study of dictionary use in L2-L1 translation», en Beryl T. Sue Atkins, ed., Using Dictionaries. Tübingen: Niemeyer, 123-149. Mann, Michael (2010): «Internet-Wörterbücher am Ende der “Nullerjahre”: Der Stand der Dinge. Eine vergleichende Untersuchung beliebter Angebote hinsichtlich formaler Kriterien unter besonderer Berücksichtigung der Fachlexikographie», Lexicographica, 26, 19-45. Maridé, Jasmina / Pihler, Barbara (2005): «El uso de los diccionarios bilingües en la enseñanza del español como segunda lengua», en María Auxiliadora Castillo Carballo, coord.: Las gramáticas y los diccionarios en la enseñanza del español como segunda lengua, deseo y realidad. Actas del XV Congreso Internacional de ASELE. Sevilla: Universidad de Sevilla, 548-554. MECD [Ministerio de Educación, Cultura y Deporte] (2002): Marco Común Europeo de Referencia para las Lenguas: Aprendizaje, enseñanza, evaluación. Madrid: Anaya. McConnell, Ben (2006): «The 1% Rule: Charting citizen Participation», en Church of the Customer Blog, Disponible en [Consulta: 29/06/2013]. Meeker, Mary / Wu, Liang (2013): KPCB Internet Trends 2013. Disponible en [Consulta: 29/06/ 2013]. Meyer, Christian M. / Gurevych, Iryna (2012): «Wiktionary: A new rival for expert-built lexicons? Exploring the possibilities of collaborative lexicography», en Sylviane Granger / Magali Paquot, eds., Electronic Lexicography. Oxford: Oxford University Press, 259-291. Muráth, Judith (2005): «Wörterbuchbenutzung von Fachübersetzerstudenten Ihre Erwartungen an ein Fachwörterbuch», Lexicographica, 115, 401-415. Müller-Spitzer, Carolin / Klopenig, Alexander / Töpel, Antie (2012): «Online dictionary use: Key findings from an empirical research project», en Silviane Granger / Magali Paquot, eds., Electronic Lexicography. Oxford: Oxford University Press, 425-57. Müller-Spitzer, Carolin / Klopenig, Alexander (2014): «Requisitos y expectativas de un buen diccionario online. Resultados de estudios empíricos en la investigación sobre el uso de diccionarios con especial atención a los traductores», en María José Domínguez Vázquez / Xavier Gómez Guinovart / Carlos Valcárcel Riveiro, eds., Lexicografía de las lenguas románicas. II. Aproximaciones a la lexicografía moderna y contrastiva. Berlin: de Gruyter, 297-319. Nielsen, Jakob (2006): «Participation Inequality: Encouraging More Users to Contribute», en Nielsen Norman Group. Disponible en [Consulta: 29/06/2013]. Nyangone Assam, B. (2006): «The User Perspective in a Learners’ Dictionary», Afrilex 2006. Pöll, Bernhard (2010): «Internetlexikographie der iberomanischen Sprachen», Lexicographica, 26, 169-173. Pons GmbH (2001-2013): Pons.eu The Online Dictionary. Disponible en [Consulta: 29/06/2013].

188

María José Domínguez Vázquez / Carlos Valcárcel Riveiro

Reig, Dolors (2010): «¿Nativos o náufragos digitales? Actitudes y competencias», El caparazón. Disponible en [Consulta: 29/06/2013]. Retti, Gregor (2004): «“Österreichisches Deutsch” und “Österreichisches Wörterbuch», Disponible en: y . Ripfel, Martha (1989a): Wörterbuchkritik eine empirische Analyse von Wörterbuchrezensionen. Tübingen: Niemeyer. — (1989b): «Ergebnisse einer Befragung zur Benutzung ein- und zweisprachiger Wörterbücher», Lexicographica, 5, 178-201. — (1990): «Wörterbuchbenutzung bei Muttersprachlern. Untersuchungs-bericht über eine Befragung erwachsener muttersprachlicher Sprecher zur Wörterbuchbenutzung», Lexicographica, 6, 237-251. Ripfel, Martha / Wiegand, Herbert Ernst (1988): «Empirische Wörterbuchbenutzungsforschung», Studien zur neuhochdeutschen Lexikographie, VI. 2 vols., 491-520. Rossenbeck, Klaus (2005): «Die zweisprachige Fachlexikographie in der neueren und neuesten Wörterbuchforschung», Lexicographica, 21, 179-201. Rundell, Michael (2012): «The wisdom of crowds: can it work for dictionaries? », en Macmillan Dictionary Blog. Disponible en [Consulta: 29/06/2013]. Salvador, Gregorio (1984): «Semántica estructural y enseñanza del vocabulario», en Semántica y lexicología del español. Madrid: Paraninfo, 67-72. Sánchez García, F. Javier: «Análisis y valoración del uso de diferentes diccionarios». Disponible en [Consulta: 19/03/2011]. Sánchez Iglesias, Jorge J. (2009): «La traducción en la enseñanza de lenguas extranjeras: una aproximación polémica», en RedELE. Biblioteca Virtual 10. Disponible en [Consulta: 2/03/ 2011]. Biblioteca/2009_BV_10/2009_BV_10_22Sanchez_Iglesias.pdf> [Consulta: 29/ 06/2013]. Sánchez Ramos, M. del Mar (2005): «Research on Dictionary Use by Trainee Translators», Translation Journal, 9, 2. Disponible en [Consulta: 19/03/ 2011]. Scharnhorst, Jürgen (ed.) (2004): Sprachkultur und Lexikographie. Von der Forschung zur Nutzung von Wörterbüchern. Frankfurt: Lang. Storrer, Angelika (2010): «Deutsche Internet-Wörterbücher: Ein Überblick», en Rufus H. Gouws et al., eds., Lexicographica. Internationales Jahrbuch für Lexikographie, 26, 154-164. Swanepoel, Piet H. (2001): «Dictionary quality and dictionary design: a methodology for improving the functional quality of dictionaries», Lexikos, 11, 160-190. Taljard, Elsabe / Prinsloo, Danie J. / Fricke, Irene (2011): «The use of LSP dictionaries in secondary schools? a South African case study», South African Journal of African Languages, 31, 1, 87-109. Tarp, Sven (2008): Lexicography in the Borderland between Knowledge and Non-Knowledge. General Lexicographical Theory with Particular Focus on Learner’s Lexicography. Tübingen: Max Niemeyer. — (2009): «Reflections on Lexicographical User Research», Lexikos, 19, 275-296. Tono, Yukio (2000): «On the effects of different types of electronic dictionary interfaces on L2 learners’ reference behaviour in productive/receptive tasks», en Ulrich Heid et al., eds., IX EURALEX International Conference. Stuttgart: Institut für maschinelle Sprachbearbeitung, 855-861.

Hábitos de uso de los diccionarios entre los universitarios europeos

189

— (2011): «Application of Eye-Tracking in EFL Learners. Dictionary Look-up Process Research»,International Journal of Lexicography, 24, 124-153. Tu, Tungmen (2001): «Algunas consideraciones sobre el diccionario bilingüe español-chino en el aprendizaje de E/LE», Cuadernos Cervantes, 32, 7, 42-48. Disponible en [Consulta: 02/03/2011]. Valcárcel, Carlos / Pino, Laura / Froján, Francisco (2012): “La gestión des répertoires linguistiques: langue initiale, seconde et étrangère en Galice», en José Carlos Herreras, ed., L’Europe des 27 et ses langues. Valenciennes: Presses Universitaires de Valenciennes, 295310. Wang, Weiwe (2001): Zweisprachige Fachlexikographie. Benutzungsforschung, Typologie und mikrostrukturelle Konzeption. Frankfurt: Lang. Welker, Herbert Andreas (2006): O Uso de Dicionários. Panorama geral das pesquisas empíricas. Brasilia: Thesaurus. — (2010): Dictionary Use. A General Survey of Empirical Studies. Brasilia: Author’s Edition. Wiegand, Herbert Ernst (1977): «Nachdenken über Wörterbücher. Aktuelle Probleme», en Günther Drosdowski et al., eds., Nachdenken über Wörterbücher. Mannheim/ Wien/Zürich: Bibliographisches Institut, 51-102. — (1987): «Zur handlungstheoretischen Grundlegung der Wörterbuchbenutzungs-forschung», Lexicographica, 3, 178-227. — (1995): «Lexikographische Texte in einsprachigen Lernerwörterbuchern. Kritische Überlegungen anlässlich des Erscheinens von Langenscheidts Grösswörterbuch Deutsch als Fremdsprache», en Heidrun Popp, ed., Deutsch als Fremdsprache. An der Quellen eines Faches. Festschrift für Gerhard Helbig zum 65. Geburtstag. München: Iudicium, 463-499. — (1998): Wörterbuchforschung: Untersuchungen zur Wörterbuchbenutzung, zur Theorie, Geschichte, Kritik und Automatisierung der Lexikographie. Berlin/New York: de Gruyter. — (2008): «Wörterbuchbenutzung bei der Übersetzung. Möglichkeiten ihrer Erforschung», Germanistische Linguistik, 195-96, 1-43. — (2010): «Zur Methodologie der Systematischen Wörterbuchforschung: Ausgewählte Untersuchungs- und Darstellungsmethoden für die Wörterbuchform», Lexicographica, 26, 249-330. Wiegand, Herbert Ernst et al. (ed.) (2010): Wörterbuch zur Lexikographie und Wörterbuchforschung. Berlin/New York: de Gruyter.

 La información fónica en la lexicografía gallega moderna Xosé A. Fernández Salgado Universidade de Vigo / Grupo TALG / Red de Lexicografía RELEX

Phonetic information in modern Galician lexicography Abstract This paper analyzes the phonetic information available in the entries of thirteen Galician dictionaries published between 1986 and 2010. The need for indications of pronunciation is discussed within the context of language normalization. We proceed to an examination of the dictionaries in three sections: works with occasional phonetic notations, works with phonetic transcriptions of all lemmata, and dictionaries of usage and others. Keywords Lexicography, standard pronunciation, Galician.

1. Introducción La presencia de una transcripción fónica de un modo constante en las entradas de los diccionarios gallegos es un hecho reciente en la lexicografía gallega.1 La primera obra en hacerlo fue el bilingüe Diccionario esencial galego-castelán, castellano-gallego (VOX) (1997). Ello no quiere decir que no interesase esa información, sino que más bien la vertiente oral de la lengua y con ella las indicaciones de pronunciación quedaron en un segundo plano frente al interés inicial por querer ofrecer formas fijas escritas. Bien es cierto que la estrecha relación entre el sistema gráfico y fonémico del gallego permite una relativa fácil interpretación fónica. Solo una vez consolidada o encauzada la codificación gráfica, morfológica y léxica se empezó a –––––––— 1



Este trabajo fue financiado por el Ministerio de Economía y Competitividad, dentro del proyecto Adquisición de escenarios de conocimiento a través de la lectura de textos: Desarrollo y aplicación de recursos para el procesamiento lingüístico del gallego (SKATeRUVIGO) (ref. TIN2012-38584-C06-04); y por la Consellería de Cultura, Educación e Ordenación Universitaria de la Xunta de Galicia, gracias a la convocatoria de Ayudas para la consolidación y estructuración de unidades de investigación competitivas del Sistema Universitario de Galicia, dentro de la Rede de Lexicografía (Relex) (ref. CN 2012/290) y de la Rede de Tecnoloxías e análise dos datos lingüísticos (ref. CN 2012/179).

192

Xosé A. Fernández Salgado

prestar atención a la fónica, cuyo resultado más reciente es el Dicionario de pronuncia da lingua galega (DPLG) (2010). Con todo, en obras lexicográficas de distintos tiempos, aunque de una manera no sistemática, podemos encontrar pequeñas dosis de información fónica sobre algunos aspectos dudosos o conflictivos de la ortofonía gallega, como pueden ser por ejemplo la abertura de las vocales medias tónicas , la doble interpretación fónica de grafías como o la pronunciación de las palabras nuevas incorporadas a la lengua. Este trabajo se centra en analizar la información fónica que aparece en trece diccionarios gallegos actuales (1986-2010), etapa que podemos caracterizar como de “lexicografía normativa” o “lexicografía moderna” y de la que se puede ver una caracterización en profundidad en González Seoane (2002). Coinciden los inicios de los diccionarios normativos con el momento en que el gallego adquiere carta de lengua cooficial en el estatuto de Galicia y pasa a ser de enseñanza obligatoria en el currículum escolar y lengua propia de la Administración autonómica y municipal, y de los medios de comunicación dependientes de ellos. Surge, pues, en esos momentos la necesidad de proporcionar a los usuarios del idioma un tipo de material lingüístico (diccionarios, gramáticas, manuales…) que recoja y explique un modelo de lengua conocido como “gallego normativo”, en el que muchos de sus usuarios no se sienten seguros, bien porque existen diferencias con la variedad que ellos emplean, el “gallego popular”; bien porque son hablantes habituales de castellano, que es la otra lengua con la que convive el gallego en Galicia, convivencia que tiene su manifestación más evidente en las interferencias lingüísticas de aquella en esta. La demanda concreta de información fónica sobre el gallego y de definición de un modelo fónico “normativo” se hizo evidente en las dos últimas décadas en ámbitos del discurso público como el de los medios de comunicación en gallego: por ejemplo, un doblador de filmes necesita saber si en tal palabra la vocal tónica es abierta o cerrada, y un periodista deportivo puede tener dudas sobre si hóckey ha de pronunciarlo a la inglesa o adaptarlo a la estructura fónica del gallego. Algunos trabajos de Regueira (2000, 2005, 2010) han ayudado a definir los límites y a situar los problemas. Los diccionarios gallegos actuales se han hecho eco de esa demanda y en mayor o menor medida las indicaciones fónicas han ido incrementándose de unos a otros, pues es práctica habitual en la lexicografía (no solo gallega) que un nuevo diccionario pueda basarse total o parcialmente en informaciones de otros anteriores. Por citar un ejemplo, el equipo del DPLG (2010) reconoce en la página de créditos que su proyecto se inició a partir de la revisión de las 20.000 entradas del diccionario bilingüe VOX (1997). En lo que sigue, pretendemos contribuir a la historia de la lexicografía gallega contemporánea analizando aquellas obras lexicográficas actuales que contienen algún tipo de información fónica sobre los lemas de entrada. Previamente haremos

La información fónica en la lexicografía gallega moderna

193

algunas consideraciones del porqué, el cómo y el cuándo esta información se inserta en los diccionarios.2

2. La necesidad de información fónica en los diccionarios Con “información fónica” nos referimos, siguiendo a Ríos Mestre (1999), a las indicaciones que sobre la pronunciación de las voces de entrada pueden aparecer en un diccionario. Esta puede venir señalada por una transcripción de los lemas en caracteres fonéticos, por una representación semifonética a base de letras y acentos, por comentarios contenidos dentro del propio artículo lexicográfico o por una explicación previa de las relaciones entre el sistema ortográfico y el fonético de la lengua en cuestión, en cuanto a la equivalencia de grafía y fonema o al uso de tildes según ciertas reglas para indicar la sílaba tónica. Actualmente, lo habitual en la lexicografía gallega es utilizar en las notaciones fónicas el alfabeto AFI o IPA (siglas en inglés de la International Phonetic Association), de amplio acuerdo internacional; sin embargo, en algún diccionario de la década de los ochenta y principios de los noventa del siglo XX, como el XERAIS (1986), no es raro ver utilizados algunos símbolos del alfabeto de la RFE3. En cambio, en otras obras como el diccionario escolar OBRADOIRO1 (1995) se utiliza un sistema mixto de representación. Por su parte, el DÚBIDAS (1990) utiliza un modo de notación propio, muy próximo al ortográfico, cuyo significado se indica en las páginas introductorias; esta obra, además, tiene la particularidad de que las indicaciones fónicas no aparecen siguiendo al lema (lo más habitual), sino que se realizan dentro de la explicación de la duda. Finalmente, el DPLG (2010) en su consulta en línea permite conocer la pronunciación “real” en formato acústico. La información fónica no adquiere igual importancia en todos los tipos de diccionarios. Obtiene su protagonismo máximo en los diccionarios de pronunciación, cuyo fin primordial es el de ofrecer al usuario una pronunciación correcta o normativa de las palabras; y se puede decir que también en los diccionario –––––––— 2

3

No nos detendremos en comentar las características fonéticas y fonológicas del gallego, para las cuales pueden encontrarse descripciones detalladas en Freixeiro Mato (1998), Regueira (1998) o Álvarez / Xove (2002: 23-47). Para las variantes fónicas dialectales, como la metafonía nominal o la inflexión de la nasal sobre , remitimos a Álvarez Blanco (1988), Fernández Rei (1990) y al Atlas Lingüístico Galego (ALGA II y III). El alfabeto REF, muy empleado en los estudios de filología románica hispánicos, toma sus siglas de la Revista de Filología Española, donde fue propuesto en 1915 por T. Navarro Tomás y aceptado por el Centro de Estudios Históricos de Madrid para sus investigaciones, entre las que destaca por su importancia el Atlas de la Península Ibérica (ALPI). En la lingüística gallega se empleó en los trabajos dialectológicos de las décadas de los setenta y ochenta del siglo XX y en la Gramática galega (Galaxia, 1986); a partir de la década de los noventa, el alfabeto AFI pasa a ser ya de uso casi exclusivo.

194

Xosé A. Fernández Salgado

bilingües, dirigidos a aprendices de una lengua extranjera o de una segunda lengua en el caso de comunidades bilingües, como podrían ser los diccionarios gallegocastellano. Para un hablante nativo, las indicaciones de pronunciación en los diccionarios monolingües generales suponen una información más, lo mismo que la gramatical, la sinonímica u otras, que no obstante si se incluye hará de esa obra un diccionario más completo. De todas formas, si puede resultar provechosa esta inclusión en situaciones de lenguas en vías de normalización como el gallego, en las que sus hablantes todavía no tienen asumido totalmente un patrón fónico estándar. Por su parte, los llamados diccionarios de dudas y dificultades pueden incorporar también en algunas de sus entradas explicaciones puntuales, por ejemplo, sobre la adaptación fónica de un extranjerismo o la pertinencia o no de una pronunciación del registro popular. Verdaderamente, la necesidad de que figure información fónica en los diccionarios está en relación con las divergencias que puedan existir entre el sistema gráfico y el fonológico de las lenguas. Cuanto más se aparten, más necesidad habrá de insertar la pronunciación al lado de las entradas, como en francés o inglés. En cambio, en lenguas como el gallego en el que existe una mayor identificación entre grafía y fonema, la simple forma escrita hace transparente la pronunciación y la no necesidad de una transcripción, por lo menos no en todos los casos. De ahí que en algunos de nuestros diccionarios no se transcriba fónicamente todo el lema, sino solo aquellos grafemas que puedan tener una doble articulación, como en el caso de la grafía ; incluso puede bastar con indicar la excepción, señalando solo su valor [ks], como luego veremos. Asimismo, se debe tener presente la peculiaridad de la coexistencia de dos lenguas en situación desigualitaria en la sociedad gallega. No son raros ya modelos fonéticos gallegos fuertemente influidos por el castellano, sobre todo en hablantes de hábitats urbanos y en grupos sociales de prestigio con acceso a los medios de comunicación y a la política, paradigmas de un nuevo sociolecto conocido como “novo galego urbano”, en contraste con el tradicional “galego popular”, propio de hábitats rurales (vid. Regueira 1999; Dubert 2002; González González 2008). Esas interferencias fónicas resultan más visibles en aquellos puntos en que ambos sistemas divergen (y que, por otra parte, más los individualizan), como pueden ser la diferenciación en gallego entre vocales medias abiertas y cerradas (con propensión a neutralizarse); y la existencia de una consonante fricativa prepalatal sorda // (con tendencia a despalatalizarse y parecerse a [s]), o de una nasal velar en posición intervocálica. La conveniencia de salvaguardar las dicciones tradicionales gallegas parece hacer necesaria su inclusión en los diccionarios. Lo dicho anteriormente entronca con el problema del modelo de pronunciación que se describe en los diccionarios. Regueira (2000) señala que en la formulación de un modelo fonético estándar para el gallego actual sobresalen dos tipos de problemas: unos “internos” (la variación dialectal y la variación diacrónica, por ejemplo en la adaptación de cultismos), y otros “externos” (la extensión de modelos fonéticos y suprasegmentales fuertemente influidos por el castellano). Solo en el DPLG (2010) se aborda el problema del modelo, como luego veremos; en el bilingüe VOX (1997) apenas se afirma que se describe “un modelo de pronuncia estándar”;

La información fónica en la lexicografía gallega moderna

195

en las restantes obras nada se expresa. No obstante, las transcripciones y explicaciones que incluyen las obras traslucen un modelo de dicción enraizado en el gallego popular (sistema vocálico tónico y pretónico con siete unidades vocálicas; distinción entre /s/ y // en palabras como liso/lixo; oposición entre // y /n/, como en unha/una; aceptación de formas dialectales con vocalismo tónico metafonético ampliamente implantadas, etc). Con todo, son desechados o no se promueven procesos fonéticos habituales también del gallego popular como las armonizaciones vocálicas ([k'ia], [p'ð i]) o la velarización de implosiva final, []; ni fenómenos dialectales ampliamente representados como la gheada, u otros de menor extensión como el seseo (Fernandez Rei 1990: 163-213).

3. Las indicaciones fónicas en los diccionarios gallegos actuales Las indicaciones fónicas en un diccionario y la propia existencia de diccionarios de pronunciación vienen justificadas sobre todo en aquellas lenguas en que difieren notablemente el sistema gráfico y el fónico. De ahí, por ejemplo, que el francés y el inglés posean ya desde del siglo XVIII indicaciones de pronunciación en los diccionarios generales destinadas a los hablantes nativos, y también en los bilingües para los aprendices con otras lenguas propias. Comenta Quilis (1982: 325) que el Dictionnaire critique de la langue française (1787), de J. Férand, fue el primero en ofrecer de manera sistemática la pronunciación de todas las palabras por medio de la supresión de las grafías que no se articulaban y sustituyendo los caracteres ortográficos por otros menos equívocos; esto es, por medio de lo que el llama “transposición ortográfica”. En el siglo XIX, con el nacimiento de la Filología comparada, la transcripción de la pronunciación no solo en los diccionarios sino en los trabajos generales de Lingüística fue algo que se hizo inevitable y de ahí surgió la necesidad de la elaboración de un alfabeto universal, un alfabeto comparado, como ya reclamaba Ch. Nodier en 1834, en el que cada sonido estuviese representado por “signos fonográficos” (Quilis 1982: 329). Para dar respuesta a ello nacería en 1888 la Asociación de Fonética Internacional (AFI o IPA), auspiciada por un grupo de profesores de francés, que creó un alfabeto que con modificaciones y ampliaciones constantes fue seguido mayoritariamente (a veces con pequeñas adaptaciones) por los diccionarios de pronunciación a partir de mediados del siglo XX, y también en las transcripciones fónicas de las entradas de los diccionarios generales. Con todo, algunos diccionarios bilingües utilizaron también la llamada “pronunciación figurada”, en un intento por representar con caracteres ortográficos la articulación de las secuencias. Como ya se ha dicho, la transcripción fónica del lema de entrada en la tradición lexicográfica gallega es algo relativamente novedoso. De todas formas, no conviene perder de vista que ya nuestros primeros lexicógrafos en el siglo XVIII, como Sarmiento y Sobreira, incorporaron en sus fichas comentarios sobre cuestiones de pronunciación, referidas sobre todo a aspectos que diferenciaban el gallego del castellano, que fueron también las más tenidas en cuenta luego por los diccionaristas

196

Xosé A. Fernández Salgado

del XIX. Por poner un ejemplo de ello, la funcionalidad de la oposición abierta/cerrada en las vocales medias , inexistente en castellano, fue una cuestión que, con peor o mejor fortuna, la mayoría de nuestros lexicógrafos intentó recoger por medio de una acentuación a la francesa, aunque no de modo sistemático. Así, Sarmiento en su Colección de voces y frases de la lengua gallega, comenta en la voz “pôlvo” que se pronuncia la con la boca muy cerrada para distinguirla de “polvo por pulvis”. Ya en el siglo XIX, fueron sin duda J. Cuveiro y sobre todo M. Valladares los que de un modo más constante reflejaron esta característica fónica en las entradas de sus diccionarios. Cuveiro lo hizo remarcando sobre todo las vocales cerradas con el acento circunflejo, y así lo destacaba en las “Advertencias” de su Diccionario gallego (1876) 4 : “Las ê y ô, con el mismo acento, indican su pronunciacion cerrada ó sea más oscura que las e y o comunes ó abiertas”. Por su parte, Valladares insistió en su Diccionario gallego-castellano (1884) en destacar las realizaciones abiertas tónicas y pretónicas usando el acento grave y dejando el agudo para indicar tonicidad (vid. Fernández Salgado 2012). Y aun a principios del siglo XX, la RAG, en su inacabado Diccionario gallego-castellano (1913-1928), tuvo intención de seguir con esta práctica en unas reglas expuestas en la entrada “acento” –que nunca se aplicaron– según las cuales el grave indicaría vocal cerrada, el agudo tonicidad y el circunflejo se usaría para antiguas crasis de vocales o “cuando aquella sea larga”. Dividimos nuestro análisis de trece obras lexicográficas gallegas actuales en tres grupos: 1) diccionarios que incluyen solo información fónica ocasional en alguna entrada; 2) diccionarios que contienen transcripción fónica en todas sus entradas; y 3) diccionarios de dudas y otros.

3.1. Diccionarios con informaciones fónicas ocasionales 3.1.1. El diccionario XERAIS (1986) La primera obra lexicográfica que inserta símbolos fonéticos para describir alguna característica de la pronunciación gallega es el Diccionario Xerais da Lingua (XERAIS) (1986). Esos símbolos son los del alfabeto RFE.5 Las indicaciones aparecen a continuación de la voz de entrada en dos casos muy concretos que se explican en la “Mostra práctica do funcionamiento do diccionario” (XERAIS: XVIII).

–––––––— 4

5

Repárese en la curiosidad de que este diccionario, si hacemos caso de la última palabra de su largo subtítulo, vendría a ser el primero en reclamarse del género de los diccionarios de pronunciación (el resaltado es nuestro): Diccionario gallego. El más completo en términos y acepciones de todo lo publicado hasta el dia, con las voces antiguas que figuran en códices, escrituras y documentos antiguos, términos familiares y vulgares y su pronunciación. Los símbolos empleados tienen las siguientes correspondencias con los del AFI: [š] = [], [] = [], [ę] = [], [ẹ] = [e], [] = [o], [h] = [ħ].

La información fónica en la lexicografía gallega moderna

197

En primer lugar, se usan con ciertas grafías bifonemáticas que pudieran llevar a confusión, aunque realmente estas se circunscriben a la grafía : se discrimina su posible sonido fricativo prepalatal sordo (“hidróxeno [š]”)6 de su articulación como grupo culto (“hidróxido [ks]”). En segundo lugar, se incluye información fónica vocálica en los casos de voces homógrafas no homófonas, es decir, en pares que se diferencian por el distinto grado de abertura de las vocales medias ; por ejemplo, “bota [ọ]” ‘calzado’ frente a “bota []” ‘época de siembra’.7 Se recogen estas indicaciones también en los pares en que ya gráficamente una de ellas lleva tilde diacrítica, siempre la tónica con el grado abierto: “bola [ọ]” ‘pan’ / “bóla []” ‘esfera’; “pe [ẹ] ” ‘letra’ / pé [ę] ‘ parte del cuerpo’); y en los pares en que esta oposición sigue siendo funcional, pero en posición pretónica: “cordeiro [ọ] ” ‘cría de oveja’ / “cordeiro []” ‘que hace cuerdas’. Como excepción, se señala en la voz “gheada [h]” la articulación del dígrafo como aspirada faríngea. También se transcriben completamente algunos extranjerismos: “jazz [dæz]”; a veces se marca solo la pronunciación de alguna grafía: “kolhoz [h]”, “sheriff [š]; y en cambio, en otros no se indica nada: “kitsch”, “sketch”.

3.1.2. Los diccionarios de la RAG (1990, 1997) Indicaciones parecidas se incluyeron posteriormente en otros diccionarios generales monolingües. Así, el Diccionario da lingua galega (1990) de la Real Academia Galega (RAG) (1990) y, posteriormente, su ampliación como Diccionario da Real Academia Galega (DRAG) (1997) ofrecen también información de las grafías bifonemáticas, en el caso de la grafía solo en los casos en que suena [ks] (“axial [ks]”) –se sobreentiende que en los restantes casos es prepalatal []–; y en las palabras homógrafas, solo cuando son tónicas. En el DRAG a veces se transcribe solo la vocal tónica (“bola [o]” / “bóla []”), pero en otras toda la palabra (“pola1 [pola]” / póla [pla]”). En cuanto a los extranjerismos, el DRAG incluye también una transcripción amplia de ellos, aunque no de todos. Así encontramos la pronunciación de “esmóking [smki]”, “júnior [junjor] o “jeep [dip], pero no la de “show”, ni “shérif”, ni “kiwi”. La transcripción se realiza por el alfabeto AFI. Este diccionario DRAG conoce una reciente ampliación, cuya versión se puede consultar en línea en el portal web de la RAG.8 La información fónica incluída no ha variado, aunque incorpora la novedad de poder escuchar el lema en formato acústico, tomado del DPLG. –––––––— 6 7 8

Encerramos entre comillas el lema de entrada y la transcripción de los diccionarios que nos sirven de ejemplificación. Estas indicaciones no son sistemáticas, ya que por ejemplo “bota” ‘recipiente de cuero’ aparece listada al lado de las anteriores sin ninguna indicación fónica. , consulta realizada en junio de 2013.

198

Xosé A. Fernández Salgado

3.1.3. Los diccionarios OBRADOIRO (1995, 2005) Un salto cuantitativo se produjo con la publicación del escolar Diccionario da lingua galega (OBRADOIRO1) (1995), ya que fue el primero en insertar la abertura de las vocales tónicas en todos los casos –conforme indican sus autores–, según la pronunciación mayoritaria en el territorio gallego. Siguiendo con la tradición de alguno de nuestros diccionarios clásicos del XIX, habilitaron como marca el acento grave (“pedra [è]”, “porta [ò]”) para indicar vocales medias abiertas, y ninguna tilde (“deda [e]”, “canón [o]”) para las cerradas. Resultan igualmente novedosas las indicaciones sobre la nasal velar [], que se marca unas veces con el símbolo fonético (“anhelar []” o “anhídrido []”), y otras con la referencia al dígrafo [nh] (“menhir [nh]”, “inhalar [nh]” o “inhumano [nh]”). Se señala sistemáticamente la pronunciación de con valor de [ks] y en casos de duda, también su articulación tradicional como prepalatal con el símbolo de la RFE, [š] (“exemplo [š]”, “taxa [š]”, etc.). Asimismo, algunas palabras extranjeras se acompañan de transcripciones completas bastante amplias, como “jazz [dJas], “kiwi [kibi]”, “sexy (pl. -xys) [sèksi]” o “shérif (pl. -rifs) [šèrif]”. En 2005 se hizo una nueva edición con el título de Novo dicionario da lingua galega (OBRADOIRO2), que presenta alguna novedad. Así, en algunos lemas se admite la doble posibilidad abierta/cerrada para por razones dialectales, bien por metafonía nominal (“ollo [ò/o]”), bien por inflexión de la nasal sobre (“dente [è/e]”). Por otra parte, se corrige la doble representación de la nasal velar para únicamente el símbolo [] (“menhir []”, “inhalar [inhalar []”); y para la prepalatal, se substituye el símbolo [š] por el del AFI //. En los extranjerismos se mantiene la transcripción, aunque pasa a indicarse al final de la definición en un apartado de observaciones (OBS.).

3.1.4. El diccionario CUMIO (2004) El Diccionario Cumio da Lingua Galega (CUMIO) (2004) repite el mismo tipo de información fónica que se incluía en el DRAG. En la grafía se indica su articulación como grupo culto (“coxal [ks]”); sin embargo, en casos de voces con dos se marca también la realización prepalatal (“coxalxia [ks] []”). Se indica también la abertura de la vocal tónica en algunos pares homógrafos (“presa [e]” / “présa []”), aunque no en otros (“te” / “té”); y se transcribe la pronunciación de algunos préstamos y extranjerismos por medio de un sistema semifonético: “crácking [craquin], a veces con pronuncias alternativas como en el caso de “gymkhana [yincana / xincana]”.9

–––––––— 9

En la introducción, los autores indican sus normas de transcripción y justifican que no fuese fonética para que pudiese llegar a un mayor número de personas.

La información fónica en la lexicografía gallega moderna

199

3.2. Diccionarios con transcripción fonética en todas las entradas 3.2.1. El diccionario VOX (1997) En 1997 se publica el bilingüe Diccionario esencial galego-castelán, castellano-gallego (VOX) (1997), que presenta como novedad en la historia de la lexicografía gallega el hecho de ser el primer diccionario que incluye la transcripción fónica, en caracteres AFI, de todos los lemas de entrada de la parte gallego-castellano (“abafallar [aβafaa] tr. Despreciar”). La transcripción de sus casi 20.000 palabras corrió a cargo de C. García Rodríguez. Aunque se trata de una transcripción amplia, se puede decir que resuelve al usuario las dudas sobre pronunciación más problemáticas del gallego. En el VOX se marca la distinta abertura de las vocales medias [e, ; o, ] en posición tónica (“pelo [pelo]”, “idea [iða]”; “conta [kon ta]”, “obra [a]”), y también en átona pretónica (“pelar [pelar], “ideal [iðal]”; “contable [kontaβle]”, “obrar [ar]”). En posición postónica siempre se transcriben las realizaciones medias como cerradas (“neno [neno]”, “pase [pase]”). No se marcan de ninguna forma las leves palatalizaciones y alveolarizaciones contextuales de /a/ (“cal [kal]”, “acto [akto]”; “bailar [bajlar], “palla [paa]”); ni tampoco se recogen las nasalizaciones de vocales en ningún contexto (“mono [mono]”, “onte [nte]”, “galiña [alia]”. Si se indica en cambio el alargamiento de (de /aa/) en las contracciones de la preposición a y el nexo comparativo ca con el artículo femenino (“á [a]”, “cá [ka]”); pero no en palabras como “pa”, “la” o “mañá”, que históricamente proceden de la crasis de /aa/, y que en algunas hablas gallegas todavía se puede oír. En los diptongos, se indican las realizaciones de los márgenes como semiconsonantes, [j] y [w], sean diptongos decrecientes (“ouro [owo]”, “feira [feja]”) o crecientes (“ambiguo [ambiwo]”, “medio [meðjo]”). La transcripción realizada nos permite interpretar que las secuencias de vocales débiles – que se realizan como hiatos cuando la segunda de ellas és tónica, y así se señala ortográficamente (“miúdo, -da [miuðo]”, “ruído [ruiðo]”)–, siguen manteniéndose hiáticas cuando pasan a posición átona, por ejemplo en sus derivados (“miudeza [miuðea]”, “ruidoso, -sa [ruiðoso]”). También a partir de su transcripción podemos identificar propuestas de secuencias de vocal cerrada + abierta como diptongos (“egua”, [wa], “fiestra [fjsta], “cambiar [kamjar]”, etc.) que resultan problemáticas, ya que en el gallego hablado se pueden realizar también como hiatos; y viceversa, secuencias hiáticas que algunos hablantes pueden articular como diptongos (“suor” [suor], “liorta [lirta]”, “piano [piano]”, etc.). En las oclusivas sonoras, se discriminan las realizaciones contextuales no condicionadas oclusivas [b, d, ], de las condicionadas, que son transcritas como fricativas [β, ð, ] (“vago [bao]”, “dedo [deðo]”, “gabar [aar]”). En el grupo de las fricativas, se propone la distinción funcional entre /s/ y //, siguiendo el uso gráfico de y , , respectivamente, en posición prenuclear (“coser [koser]” / “cocer [koer]”; “segar [sear]” / “cegar [ear]”), y postnuclear (“nós [ns]” / “nóz [n]”). Como se puede ver por los ejemplos, no se marca la

200

Xosé A. Fernández Salgado

apicalidad de [s] ni tampoco se discriminan las realizaciones contextuales sonorizadas ante consonantes voceadas (“desdén [desð]”), de las sordas (“mesto [mesto]”). En cuanto a la articulación de la grafía , se indica en su caso la realización tradicional como fricativa prepalatal sorda (“xunta [unta]”, “taxa [taa]”, “axóuxere [aowee]”), o siempre como [ks] cuando forma grupo culto, tanto si es heterosilábico (“exame, [ksame]”), como tautosilábico (“éxtase [kstase]”). En las nasales, se indica la pronunciación como velar [] del femenino del numeral un: (“un, unha [u], [ua]”. De igual forma, también se propone la nasal velar para otros casos del dígrafo (“inhalar [ialar]”, “inhóspito [ispito]”, “anhelo [alo]”). En posición implosiva, se indican las distintas realizaciones contextuales para la nasal: bilabializada [pomba], labiodentalizada [efermo], dentalizada [en tro], interdentalizada [on e], palatalizada [kunt a] y velarizada [kuka]. Asimismo se señala la pronunciación velar en posición implosiva final absoluta (“ben [b]”), y en las secuencias (tanto en final de palabra “luns [lus], como medial tautosílabica “constar [kostar]” o heterosilábica “consolo [koslo]”), en (“alumno” [aluno]”) y en (“inmóvil [imil]”). Finalmente, en el grupo de las consonantes líquidas, para el dígrafo se propone la pronunciación tradicional como lateral palatal central, [], (“palla [paa]”); sin embargo, en la introducción del diccionario (VOX: XV), en la tabla de equivalencias de “Grafía” y “Pronunciación Fonemas”, se indica como pronunciación alternativa la realización yeísta como [], oclusiva palatal sonora. Para , en posición implosiva se recogen los alófonos dentalizado “alteza [al tea]”, interdentalizado “alzar [al ar]”, palatalizado “colcha [kolt a]” y velarizado “alga [aa]”; en la posición implosiva final se indica siempre la realización alveolar (“mal [mal]”) y nunca la velar [], que si aparece en hablantes del gallego popular. En cuanto a las vibrantes, se marca la funcionalidad de la oposición múltiple/simple en contexto intervocálico: “carro [karo]” / “caro [kao]”. En la posición implosiva final, se opta por la pronunciación múltiple [r] (“termar [termar]”); en tanto que cuando forma parte de grupo tautosilábico con una oclusiva o fricativa se determina su articulación como simple [] (“présa [psa]”, “frauta [fawta]”). El patrón fónico de gallego que se describe en elVOX, según indica su director Fernández González (VOX: IV), es “un modelo de pronuncia estándar”. En ese modelo, por ejemplo, se propone la pronunciación de los grupos cultos manteniendo la articulación del primer elemento más próxima a la grafía (frente a lo que sucede en el gallego popular, en que la tendencia es su eliminación). Así se transcribe “acto [akto]”, “réptil [rptil]”, “agnóstico [anstiko]”, “obxección” [bkjo]”, “digno [dino]”, “externo [ekstno ]”, “abdome [abdme]”, “instar [istar]”, etc. Solo se elimina la primera consonante en los casos en que el grupo culto inicia palabra: “pneumonía [newmonia]” o “mnemotécnica [nemotknika]”). Únicamente en la secuencia se modifica la articulación nasal proponiendo la velar: “himno [ino]”. En ese “modelo de pronuncia estándar” se da cabida a algunas realizaciones dialectales de cierta extensión, como las causadas históricamente por fenómenos de metafonía nominal de la vocal final (“ollo [oo] [o]”, “hora [a] [oa]”), o de

La información fónica en la lexicografía gallega moderna

201

inflexión de la nasal implosiva sobre // etimológico (“vento [ben to] [bn to]”. En estos casos se indica la doble representación tímbrica de las vocales tónicas: la variante occidental innovadora aparece primer lugar ([oo], [ben to]) y la etimológica de la zona oriental, a continuación ([o], [bn to]). Como ya insinuamos más arriba, no se recoge en cambio esa doble posibilidad con otros fenómenos dialectales de carácter fónico, territorialmente amplios, como la gheada (“gato [ato]”, “vago [bao]”) y el seseo (“cocer [koer]”; “nóz [n]”. No obstante, en el texto introductorio de la obra (VOX: XV), en la referida tabla de equivalencias entre “Grafía” y “Pronunciación Fonemas” si se indica entre paréntesis la doble opción de las grafías implicadas: “g – [g] (ou [h])”; y “c – [] (ou [s])”, “z – [] (ou [s])”, repitiendo lo expresado en las Normas ortográficas e morfolóxicas do idioma galego propuestas por la RAG/ILG (1982: 9). Finalmente, en los extranjerismos el diccionario VOX propone habitualmente una transcripción fonética adaptada al gallego: “kamikaze [kamikae]”, “kiwi [kii]”; “spaghetti [spati], “show [ow]”; aunque en algunas ocasiones se proponen sonidos que no pertenecen al sistema gallego, como en “jeep [dip]”.

3.2.2. El diccionario de “pronuncia” (2010) En 2010, y tras varios años de trabajo, un grupo de lingüistas de la sección de Fonética del Instituto da Lingua Galega dirigido por X.L. Regueira dio a conocer el Dicionario de pronuncia da lingua galega (DPLG) (2010), el primero en su género de la lexicografía gallega. Con sus más de 46.000 lemas transcritos constituye actualmente la propuesta fonética más completa, fundamentada y contrastada social y territorialmente de las existentes, y, por otra parte, la referencia de mayor autoridad normativa al estar amparada por la RAG. El diccionario se puede consultar en línea,10 en cuya interfaz se ofrece, además de la transcripción en caracteres AFI, la posibilidad de escuchar la palabra en formato acústico.11 Como indica en la introducción Regueira (DPLG: 9), su objetivo específico es el de proponer un modelo de pronunciación que pueda ser aceptado en contextos en que se requiera el empleo de la lengua estándar; y, derivado de ello, influir en los modelos públicos de gallego, de forma que su fonética se aproxime a la del “gallego histórico”, esto es, el heredado por los gallegohablantes, frente a otros modelos de gallego, sobre todo urbanos, de base fonética española. En el diccionario se describe, por tanto, un modelo fonético con identidad propia que, siguiendo los criterios del estándar escrito (RAG/ILG 1982: 7-8), se basa según Regueira (DPLG: 12) en la continuidad con el gallego hablado; en la actitud purista frente a la influencia del castellano; en el carácter supradialectal de las propuestas; en la preferencia por las formas conservadoras frente a las innovadoras; y en la harmonía con las demás –––––––— 10 11

Este formato acústico es el incorporado al diccionario de la RAG que actualmente se puede consultar en línea en .

202

Xosé A. Fernández Salgado

lenguas romances y, en particular, con el portugués en lo tocante a la adaptación de neologismos. En la conformación de ese patrón fonético para el gallego, Regueira es consciente del problema que supone la inexistencia de un grupo social gallegohablante prestigioso de referencia; y, por otra parte, descarta por purismo el modelo de los medios de comunicación hablados, ya que al estar instalados en español ofrecen pautas de esa lengua. El grupo social que acaba definiendo como más próximo a ese modelo es el formado por “galegofalantes, de formación universitaria e relacionados co mundo da cultura, usuarios do galego escrito e en contacto directo, como receptores ou emisores, de discursos públicos en galego” (DPLG: 13). La base de las propuestas para el modelo que se describe, según Regueira, sería el gallego popular hablado por las generaciones más viejas, aunque sin perder de vista algún criterio social en lo que atañe a ciertos prejuicios sobre algunas pronunciaciones de ese grupo. La propuesta de pronunciación de los lemas se hace por medio de una transcripción amplia con el alfabeto AFI, con lo que se procura que sea accesible y clara para no especialistas. Esa transcripción no difiere en gran medida de la hecha en el diccionario VOX (1997). De hecho, se reconoce que el origen del DPLG está en la revisión fonética de las 20.000 entradas de aquel. Por tanto, lo dicho sobre la transcripción incluida en el VOX (vid. 3.2.1.) vale en líneas generales para este. Nos limitaremos básicamente a puntualizar algunas cuestiones en las que divergen. Se señalan las realizaciones de las siete vocales tónicas y pretónicas ([i, e, , a, , o, u]) y las cinco postónicas, aunque en esta posición, novedosamente y siguiendo el gallego popular, se indica para su realización más cerrada y centralizada que cuando son tónicas. Para ello se habilita el diacrítico que indica elevación: [a ], [e ] [o ]. La información fónica aparece tras el lema, después de las indicaciones morfológicas, y sin corchetes, tanto cuando son átonas finales (“caseta f kaseta ”, “casete f kaste ”, “caseto m kaseto ”), como postónicas mediales (“cágado m kaa ðo ”, “lévedo am lee ðo ”, “víbora f bio a ”).12 Existen pequeñas discrepancias con respecto al VOX en cuanto a las propuestas de las vocales medias como abiertas o cerradas. Dejando a un lado la variación dialectal, por ejemplo, la vocal del grupo culto ex- en el VOX se transcribe sistemáticamente abierta, en tanto que en el DPLG se representa abierta cuando el grupo es heterosilábico, [k.s] (“exame s ksame ”) y cerrada, si es tautosilábico [ks] (“expor v ekspo”), siguiendo con ello una práctica habitual del gallego hablado. Al igual que el VOX, en las consonantes oclusivas sonoras, se refleja la distribución complementaria entre [b], [d], [], oclusivas, y [], [ð], [], que Regueira define en la introducción (DPLG: 15) como aproximantes espirantes, aunque en la transcripción no se marca con el diacrítico de descenso lingual ([]). Para el fenómeno de la gheada, se reconoce que debería estar representada por ser –––––––— 12

Regueira (DPLG: 14) indica que en hablas tradicionales estas realizaciones elevadas y centralizadas existen también en posición pretónica, si bien escusa su no notación diferenciada en tanto no existan descripciones más precisas y detalladas de estos contextos prosódicos.

La información fónica en la lexicografía gallega moderna

203

una variante fonética mayoritaria, pero el hecho de que se evite en la lengua pública formal llevó a que para solo se recojan las pronuncias [] y [] (DPLG: 14-15). Por su parte, en el grupo de las fricativas, también como en el VOX, se recoge la distinción entre la interdental [] y [s], que pese a ser definida como apicoalveolar no se marca luego con el diacrítico ([s ]). En las transcripciones no se nota, por tanto, el fenómeno del seseo, hecho que se justifica por ser minoritario y porque las tentativas de su introducción en el estándar son aún muy escasas (DPLG: 15). Difieren en cambio VOX y DPLG en la representación de las realizaciones de la nasal implosiva. En el DPLG non se discriminan las pronunciaciones contextuales dentalizadas, interdentalizadas, ni palatalizadas: en estos casos se transcribe como alveolar [n]. Si se marca la realización bilabial [m] (“cambio s kambjo ”); y la velar [] en implosiva final absoluta (“bombón s bombo”), ante consonante velar (“lingua s liwa ”) y en la secuencia final de palabra (“luns m lus”), si bien en interior se propone [n] (“constante a konstante ”). A diferencia del VOX, se formula la doble posibilidad, alveolar y velar ([n]∼[]), para casos como “menhir”, “anhelo”, “inhumano” o “alumno”: en todos ellos la pronunciación como alveolar [n] se recoge en primer lugar –entedemos como preferente frente a realización velar [], más habitual del gallego popular. En el grupo de las consonantes líquidas, como en el VOX, únicamente se propone para la pronunciación tradicional no yeísta, esto es, como lateral palatal central (“palla s paa”), hoy muy minoritaria frente a otras realizaciones deslateralizadas como la oclusiva [], la fricativa [] o la aproximante []. Regueira (DPLG: 15), siguiendo un criterio conservador, justifica la elección ante la sospecha de que estas sean de influencia del español. Sin embargo, si se aparta el DPLG del VOX al no discriminar ninguna realización contextual de /l/ en posición implosiva, que siempre se nota como alveolar [l]; y en la realización implosiva de la vibrante, que se transcribe como simple [] (“mar m ma”). En lo que respecta a los grupos cultos, conforme el criterio de harmonía con otras lenguas romances, la propuesta del DPLG es la de representar la realización de las consonantes y grupos en implosiva (“recto a s rkto ”, “instalar v instala”). De todos modos, en la introducción Regueira (DPLG: 15-16) reconoce que estas pronuncias non son las habituales en el gallego tradicional, en el cual lo normal es reducir el grupo culto eliminando la primera consonante del grupo ([rto ], [istala]), además de otras posibilidades. Aunque su propuesta de representación fónica es efectivamente mantener el grupo culto, advierte que incluso en los registros formales las oclusivas implosivas presentan realizaciones poco tensas ([rk to ]) y que tienden a desaparecer. Comenta igualmente la posibilidad de asimilación de la oclusiva al segundo elemento cuando este es una nasal ([digno ] ∼ [dino ]), posibilidad que sin embargo no se incorpora en las transcripciones del diccionario. Con todo, se insiste en que su no inclusión no debe interpretarse como una desconsideración a estas variantes. Lo mismo que en el VOX, algunas entradas presentan duplicidad en la transcripción. Se recogen en ellas sobre todo casos de variación dialectal referidas al vocalismo tónico por causa de la metafonía nominal y de la variación de timbre en trabado por nasal. La inclusión de la doble posibilidad obedece a cuestiones de

204

Xosé A. Fernández Salgado

reparto geográfico de las variantes: si este es semejante, se proponen las dos pronunciaciones (“ollo m oo o ”; “dente m dente dnte ”); si una de las variantes ocupa más extensión que la otra, la de menor se incluye entre paréntesis (“novo a no (noo )”; “vento s bento (bnto )”; pero si una de las variantes geográficas ocupa ya la mayor parte del territorio, únicamente se ofrece esa (“corpo s kopo ”; “dentro av dento ”). Otras duplicidades se deben a cuestiones de variación diacrónica, sobre todo en lo que afecta a las vocales pretónicas medias. Actualmente, la adaptación de palabras nuevas con vocales medias iniciales en sílaba libre se hace en gallego con vocales abiertas ([], []), lo que contrasta con lo que sucede con estas mismas vocales en palabras patrimoniales, que suelen presentar vocales cerradas [e], [o] (vid. DPLG: 19). Estas discrepancias provocan un tipo de variación que es recogida en el DPLG en casos como “oficio s fijo ofijo ”: la primera elección corresponde al modelo innovador, mientras la segunda guarda fidelidad a la lengua tradicional. Otro ejemplo lo encontramos en la entrada “oliva s olia (lia )”, en la que por el contrario, la primera transcripción responde al modelo tradicional y el segundo, al modelo actual (entre paréntesis porque todavía no es mayoritario). Esta variación afecta también a las palabras de su familia léxica (“oficial a fijal ofijal”): en líneas generales, los hablantes innovadores son fieles al timbre de la palabra base, en tanto que los más conservadores tienden en esta posición pretónica a neutralizar la abertura de las vocales medias a favor de sonidos más cerrados. Finalmente, el DPLG trata los extranjerismos adaptados gráficamente como palabras propias del idioma; pero para los que mantienen su grafía original, frente al VOX, se ofrecen habitualmente dos transcripciones: una que mantiene la pronunciación original y, al lado, otra adaptada a la fonética del gallego: “pizza s pitt sa pit sa”; “surf s sf suf”; “slogan s    ”.

3.2.3. El diccionario GRAN XERAIS (2009) El único diccionario monolingüe general que actualmente ofrece la transcripción fónica de todas sus entradas correctas es el Gran Diccionario Xerais da Lingua (GRAN XERAIS) (2009). Este diccionario conoció una primera edición en 2000 que, siguiendo a su hermano más viejo el XERAIS (1986), incluía la indicación fonética entre corchetes y con símbolos AFI únicamente de cuando tiene valor fonético de [ks] y en los casos de pares homógrafos, la abertura de tanto en posición tónica como átona (vid. infra). En los extranjerismos la transcripción era completa y en un mayor número de lemas que en 1986 (“shah [ a]”, “shérif [ if]”, “pizza [pidza]”, etc). En la nueva edición de 2009, como ya adelantamos, todas las entradas estándar van seguidas de una transcripción fónica amplia en alfabeto AFI. Esta representación apenas diverge de la realizada en el VOX (1997) y el DPLG (2010), por lo que apenas nos vamos a detener en ello. Simplemente apuntaremos que comparte con el DPLG la representación con los símbolos [a ], [e ] [o ] de las realizaciones más cerradas y centralizadas de estas vocales en posición átona postónica. En cuanto a las nasales, a

La información fónica en la lexicografía gallega moderna

205

diferencia del DPLG, la implosiva se transcribe como velar en todos los contextos, excepto ante bilabial, en que se opta por [m], y labiodental, en que se usa []. En las realizaciones del dígrafo , como en el DPLG, se ofrece una doble alternativa: “ANHELO [anlo ] [alo ]”, en este caso la alveolar en primer lugar; aunque en “MENHIR [mei], [meni]”, es la velar la que aparece inicialmente. En contraste con el VOX y coincidiendo con el DPLG, no se representan los distintos alófonos de /l/ implosivo, en tanto que la vibrante en posición posnuclear se determina como simple, []. Coincide el GRAN XERAIS con VOX y DPLG en proponer en sus transcripciones la articulación del primer elemento de los grupos cultos, la no presencia de gheada ni seseo y la pronunciación tradicional de la lateral palatal [] para el dígrafo . También concuerdan en las representaciones fónicas dobles en los casos de variación dialectal en el vocalismo: en algunas se señala con el símbolo (↵) la preferente (“ASENTAMENTO [asetameto ]↵ [asetamto ]”) por ser la más extendida; en otras no hay ningún tipo de marca, indicando así que ambas articulaciones están al mismo nivel (“BACELO [balo ] [baelo ]). Esta dualidad se repite, como en el DPLG, en secuencias de dos vocales que los hablantes pueden articular como hiato o diptongo (“MATRIARCA [matriarka ] [matrjarka ]”).

3.3. Diccionarios de dudas y otras obras lexicográficas 3.3.1. Los diccionarios de dudas (1990, 2004) En 1990 se publicó el Diccionario de dúbidas da lingua galega (DÚBIDAS) (1990), el primero de su género en la historia de la lexicografía gallega, que se revisó y amplió en 2004 con una nueva edición bajo el título de Dicionario Galaxia de Usos e Dificultades da Lingua Galega (DGUD) (2004). Tocante a la información fónica en uno y otro, se modifican dos aspectos. Por una parte, el sistema de representación fónico propio del de DÚBIDAS (con una notación propia, muy próxima al sistema gráfico), pasa a ser en la nueva edición el del AFI.13 Por otra, las dudas y dificultades fónicas que en 1990 se comentaban en medio del artículo lexicográfico, en el DGUD se organizan y sistematizan en las secciones de “FON” (fonética) y “PRO” (pronunciación), aunque a veces también en la de “ORT” (ortografía) se hacen comentarios ortofónicos. Como ambas obras comparten grosso modo las mismas explicaciones, centraremos nuestro examen en la edición más actual. En el DGUD se comentan sobre todo dudas que pueden plantearsele a un hablante a la hora de enfrentarse con el estándar oral, como puede ser la adaptación de un extranjerismo, la validez de una modulación popular o la inconveniencia de –––––––— 13

Por ejemplo, en el DÚBIDAS (1990) para indicar las vocales medias abiertas se utilizan las mayúsculas encerradas en barras (/E/, /O/); para la consonante fricativa prepalatal sorda, la representación /x/; y para la consonante nasal velar, /N/. El valor de los símbolos se indicaba en la introducción (DÚBIDAS: 25).

206

Xosé A. Fernández Salgado

una castellanizada. Así, el DGUD ofrece soluciones sobre la abertura de las vocales, principalmente casos en que la duda proviene de un par gráfico homógrafo: por ejemplo, en “óso s.m / oso s.m.” se indica la abertura de la vocal tónica de la primera de ellas; o en “POR prep. / PÓR v.” se fija que en ambos casos la es cerrada. En algunos artículos lexicográficos se abordan cuestiones sobre el vocalismo átono, como en la entrada “xugador”, en la que se comenta la inestabilidad de las vocales en posición pretónica, que puede provocar el cierre de [o] a [u], para acabar recomendado: “pronúnciese [oaðo]”. También en las entradas “andoriña”, “midir” o “mintir” se alude al fenómeno de armonización vocálica que ejerce la tónica /i/ sobre la pretónica haciendo que se cierre su articulación, de la cual se dice que es frecuente en el habla pero que debe evitarse en la escritura. Por su parte, en la voz “páledo”, además de recomendar que en la lengua culta se debe usar la forma etimológica “pálido”, se explica la tendencia en el habla vulgar a convertir la postónica en en esa posición, por la preferencia en este registro a reducir el vocalismo a solo tres unidades . Asimismo, en algunas entradas se comentan dudas sobre la pronunciación de la grafía , como en “tasa”, en que se indica su vacilación entre [ks] y la recomendable [], o en “paradoxa”, que se corrige para masculino (“paradoxo”) y se indica que la RAG propone su articulación como [ks]. Y a propósito de algunos castellanismos como “mayor”, se constata que la pronunciación yeísta [mao] es considerada incorrecta, recomendando la escrita “maior”, pronunciada con semiconsonante [majo]. Algo parecido se comenta en el doble lema “yacht / yate”, pues tras indicar que la naturalización del extranjerismo es “iate”, se dice que se pronuncia [jate] y no *[ate]. Por otra parte, en cuanto al dígrafo , en una voz de entrada como “menhir” se sanciona como válida la articulación nasal velar [], sea explosiva [mei] o implosiva [mei], y da como incorrecta la alveolar *[meni]. En palabras con grupos cultos encontramos explicaciones sobre sus usos en diversos registros. Así, en la entrada “obxeto”, que se corrige para “obxecto”, se señala que el primer elemento de en una dicción cuidada se realiza como oclusivo [k], aunque en la relajada “non se faga nin se perciba”, y añade que la realización como interdental [] “é un vulgarismo totalmente inadmisible”. Por su parte, en “obxetividade” se recuerda que las vocales que preceden a los grupos cultos son siempre abiertas. Contrastes de pronuncias también se pueden encontrar en los comentarios sobre la adaptación de algunos extranjerismos. Así, en la entrada “CÁMPING” se dice que popularmente se oyen [kampi] y [kampi]; en “shorts”, que las pronunciaciones más habituales son [ts] y [s]; o en “xóquei”, que la más frecuente es [hkej], y que su emisión a la inglesa [hki] es rara. En otras ocasiones simplemente se informa de su articulación, como en “SHERPA”, del que se apunta que su pronunciación es [pa]; o en “PÓKER”, del que se puede leer: “entre nós pronúnciase [pke]”. Algunas entradas acogen también aclaraciones sobre algún aspecto de fonética sintáctica. En “pró contr.”, luego de apuntar que la grafía correcta de esta contracción (para + o) es “para o”, se advierte que en especial en la lengua popular es

La información fónica en la lexicografía gallega moderna

207

habitual hacer una contracción [p], y que de tono más vulgar y coloquial es asimismo la forma contraída [p], para finalmente indicar que en la lengua más formal aparece [pa]. Por otra parte, encontramos igualmente en el DGUD algunas indicaciones sobre silabación. Por ejemplo, en los lemas “xuiz” o “Suiza” se recomienda poner tilde y pronunciarse como hiato [ui], [suia]; de “cambear” se observa que es una variante fonética que implica una articulación como hiato del diptongo de la voz estándar “cambio”; en tanto que en “suliñado” se remarca que la lengua escrita prefiere “subliñado”, con doble posibilidad fónica: [sub.li.a.ðo] o [su.li.a.ðo], aunque en todo caso “o b e o l forman parte de sílabas distintas”. Por último, se ofrecen también explicaciones sobre la sílaba tónica en casos que pueden suscitar dudas. Así en “oboe” se justifica la acentuación esdrújula (“óboe”) en el gallego estándar, como la palabra original en italiano, y se descarta la grave por estar influida por el español.

3.3.1. Otros diccionarios Reseñaremos dos últimas obras lexicográficas que aportan información fónica novedosa. Por una parte, el Diccionario escolar da lingua galega (EVEREST) (2010) ofrece como primicia la división silábica de las 30.000 entradas con que cuenta la obra. Por su parte, en el Diccionario de verbos galegos: Laverca (LAVERCA) (2002) se marca el timbre de las vocales medias de la conjugación verbal. Para ello se utilizan minúsculas (e/o cerradas) y mayúsculas (E/O abiertas).

4. Conclusiones En nuestro análisis de trece diccionarios gallegos actuales hemos ido verificando las distintas informaciones fónicas que incluyen en sus entradas así como los modos de representarla. Hemos indicado que la leve disparidad en gallego entre el sistema ortográfico y el fonológico, frente a otras lenguas como el inglés o el francés, favoreció en algún modo que no fuesen necesarias indicaciones fónicas sobre la pronunciación de los lemas. De todas formas esa preocupación existe desde nuestros primeros lexicógrafos, ya que, por poner un ejemplo, tanto Sarmiento en el siglo XVIII como en el XIX Cuveiro y sobre todo Valladares intentaron marcar en las entradas de sus obras la distinta abertura vocálica de las vocales medias por medio de un sistema de acentos a la francesa. No obstante, la inclusión de información fónica en los diccionarios se fue haciendo cada vez más necesaria con el acceso del gallego al discurso público a partir de la década de los ochenta del siglo XX. Inicialmente, las indicaciones se ciñeron a pronunciaciones de extranjerismos y a casos de grafías bifonemáticas como el caso de o de las vocales medias , en un principio solamente en casos de homógrafos. La cantidad de información fónica fue aumentando de diccionario a diccionario, a medida que se tuvo un mejor conocimiento del sistema fonético

208

Xosé A. Fernández Salgado

gallego y se tomaron ciertas decisiones en cuanto a qué modelo fónico se aspiraba para el gallego estándar, definición todavía no del todo concluida. En este aspecto son bastante concluyentes las reflexiones que hace Regueira en la introducción del DPLG (2010). De todas formas, en cuanto al modelo de pronuncia que se describe, existe cierta unanimidad en la mayoría de las obras en que se deben salvaguardar aquellos rasgos fónicos y prosódicos del gallego tradicional que lo particularizan frente al español, el cual en las últimas décadas ha ido erosionando fónicamente el patrón vernáculo, sobre todo en hábitats urbanos y en grupos sociales influyentes. Las características fónicas específicas que se promocionan en ese modelo estándar son la distinción en las vocales medias tónicas y pretónicas de dos grados de abertura; la realización más cerrada y centralizada de las vocales átonas en posición postónica, frente a sus correspondientes tónicas; la existencia de una nasal velar en posición intervocálica y en final ante pausa; la distinción funcional de un fonema prepalatal // del alveolar /s/; la defensa del fonema tradicional lateral palatal central, //, en contra de la práctica habitual de pronuncias yeístas; o la posibilidad de dobles pronunciaciones vocálicas, por razones de variación geográfica y diacrónica, suficientemente representadas. Existe también acuerdo en los distintos diccionarios (o por lo menos no se dan como alternativas en las transcripciones) en dejar fuera de ese modelo otras articulaciones dialectales y diastráticas del gallego popular, también ampliamente representadas, como podrían ser los fenómenos de la gheada y el seseo. Por otra parte, en armonía con otros estándares románicos, se privilegia para los registros formales la pronunciación plena de los grupos cultos. Actualmente, la lexicografía gallega cuenta con tres obras que incluyen una transcripción fonética, en caracteres AFI, de todas sus entradas: un diccionario de pronunciación (DPLG 2010), que se puede consultar en línea, de cierto carácter normativo al estar respaldado por la Academia; un diccionario bilingüe gallegocastellano (VOX 1997), que fue el primero en incluirla; y un diccionario general monolingüe (GRAN XERAIS 2009), aunque esa transcripción solo aparece en las entradas correctas. Sería deseable que en el futuro esta información fónica fuese extendiéndose a otros diccionarios generales, sobre todo escolares, y también a los bilingües de todas las combinaciones, ya que ayudaría a consolidar ese modelo fónico ansiado para el gallego.

Referencias bibliográficas ALGAII = Instituto da Lingua Galega (1995): Atlas lingüístico Galego, vol. II: Morfoloxía NonVerbal. A Coruña: Fundación Pedro Barrié de la Maza. ALGAIII = Instituto da Lingua Galega (1999): Atlas Lingüístico Galego, vol. III: Fonética. A Coruña: Fundación Pedro Barrié de la Maza. Álvarez Blanco, Rosario (1988): «Consideracións sobre a metafonía nominal galega», en Dieter Kremer, ed., Homenagen a Joseph Piel por ocasião do seu 85ª aniversário. Tübingen: Instituto da Cultura e Língua portuguesa / Consello da Cultura galega, 141-57. Álvarez, Rosario / Xove, Xosé (2002): Gramática da lingua galega. Vigo: Galaxia.

La información fónica en la lexicografía gallega moderna

209

CUMIO = Pena Romay, Xosé Antonio (dir.) (2004): Gran dicionario Cumio da lingua galega. Vigo: Edicións do Cumio. DGUD = Fernández Salgado, Benigno (dir.) (2004): Dicionario Galaxia de Usos e Dificultades da Lingua Galega. Vigo: Galaxia. DPLG = Regueira, Xosé Luís (2010): Dicionario de pronuncia da lingua galega. A Coruña: Real Academia Galega / Instituto da Lingua Galega. Existe una edición en línea . DRAG = García, Constantino / González González, Manuel (dirs.) (1997): Diccionario da Real Academia Galega. A Coruña: Real Academia Galega. Dubert García, Francisco (2002): «Os sociolectos galegos», Cadernos de lingua, 24, 5-28. DÚBIDAS = Fernández Salgado, Benigno (coord.) (1991): Diccionario de dúbidas da lingua galega. Vigo: Galaxia. EVEREST = Dosil López, Benxamin / Riveiro Costa, Xesús (2010): Diccionario escolar da lingua galega. A Coruña: Everest. Fernández Rei, Francisco (1990): Dialectoloxía galega. Vigo: Xerais. Fernández Salgado, Xosé A. (2012): «Teoría e praxe da proposta ortográfica de Marcial Valladares: os acentos como marca de abertura vocálica», en Bieito Arias Freixedo et al. (eds.), Homenaxe a Camiño Noia. Vigo: Universidade / Departamento de Filoloxía Galega e Latina, 359-381. Freixeiro Mato, Xosé Ramón (1998): Gramática da lingua galega I. Fonética e fonoloxía. Vigo: A Nosa Terra. González González, Manuel (2008): «O novo galego urbano», en Mercedes Brea et al., eds., Cada palabra pesaba, cada palabra medía. Homenaxe a Antón Santamarina. Santiago de Compostela: Universidade, 363-374. González Seoane, Ernesto (2002): «A lexicografía galega moderna», en Henrique Monteagudo / Xan Bouzada, eds., O proceso de normalización do idioma galego 1980-200. Elaboración e difusión da lingua. Santiago de Compostela: Consello da Cultura Galega, vol III, 165-227. GRAN XERAIS = Carballeira Anllo, Xosé María (coord.) (2000, 2009): Gran dicionario Xerais da Lingua. Vigo: Xerais. LAVERCA = González González, Manuel et al. (2002): Diccionario de verbos galegos: Laverca. Vigo: Xerais. Navarro Tomás, Tomás (1962): Atlas Lingüístico de la Península Ibérica, I: Fonética. Madrid: CSIC. OBRADOIRO1 = Xove Ferreiro, Xosé (coord.) (1995): Diccionario da lingua galega. Vigo: Obradoiro / Santillana. OBRADOIRO2 = Xove Ferreiro, Xosé (coord.) (2005): Novo dicionario da lingua galega. Santiago de Compostela: Obradoiro / Santillana. Quilis, Antonio (1982): «Diccionarios de pronunciación», Lingüística Española Actual, IV-II, 326-332. Real Academia Galega (1913-1928): Diccionario gallego-castellano. A Coruña: Imp. Ferrer. RAG/ILG = Real Academia Galega / Instituto da Lingua Galega (1982, 1995, 2003): Normas ortográficas e morfolóxicas do idioma galego. A Coruña: Real Academia Galega. Regueira, Xosé Luís (1999): «Estándar oral e variación na lingua galega», en Rosario Álvarez / Dolores Vilavedra, eds., Cinguidos por unha arela común. Homenaxe a Xesús Alonso Montero. Santiago de Compostela: Universidade, vol I, 855-875. — (2000): «Un modelo de estándar oral para a lingua galega», en Dieter Kremer, ed., Actas do V Congreso Internacional de Estudios Galegos. Sada / Trier: Edicións do Castro, 19-34. — (2005): «Estándar oral», en Rosario Álvarez / Henrique Monteagudo, eds., Norma lingüística e variación: Unha perspectiva desde o idioma galego. Santiago de Compostela: Consello da Cultura Galega / Instituto da Lingua Galega, 69-95.

210

Xosé A. Fernández Salgado

— (coord.) (1998): Os sons da lingua. Vigo: Xerais. Ríos Mestre, Antonio (1999): La transcripción fonética automática del diccionario electrónico de formas simples flexivas del español: estudio fonológico en el léxico, Estudios de Lingüística del Español, 4. Disponible en [Consulta: 29/07/2014]. Valladares Núñez, Marcial (1884): Diccionario gallego-castellano. Santiago: Imprenta del Seminario Conciliar Central. VOX = Fernández González, Camilo (dir.) (1997): Diccionario esencial galego-castelán, castellano-gallego. Barcelona: Vox. XERAIS = Ares Vázquez, Mª Carme (1986): Diccionario Xerais da Lingua. Vigo: Xerais.

 Léxico especializado en la lexicografía gallegoitaliana (algunas reflexiones) Isabel González Universidade de Santiago de Compostela / G.I. Italianística / Red de Lexicografía RELEX

Specialized lexis in Galician-Italian lexicography (some reflections) Abstract This paper presents the peculiarities and difficulties of working with specialized vocabulary in the context of the lexicography of minority languages. The research focuses on the results of a collective project whose aim has been to prepare a collection of Galician-Italian vocabularies centred on the specific vocabulary of cultural tourism (the hotel industry, gastronomy and fine arts). Keywords Italian, Galician, lexicography, specialist language, specialized lexicon.

1. Introducción He puesto al título un pequeño paréntesis o subtítulo, porque no se me ocurre pensar que, en el espacio del que dispongo, pueda abordar todos los problemas que plantea el léxico específico, ni siquiera los relacionados con la lexicografía bilingüe gallego-italiana. Trataré, pues, únicamente, de hacer algunas consideraciones al respecto, en su mayoría, fruto de mi larga experiencia en este campo. El léxico especializado tiene mucho que ver con el llamado léxico científico o científico-técnico. Por lo general, el léxico científico, que en nuestra lengua procede en su gran mayoría del latín y el griego, se refiere al de las ciencias exactas (matemáticas, física, química), al de las ciencias naturales (astronomía, geología, botánica, zoología), al de las ciencias humanas (psicología, antropología, sociología, historia, filosofía, filología), etc; el léxico técnico es el propio de un arte: el léxico de las artes plásticas, el propio de los oficios, etc. Son diferencias muy sutiles y por ello



212

Isabel González

tal vez sea preferible hablar de léxico científico-técnico,1 e incluir también, el campo de la música. En un sentido más amplio, podríamos hablar de léxico especializado: el propio de ciertas familias o campos semánticos determinados; el léxico que se refiere a campos concretos en oposición al léxico general. Hugo E. Lombardini, hablando de léxico de especialidad plantea, entre otras, las siguientes preguntas: ¿cuáles son los conceptos de léxico general y de léxico especializado? ¿con qué criterios se limita el porcentaje de presencias de los términos técnicos? (Lombardini 2008), porque la frontera es, a veces, muy sutil, y es un problema que hay que resolver desde un principio al preguntarnos ¿dónde ponemos el límite entre lengua común y lengua de especialidad?

2. Consideraciones previas en la elaboración de diccionarios En efecto, el primer obstáculo cuando se decide hacer un diccionario, es el de la selección de entradas: no es lo mismo un diccionario de bolsillo, pequeño, con un léxico elemental, que un diccionario a partir de 30.000 voces, por ejemplo. En el primer caso, no tendrían cabida palabras como álveo “madre del río o arroyo”, según el Diccionario de la RAE, aldebarán, software, o bróker, que entrarían más bien en un diccionario de geografía, astronomía, informática o economía, respectivamente, mientras que en el segundo, entrarían no solo éstas, sino también otras voces mucho más especializadas, como por ejemplo leucoplasto, mitocondria, mesozoico, o anafásico. De todos es sabido que uno de los grandes ámbitos tradicionales de interés terminológico, es el de la medicina, campo semántico inabarcable, pero no es menos importante, en un mundo como el nuestro, un sector como el económico o el gastronómico, actualmente muy de moda, por no hablar del amplio campo de la informática, muy sobrecargado de préstamos o adaptaciones. Cuando se trata de un diccionario bilingüe, y en nuestro caso, de un diccionario bilingüe orientado, fundamentalmente, hacia el público gallego, para que pueda cubrir sus necesidades de producción de textos en lengua italiana, los problemas aumentan, precisamente porque una de esas lenguas, el gallego, como es natural, todavía está en proceso de normalización, y, por lo tanto, es más justificable, por ejemplo, la ausencia de términos científicos.2 Tenemos muy claro que en nuestro corpus hemos de contar con el léxico específico digamos... moderno, pero cuando una de las lenguas –caso del gallego–––––––— 1

2

“El vocabulario técnico suele ser más concreto y cercano a la experiencia del hablante común: diferencial, embrague, polarización, etc., que el abstracto científico: teoría de la relatividad, axioma, ecología, etc.” (Martí et al. 1996: 103). Sabemos, desde luego, que en la planificación del corpus de un diccionario, y concretamente en el momento de la selección de entradas, hay que procurar dar cabida al léxico específico, si queremos dejar cubiertas las necesidades expresivas de la vida actual: a nadie se le escapa que el léxico científico-técnico constituye, hoy, una parte importante del léxico de la vida moderna, ya que cada día es mayor el interés que suscitan las distintas ramas de la ciencia.

Léxico especializado en la lexicografía gallegoitaliana (algunas reflexiones)

213

tiene una situación diferente, hay que hilar más fino todavía. En efecto, una vez que hemos seleccionado las palabras que van a constituir el corpus de trabajo, observamos rápidamente que en italiano, que es una lengua consolidada, el término específico en cuestión, está ya en pleno uso, mientras que en gallego, lengua minoritaria –hay sociolingüístas que prefieren decir minorizada-, tanto por lo que se refiere al número de hablantes, como por su situación social o económica, a pesar de tener igual capacidad para generar nuevos vocablos -los neologismos, como sabemos, nacen día tras día y aumentan de manera progresiva- todavía no ha “creado” el término correspondiente. Pongamos un ejemplo: cigüeñal que es un término de la mecánica, “eje con codos que transforma un movimiento rectilíneo en circular” (RAE) (el cigüeñal del coche), que en italiano tiene varios sinónimos albero a collo d’oca, mazzacavallo, en gallego se usaba, hasta hace muy poco tiempo, el término castellano. En los diccionarios recientes se rechaza (familiarmente decimos se “condena”) *cigüeñal, y se da como palabra correcta cegoñal (como *cigoña que pasa a ser cegoña) ¿qué hacer en estos casos? Naturalmente seguir las normas de la Academia.3 En el ámbito de la lexicografía gallega, aunque es cierto que, el tratamiento del léxico científico y tecnológico en los diccionarios gallegos todavía no es óptimo, y que hay ausencias de ciertas voces injustificables, debido, sobre todo, a vacilaciones morfológicas, a problemas derivados de una incorrecta adaptación de cultismos grecolatinos, o a definiciones estrafalarias o falsas (Daviña Facal 2003), también es cierto, que a lo largo de los últimos años, el panorama de los diccionarios gallegos ha mejorado muchísimo: se han elaborado nuevas obras con métodos diferentes, y se han mejorado los diccionarios existentes, aunque queda todavía, como es natural, bastante camino por recorrer. Con estas premisas, y sabiendo que es muy difícil delimitar el porcentaje de términos específicos que ha de incluir un diccionario (es evidente que hay campos semánticos que tienen un mayor peso que otros, cosa que, por otro lado, varía con el paso del tiempo, porque la ciencia avanza a gran velocidad, y se crean nuevas necesidades, y, por lo tanto, nuevas palabras, con lo que los diccionarios se quedan obsoletos bastante rápidamente), vamos a ver algunas curiosidades del léxico especializado del diccionario Italiano-Galego (ITAGAL) (González 2000), en cuya elaboración hemos intentado guardar siempre un equilibrio entre el léxico general y el específico de algunos campos científico-técnicos. Una vez determinado el número de entradas del diccionario pensando, fundamentalmente, en los destinatarios (no debemos olvidar el interés didáctico del léxico especializado), se han de fijar los campos semánticos, y para ello lo más recomendable, por nuestra experiencia, es acudir al análisis de los campos semánticos específicos en ámbito monolingüe, para poder estudiar las características –––––––— 3

Los niños gallegos escribíamos al *dictado pero ahora lo hacen al ditado; montábamos en el *sillín de la bicicleta y ahora lo hacen en la sela, porque nos sentábamos en la *silla y no en la cadeira y los bebés usaban *pañales y no cueiros.

214

Isabel González

de los tecnicismos propios y de los microlenguajes que conforman el conjunto de la terminología específica hasta agotarlos, dentro, claro está, de nuestras posibilidades.4 Por lo que se refiere a las vacilaciones ortográficas, para preservar nuestra identidad lingüística, los gallegos contamos con las indicaciones del Instituto de la Lengua Gallega, de la Real Academia Gallega, y otros organismos que intentan, por todos los medios, que el gallego esté en igualdad de condiciones que las demás lenguas, fundamentalmente, con respecto al castellano, que es la lengua cooficial de Galicia, incluso por lo que se refiere al léxico científico-técnico. Para solucionar muchas dudas y cubrir las lagunas correspondientes, la RAG y el ILG publicaron en el año 2004 el Vocabulario ortográfico da lingua galega (VOLGa) que estableció, por ejemplo que, por congruencia, si los cultismos griegos con –y(procedente de Ypsilon) se deberían escribir con –i-: sinfonía, lo mismo se tendría que hacer con la familia derivada de ylukús: glicemia, glicémico, glícidos, glicosa, glicosuria, glicoxénese, etc. Semejante es el caso del término omóplato: el gallego, como el italiano, prefirió omoplata (del gr. omopláte). En el diccionario más moderno (Gran diccionario Século 21 da Lingua Galega) *omóplato ya aparece claramente censurado. Nosotros hemos seguido la normativa, pero hemos preferido como entrada el sinónimo scapola, que es más frecuente, y que también tiene en gallego escapula y espádoa: scapola s.f. Omoplata. Sono caduto di schiena e mi sono rotto una scapola. Caín de costas e rompín unha omoplata.

En otros casos, por ejemplo, peroné (del gr. perone), el gallego prefirió echar mano del castellano que, como sabemos, adaptó numerosos tecnicismos directamente del francés en el s. XIX y primera mitad del XX, o del inglés en la segunda mitad del XX. La palabra cátering no aparece ni en el diccionario de la RAG ni en los diccionarios bilingües castellano-gallegos. En el diccionario Ir Indo del año 2004 aparece *catering como extranjerismo mientras que el diccionario Século 21 del 2006, recoge cátering (del ing. catering), con acento como corresponde a la norma del gallego. En gallego, sea por vacilaciones ortográficas y morfológicas, o por la incorrecta adaptación de cultismos grecolatinos, o sea, por errores en las definiciones, todavía falta por incluir en los diccionarios un buen número de palabras, que cada día empiezan a ser más necesarias, no tanto porque todas ellas sean imprescindibles realmente, como por su uso masivo y la consiguiente búsqueda por parte de los usuarios en el diccionario. Podríamos incluir aquí las marcas registradas, los acrónimos, las formas abreviadas...: aspirina, tirita, sonotone, fax, burofax, internet, –––––––— 4

Somos conscientes de que siempre serán limitadas, procurando, por lo menos, la presencia del léxico importante y específico de cada ámbito (en los diccionarios bilingües españolitaliano fluctúa entre un 7% y un 28%), que en nuestro caso ronda el 15%, y ello, porque creemos que un diccionario debe servir no sólo para conservar la lengua tradicional, sino también para solucionar la lengua de nuestros días.

Léxico especializado en la lexicografía gallegoitaliana (algunas reflexiones)

215

tippex, linotipo, lycra, plastilina, teflón, túrmix, y tantas otras. Algunas de estas voces son prescindibles: sonotone – audífono, túrmix – batidora. Aunque, ciertamente, en un diccionario específico de medicina, por ejemplo, han de recogerse muchos más términos médicos que en uno general, algunas voces deberían aparecer en los diccionarios generales,5 como por ejemplo los plastos o plastidios, que son organismos del protoplasma de las células vegetales y que según su contenido y funciones se clasifican en cloroplastos, cromoplastos y leucoplastos. En la mayoría de los diccionarios monolingües gallegos no aparecen, o, en todo caso, los más recientes recogen solo la voz cloroplasto y ninguno de los otros, y lo mismo sucede en los diccionarios bilingües castellano-gallego. No es correcto que si se ha decidido incluir dentro del campo semántico de la astrología los signos del zodíaco, se pongan algunos, por ejemplo tauro, géminis, libra y se prescinda de otros –cosa nada infrecuente- como aries o sagitario. Cuando se trata de cultismos, el gallego, como el resto de las lenguas románicas, suele utilizar criterios etimológicos. Suele hablarse de *médula, *parásito o *reptil cuando deberíamos decir medula (del lat. medulla), parasito (del gr. parasito) y réptil (del lat. reptile) y así se recoge en el diccionario de la RAG. Palabras que en ITAGAL van definidas de este modo: midollo s.m. 1 (Anat.) Medula, miolo. Il midollo si trova all’interno delle ossa. A medula atópase no interior dos ósos. 2 (Bot.) Medula, ámago, miolo. A lezione di biologia abbiamo visto il midollo di un albero. Na clase de bioloxía vímo-la medula dunha árbore. # fino al midollo / fino alle midolle: ata a medula; midollo spinale: medula espiñal. OBS.: fai o pl. f. midolla. parassita I adx. Parasito -a. Il vischio è una pianta parassita. O visgo é unha planta parasita. II s.m. Parasito (tamén fig.). Le piante dell’orto sono infestate dai parassiti. As plantas da horta están infestadas de parasitos. Ha vissuto sempre da parassita alle spalle degli altri. Viviu sempre como un parasito ás costas dos demais. OBS.: pl. parassiti. rettile s.m. Réptil. La lucertola è un rettile a cui piace stare al sole. A lagarta é un réptil ó que lle gusta estar ó sol.

En lo referente al uso, a veces, es muy difícil no acudir a la universalidad de la lengua científica o al uso tradicional. Se trata de palabras ya consagradas muy difíciles de cambiar, como *quiste, *quirúrxico, *esternón, *calaveira, *pantorrilla, *orina que hay que acostumbrarse a substituir por ciste, cirúrxico, externo, caveira, polpa y urina/uriños. Dejando a un lado la medicina, campo que verdaderamente no tiene fin, nos encontramos con términos como por ejemplo galería, que es claramente una palabra no gallega; seguramente nos vino a través del castellano (fr. galerie, documentada desde 1316, it. galleria, 1554, cast. 1580), lo que quiere decir que nació en francés, seguramente llegó al castellano por via italiana y al portugués y al gallego a través del castellano ¿qué hacer? Desde luego no sería correcto disfrazar la palabra ‘de gallega’ –––––––— 5

“Existen algunhas voces científicas ás que os lexicógrafos galegos parece que lles teñan medo, e non as inclúen nos diccionarios [...]” (Daviña Facal 2003: 449).

216

Isabel González

como *galeiria por lo que en nuestro diccionario hemos creído razonable definirla así: galleria s.f. 1 Túnel. Mentre il treno passava in galleria, hanno acceso le luci nel vagone. Mentres o tren pasaba polo túnel, acenderon as luces no vagón. 2 Galería, túnel. C’è stata un’esplosione nella galleria: due minatori sono rimasti sepolti. Houbo unha explosión na galería: dous mineiros quedaron sepultados. 3 Galería (de arte). Ho comprato questo quadro in una nuova galleria d’arte. Comprei este cuadro nunha nova galería de arte. 4 Anfiteatro (dos cines e teatros). I biglietti per la galleria costano meno degli altri. As entradas de anfiteatro costan menos cás outras.  Para referirse á ‘galería (dunha casa)’ en italiano emprégase o termo veranda.

Por lo que se refire a los préstamos de otras lenguas, aunque contamos con TERMIGAL (Servizo de Terminoloxía Galega), un proyecto del Centro Ramón Piñeiro para Investigación en Humanidades, cuyo objetivo es, precisamente, la definición terminológica técnica en gallego, todavía faltan estudios terminológicos para que la lengua gallega esté normalizada y normativizada. En un estudio centrado en la terminología gastronómica en los diccionarios, M. T. Sanmarco observa que “los términos gastronómicos analizados [104 entradas referidas a la gastronomía italiana] han sido adoptados y adaptados al gallego en distinto grado, y que ninguna voz ha sido sustituida por opciones lingüísticas propias” (Sanmarco Bande 2008), cosa lógica, dado el nivel de aceptación en la lengua gallega. Y así tenemos muchos ejemplos, como lasaña, mortadela o parmesano (incorporados totalmente al gallego desde hace mucho tiempo), capuccino, espaguete, más recientes, o grappa, tortellini o tiramisú, que no se han adaptado al gallego y son considerados préstamos. En ITAGAL, hemos intentado reflejar la situación del momento, que en GALITA, el Dicionario Galego-Italiano, que será publicado en 3 años, va a variar un poco, para adaptarnos plenamente a la realidad lingüística de quince años más tarde: lasagna s.f. (espec. en pl.) Lasaña. Le lasagne si preparano sovrapponendo le sfoglie di pasta. A lasaña prepárase sobrepoñendo as láminas de pasta. mortadella s.f. Mortadela. La mortadella si fa con carne, lardo e spezie. A mortadela faise con carne, touciño e especias. parmigiano s.m. Parmesano (queixo). Sugli spaghetti non deve mancare del parmigiano grattugiato. Nos spaghetti non debe falta-lo o parmesano relado. cappuccino 1 Cappuccino. Fa il cappuccino con molta schiuma e un po’ di cacao in polvere. Fai o cappuccino con moita espuma e un pouco de cacao en po. 2 Capuchino. Abbiamo visitato un convento di cappuccini. Visitamos un convento de capuchinos. spaghetti s.m. pl. Espaguetes, spaghetti. In questo ristorante cucinano gli spaghetti in molti modi diversi. Neste restaurante cociñan os espaguetes de moitas maneiras distintas. grappa s.f. Augardente, aguardente. La grappa è una bevanda ad alta gradazione. A augardente é unha bebida de alta graduación. tortellini s.m. pl. Tortellini. I tortellini sono un piatto tipico bolognese. Os tortellini son un prato típico boloñés.

A la hora de la traducción de términos específicos del léxico científico-técnico, se presentan diversos problemas. En el caso concreto del gallego, por ejemplo la tela de araña (tela di ragno en italiano), comunmente tea de araña, la RAG prefirió arañeira

Léxico especializado en la lexicografía gallegoitaliana (algunas reflexiones)

217

con un reenvío a tea en cuya entrada bajo la equivalencia tea (de araña) aparece el sinónimo arañeira.6 ¿Qué hacer con los sinónimos -dos, cuatro, seis o veinte- de raíces diferentes? En gallego, como en italiano, hay infinidad de casos, y si siempre es difícil buscar los equivalentes “perfectos” en el léxico común, mucho más en el léxico específico. Pensemos, por ejemplo, en la palabra brote, o mejor dicho, en brote verde, que tan de moda puso una ministra. En gallego tiene, por lo menos, una docena de sinónimos: abrocho, bota (f), botón, brote, broulla, gamota, gomo, grelo, gromo, rebento, xema (f), xermolo. En nuestro diccionario ITAGAL nos hemos quedado con los fundamentales: germoglio s.m. 1 Xermolo, grelo. Il germoglio è il primo stadio di sviluppo di una pianta. O xermolo é o primeiro estado de desenvolvemento dunha planta. 2 Gromo, abrocho, botón. In primavera i rami degli alberi si riempiono di germogli. Na primavera as pólas das árbores énchense de gromos. OBS.: pl. germogli.

El castellano lloviznar (it. piovigginare) tiene en gallego más de 20 sinónimos: babuñar, babuxar, barbuñar, barbuzar, barrallar, barrazar, barrufar, barruñar, barruzar, brecar, chuviñar, chuviscar, froallar, lapiñar, marmallar, marmuñar, orballar, patiñar, poallar, zarzallar, etc. En ITAGAL hemos elegido el más común como entrada principal, y luego, los tres sinónimos más generales: piovigginare v. intr. impers. [aux. essere ou avere] Chuviscar, barruzar, orballar. Il cielo era grigio e piovigginava. O ceo estaba gris e chuviscaba.

3. Léxico específico en los diccionarios gallegoitalianos La gran demanda social, fruto de las necesidades comunicativas del público en contextos específicos, hace necesaria la creación de instrumentos útiles que permitan una mejora en distintos sectores y campos específicos, como el turismo o las nuevas tecnologías (la informática... etc). En los lenguajes técnicos o específicos, hay que tener en cuenta el carácter hetereogéneo de su léxico, y el importante papel que desempeña el léxico periférico junto al núcleo fuerte. El léxico del turismo, cuya producción terminológica más específica atañe sobre todo a la organización turística (hostelería, transportes, agencias de viajes, etc.), presenta una marcada dimensión internacional y un fuerte influjo del inglés: pensemos, por ejemplo, en el uso masivo de anglicismos en el transporte aéreo o en las agencias de viajes (charter, check-in, overbooking, stand-by, IT o inclusive tour, etc.). Igual que los otros sectores profesionales, el turismo –––––––— 6

Así que en ITAGAL aparece así: tela s.f. 1 Tea, tecido. Hai dei bellissimi pantaloni di tela. Tes uns bonitos pantalóns de tea. 2 Lenzo (cadro). Sono dei dipinti su tela del XVII secolo. Son unhas pinturas sobre lenzo do século XVII. # calare la tela (fig.): rematar un asunto; tela cerata: hule; tela di ragno: arañeira.

218

Isabel González

presenta, además, algunos géneros textuales característicos, como las guías turísticas y los folletos o, en el plano de la oralidad, las interacciones entre operadores turísticos y clientes: en la programación de un curso de gallego para el turismo. Por lo tanto, habrá que tener en cuenta el importante caudal de léxico periférico – procedente del lenguaje general o de otros lenguajes específicos como la economía, la geografía, o la historia del arte- que caracteriza los textos turísticos no menos que la terminología perteneciente al núcleo fuerte (Domínguez Ferro 2013). Son escasísimos los trabajos lexicográficos que traten las lenguas italiana y gallega conjuntamente. Para intentar cubrir estas carencias, los profesores de filología italiana de la USC hemos elaborado vocabularios bilingües de ciertos sectores específicos relacionados con el turismo, las bellas artes, etc. Un sector económicamente en plena expansión y desarrollo en Galicia, como es el turismo, carecía hasta hace muy poco de un léxico específico gallego-italiano que recogiera la terminología concreta de un campo básico del turismo como es el referente a la hostelería. Nuestro proyecto pretendía cubrir ese vacío7 y creo que lo hemos logrado con la publicación de dos volúmenes (Domínguez Ferro et al. 2010, Buono et al. 2011), centrados en la microlengua de la hostelería, que abarca también sectores interrelacionados, como transacciones comerciales, transportes, economía, burocracia internacional, tiempo libre etc. y de la gastronomía, todos ellos contextos por los que se mueve el operador turístico. Hemos cubierto los campos semánticos del alojamiento, la restauración, la gastronomía, los viajes y la diversión; y dentro de las bellas artes, la arquitectura, la escultura y la pintura. Hemos tenido siempre muy presente, como es natural, los potenciales usuarios: dentro del sector turístico, los operadores turísticos, los hosteleros, los restauradores y las empresas gallegas e italianas interesadas en promocionar y difundir sus productos. También son destinatarios de la obra, en el ámbito académico, los docentes de lenguas, traductores y guías y, en el mundo editorial, los redactores de guías turísticas, revistas especializadas, folletos y otro material publicitario. Teniendo en cuenta la rápida y continua evolución del lenguaje del turismo, era imprescindible manejar fuentes primarias, como los contenidos procedentes de publicaciones periódicas y revistas especializadas, guías turísticas, páginas web de promoción turística, realizadas por los profesionales del sector o por ciertas instituciones, sin desechar las consultas y el rastreo en la red, muy útil en esta ocasión, puesto que ofrece información y material muy actualizado. La estructura de los vocabularios es sencilla: la elección de las entradas se realizó, principalmente, en función de la frecuencia de uso y de la representatividad de los téminos, se recogen las voces esenciales del uso vivo y recientemente evaluadas por la normativa de la Real Academia Gallega. Para favorecer la rápida distinción entre el vocabulario gallego e italiano, escogimos una tipografía de rápido contraste: las palabras gallegas van en redonda y las italianas en cursiva. La microestructura –––––––— 7

Es cierto que nuestro primer diccionario significó un gran avance en la lexicografía bilingüe italiano-gallega pues fue el primer diccionario de carácter general y básico que puso en contacto ambas lenguas pero, lógicamente, no cubría las carencias comunicativas de un público interesado en contextos específicos.

Léxico especializado en la lexicografía gallegoitaliana (algunas reflexiones)

219

también es sencilla: cada entrada va seguida de la categoría gramatical que le corresponda: ALMORZO s.m. colazione s.f. ALUGAR v.tr. affittare VIEIRA s.f cappasanta

Las expresiones en las que aparece incluida la entrada van sangradas y con un rombo (♦) delante: BONO, s.m. buono ♦ bonobús buono bus, buono tram ♦ bono de axencia voucher ♦ bono de hotel, buono hotel ♦ bono de viaxe buono viaggio ♦ bono factura buono di consegna

Las palabras incorrectas en gallego, aunque empleadas mayoritariamente, llevan un asterisco (*) y a continuación se da la forma correcta precedida de V. (*BARBACOA V. grella; *FOLLÓN V. balbordo; *GRADA V. bancada, chanzo). Los préstamos de otras lenguas, que en la mayoría de los casos son comunes para el gallego y el italiano, aparecen en versalita pero cursiva: BRICOLAXE s.m. bricolage, CIBERTICKET s.m. ciberticket inv., VOUCHER V. BONO DE AXENCIA. Al final de la obra, se incorpora un índice alfabético de todas las palabras gallegas e italianas, para facilitar la localización de las distintas entradas y su traducción en la otra lengua y su diferente significado según los contextos. En el volúmen de Hostelería hemos incluido también una serie de frases en gallego, con su tradución al italiano, pues les resultarán muy útiles a los italianos que lleguen a nuestro país y se alojen en un hotel, quieran realizar una gestión bancaria, ir a comer a un restaurante, gozar de un momento de placer, realizar un viaje, etc. La fraseología será también de utilidad para los hosteleros y restauradores gallegos que quieran atender a sus clientes italianos en su lengua. Terminados los dos volúmenes sectoriales dedicados al turismo, redactamos otros tres volúmenes dedicados a los microlinguajes especializados, susceptibles de ser incluídas en los campos genéricos de la arquitectura, escultura y pintura, en los que se incluyen tecnicismos propios de las Bellas Artes. Como en el caso del turismo, hemos pretendido la elaboración de un vocabulario que atendiera las necesidades específicas de los sectores profesional, institucional o docente, proporcionándoles una herramenta de trabajlo útil y actualizada. Realmente nuestros vocabularios son pioneros, pues no existe ninguno bilingüe gallego-italiano (o viceversa). Es cierto que desde hace algunos años se viene observando un notable incremento en la publicación de obras lexicográficas multilingües de contenido, sobre todo, de tema gastronómico, debido, lógicamente, al interés que despierta un sector como el turismo, que también en nuestra comunidad gallega se ha puesto muy de moda, pero ninguna que pusiera en contacto la lengua italiana con la gallega. A nadie se le escapa que el campo genérico de las Bellas Artes es amplísimo, pensemos, por ejemplo, en el diseño, el grabado, la decoración, artesanía... y por ello

220

Isabel González

nos centramos, de momento, en la terminología de la arquitectura, de la escultura y de la pintura. Los tres volúmenes en prensa (De Frutos / Marchisio / Cacheda / Domínguez / González / Buono / Gutiérrez) que se publicarán a finales del año 2014, con alrededor de 3000 palabras cada uno, lo mismo que los dos anteriores (publicados en el año 2010 y 2011 respectivamente), son un instrumento de trabajo no solo muy útil sino también totalmente nuevo –no hay nada de este tipo que ponga las lenguas gallega e italiana en contacto- que les permita a los profesionales de los respectivos sectores, a los profesores, estudiantes y estudiosos del mundo de la Hostelería, la Gastronomía y de las Bellas Artes, acceder a una información necesaria en estas dos lenguas románicas, puestas en contacto, por primera vez, dado que los diccionarios monolingües o el bilingüe, de nuestra autoría, publicado ya en el año 2000, resultaba, lógicamente, insuficiente ante un lenguaje lleno de tecnicismos y palabras culturales. A modo de reflexión final, todos estos años de experiencia nos han servido, también, para ser prudentes en la adopción de soluciones, frente a la problemática, que a veces, presenta la lengua de especialidad. Hemos visto que, frecuentemente, se ha incluído de forma masiva el léxico especializado en los diccionarios generales, sin prestar demasiada atención al equilibrio entre los campos semánticos, o a la exactitud de las equivalencias proporcionadas. Por esta razón, hemos intentado no incurrir en el mismo error, y esperamos que los usuarios de nuestras obras saquen el mayor partido del trabajo realizado. Si se ha conseguido este objetivo, primero y último, nos daremos por satisfechos.

Referencias bibliográficas Buono, Benedict / De Frutos, Mª Consuelo / Gutierrez, Javier / Marchisio, Cristina (2011): Vocabulario Galego-Italiano: Gastronomía. Santiago de Compostela: Servizo de Publicacións e Intercambio científico da USC. Buono, Benedict / Gutiérrez, Javier (en prensa): Vocabulario Galego-Italiano: Pintura. Santiago de Compostela: Servizo de Publicacións e Intercambio científico da USC. Cacheda, Rosa / Domínguez, Ana Mª / González, Isabel (en prensa): Vocabulario GalegoItaliano: Escultura. Santiago de Compostela: Servizo de Publicacións e Intercambio científico da USC. Daviña Facal, Luís (2003): «O tratamento do léxico científico e tecnolóxico nos diccionarios galegos», en María Álvarez de la Granja / Ernesto González Seoane, eds., A estandarización do léxico. Santiago de Compostela: Consello da Cultura Galega - Instituto da Lingua Galega, 447-473. De Frutos, Mª Consuelo / Marchisio, Cristina (en prensa): Vocabulario Galego-Italiano: Arquitectura. Santiago de Compostela: Servizo de Publicacións e Intercambio científico da USC. Domínguez Ferro, Ana Mª (2013): «La terminología específica en los vocabularios bilingües. Presentación del Vocabulario Galego-Italiano: Hostalería», en Mercedes Arriaga, ed., Las relaciones ítalo-españolas: traducción, lengua y literatura. Sevilla: Arcibel, 82-91.

Léxico especializado en la lexicografía gallegoitaliana (algunas reflexiones)

221

Domínguez Ferro, Ana Mª / González, Isabel / Sanmarco Bande, Mª Teresa (2010): Vocabulario Galego-Italiano: Hostalería (aloxamento, restauración, economía, lecer, viaxe). Santiago de Compostela: Servizo de Publicacións e Intercambio científico da USC. ITAGAL = González, I. (dir.) (2000): Dicionario Italiano-Galego. Santiago de Compostela: Grafinova. Disponible en [Consulta: 02/09/2014]. Lombardini, Ugo E. (2008): «Léxico de especialidad, marcas diatécnicas y unidades fraseológicas», en Ugo Lombardini / María Carreras, eds., Limes. Lexicografía y lexicología de las lenguas de especialidad. Monza: Polimetrica, 47-69. Martí, Jacinto / Ruiz, Reyes / Santaella, Juan / Escánez, José (1996): Los lenguajes especiales. Granada: Comares. Sanmarco Bande, Mª Teresa (2008): «Tratamiento de los términos gastronómicos italianos en los diccionarios gallegos», en U. Lombardini / M. Carreras, eds., Limes. Lexicografía y lexicología de las lenguas de especialidad. Monza: Polimetrica, 257-265. VOLGA: González González, Manuel / Santamarina Fernández, Antón (coords.) (2004): Vocabulario ortográfico da lingua galega. A Coruña / Santiago de Compostela: Real Academia Galega - Instituto da Lingua Galega.

 El campo léxico al servicio de la lexicografía: Un análisis contrastivo en torno a algunos subcampos de los verbos de comunicación en alemán y español Vanessa González Ribao Universidade de Santiago de Compostela / Red de Lexicografía RELEX

Kristel Proost Institut für Deutsche Sprache, Mannheim

Lexical fields at the service of lexicography: A contrastive analysis concerning some subfields of communication verbs in German and Spanish Abstract This article presents a system which allows components of situations referred to by communication verbs to be combined in different ways to yield representations of different reference situation types. These are subsequently used as the basis of a comparison of the corresponding communication verbs in German and Spanish. Verbs referring to the same special reference situation type are shown to constitute a lexical field. Concentrating on the lexical fields of German and Spanish forbid-verbs, specific types of inform-verbs and persuade-verbs, we show that the procedure applied may in principle be used to cover the whole inventory of communication verbs in a bilingual conceptual (i.e. onomasiological) dictionary. Keywords Speech act verbs, communication verbs, concepts of verbal communication, reference situation types, lexical fields, lexical gaps, synonymy, lexicalization, semantic network.

1. Introducción En este artículo se va a presentar un concepto de campo léxico que dista del concepto tradicional (cfr. Lutzeier 1981, 1995) en la medida en que es tratado desde un punto de vista onomasiológico o conceptual y no semasiológico. El propósito principal es mostrar que la noción de campo léxico, al ser combinada con con la idea de que la sinonimia es un fenómeno gradual, puede utilizarse para estructurar áreas enteras del léxico de una lengua, incluyendo aquellas que, como en el caso de las expresiones comunicativas, contienen gran número de expresiones léxicas. Este área del léxico ya ha sido trabajada dentro de la tradición lingüística angloamericana en



224

Vanessa González Ribao / Kristel Proost

obras como las de Ballmer / Brennenstuhl (1981), Wierzbicka (1987) y Vanderveken (1990), así como en la lexicografía germana en el Handbuch deutscher Kommunikationsverben (Manual de verbos comunicativos del alemán) (Harras et al. 2004, 2007) y su versión electrónica Kommunikationsverben disponible dentro del portal lexicográfico en línea OWID (Online Wortschatz- und Informationssytem Deutsch) (cfr. Müller-Spitzer / Proost 2013). Concretamente en este último se describen las expresiones comunicativas en relación a “situaciones específicas de referencia” (spezielle Bezugssituationstypen), de manera que todos los verbos que pueden utilizarse para describir una determinada situación específica de referencia constituyen un campo léxico. Las situaciones de referencia pueden entenderse igualmente como conceptos de comunicación verbal. Estos conceptos son abstracciones mentales de situaciones en las que un hablante (H) se dirige a un oyente (O) emitiendo un enunciado (E), que generalmente contiene una proposición (P). Como se ilustrará en el apartado 3, los campos léxicos descritos en el Handbuch deutscher Kommunikationsverben derivan de un sistema conceptual que divide y estructura el área de las expresiones comunicativas jerárquicamente, es decir, en múltiples subcampos léxicos cada vez más específicos. Además de mostrar la utilidad de los campos léxicos para una representación lexicográfica de los verbos de comunicación, se pretende explicar cómo el inventario de las situaciones de referencia presentado en el Handbuch deutscher Kommunikationsverben puede utilizarse como base conceptual, es decir, como tertium comparationis (cfr. Boas 2010; Wotjak 2011) o “medio estructurador común” (common structuring device) en términos de Boas (2001), para un estudio comparativo entre dos (o más) lenguas. En concreto, lo que aquí se pretende es tratar desde un punto de vista contrastivo el área de las expresiones comunicativas para el idioma español tomando como referencia la obra alemana. Al partir de un enfoque conceptual, al contrario que de una perspectiva semasiológica, es posible ir más allá del inventario léxico conformado por las expresiones existentes en una o en las dos lenguas objeto de estudio. Es decir, este enfoque conceptual nos permite, entre otras cosas, identificar aquellos casos en los que bien para una o bien para las dos lenguas no existe ninguna expresión léxica que describa una determinada situación comunicativa. De ahí que esta perspectiva se presente como punto de partida idóneo para la elaboración de un diccionario bilingüe. Por ello, el grueso de este artículo está dedicado a reflexionar en torno a ciertos aspectos sobre la aplicación de una estructuración conceptual a la lexicografía bilingüe. Como ejemplo ilustrativo se tomarán algunos subcampos de los verbos de comunicación en alemán y español.

2. Un sistema conceptual para las expresiones comunicativas 2.1 La situación general de referencia La elaboración de un diccionario conceptual supone enfrentarse, por un lado, a la dificultad de “acceder” a los conceptos relacionados con un campo léxico

El campo léxico al servicio de la lexicografía

225

determinado y por otro, a la dificultad de representarlos y describirlos de forma adecuada. Cuando se trata de conceptos que remiten a las acciones verbales, esta tarea conlleva una dificultad añadida, pues dichas acciones no son accesibles directamente a la observación. Por ejemplo, los diccionarios conceptuales dedicados a registrar términos relacionados con entidades tangibles como los diccionarios de términos botánicos o geológicos pueden elaborarse en base a una taxonomía natural. Sin embargo, no existe tal taxonomía para las expresiones relacionadas con la comunicación verbal (cfr. Baumgärtner 1977: 259). La existencia de una taxonomía natural para los verbos de comunicación verbal implicaría, pues, la existencia de una realidad social que ya estuviese estructurada en sí misma por medio de formas inequívocas de interacción social (cfr. ibíd. 259). Debido a la falta de una taxonomía natural para los verbos de comunicación verbal, la realidad social no sirve como punto de partida para la elaboración de un sistema conceptual que pueda utilizarse para representar los conceptos correspondientes. He aquí la diferencia fundamental entre los diccionarios del tipo mencionado en el párrafo anterior y aquellos destinados a describir expresiones comunicativas. Por ello, el sistema conceptual utilizado en el Handbuch deutscher Kommunikationsverben no se basa en las características de las acciones verbales, sino más bien en el significado de los verbos correspondientes a las mismas. Este sistema conceptual toma concretamente como base y punto de partida un tipo de situación denominado “tipo general de situación de referencia” (allgemeiner Bezugssituationstyp). Se trata de un marco situacional común a todos los verbos de comunicación que se caracteriza por la presencia de los siguientes cuatro elementos o roles situacionales (Situationsrollen) que lo constituyen: (i) el hablante (H), (ii) la actitud de este mismo hacia distintos componentes de la situación de referencia (Act(H)), (iii) el oyente (O) y (iv) el enunciado (E). Estos cuatro elementos forman parte de cualquier tipo de situación a la que los verbos de comunicación verbal puedan hacer referencia y por ello, conforman el núcleo común del significado de esos mismos, permitiendo distinguirlos de otro tipo de expresiones léxicas y, especialmente, de otro tipo de verbos (cfr. Verschueren 1980: 51-57; Wierzbicka 1987: 18; Harras et al. 2004: 9-22 y Proost 2006: 651).

2.2 Las situaciones específicas de referencia De los cuatro roles del tipo general de situación de referencia, el rol de la actitud del hablante y el del enunciado pueden ser especificados progresivamente en base a ciertos aspectos de la situación comunicativa. El rol de la actitud del hablante puede especificarse según la actitud de este mismo hacia la proposición del enunciado, según su intención y según sus presuposiciones respecto a determinados aspectos de la situación general de referencia. Ejemplo de ello pueden ser las actitudes del oyente desde el punto de vista del hablante (p. ej. O conoce P, O no conoce P, O es capaz de efectuar P, etc.), los intereses del hablante y del oyente (p. ej.: P atiende al interés de H, P atiende al interés de O, P no atiende al interés de O, etc.) o ciertas características de la proposición (p. ej.: P es el caso, P es de esperar, P cuenta como

226

Vanessa González Ribao / Kristel Proost

algo negativo, P es evidente para H y O, etc.). El rol del enunciado, por su parte, puede ser especificado en base al contenido proposicional (vid. Fig.1).

Fig. 1: Estructura del sistema conceptual para los verbos comunicativos.

Estos aspectos que resultan ser especificaciones de los roles de la actitud comunicativa del hablante y del enunciado pueden diferenciarse a su vez de la siguiente manera: i) El aspecto de la actitud del hablante hacia la proposición puede subclasificarse según

El campo léxico al servicio de la lexicografía

227



los aspectos de la actitud epistémica o cognitiva de este mismo: H conoce P (comunicar, informar) 1 , H desconoce P (preguntar), H considera verdadera: P (afirmar, convencer), H considera falsa: P (mentir), H considera verdadera: no-P (negar), etc. ⋅ la actitud desiderativa del hablante: H quiere: P (pedir, mandar, exigir), H no quiere P (advertir), H quiere: no-P (prohibir), H quiere: hacer P (prometer, obligarse, comprometerse), etc. ⋅ la actitud taxativa del hablante: H opina: P x (tasar, valorar) ⋅ la actitud evaluativa del hablante: H opina: P bien/P mal (alabar, elogiar/reprender, criticar) y ⋅ la actitud emotiva del hablante: H siente: alegría/fastidio/pena a causa de P (felicitar, agradecer/maldecir/lamentar, disculparse). ii) El aspecto de la intención del hablante puede diferenciarse según el objeto de la intención de ese mismo, lo que puede ser bien ⋅ una actitud epistémica o cognitiva del oyente: H quiere que O conozca P (comunicar, informar), H quiere que O entienda P como verdadera (convencer), H quiere que O reconozca la actitud de H hacia P (prometer, obligarse, comprometerse, ofrecer, alabar, elogiar, criticar, reprender) o bien ⋅ una acción que el oyente está obligado o tiene prohibido realizar en el futuro: H quiere que O haga P (pedir, mandar, exigir), H quiere que O no haga P (prohibir), H no quiere que O haga P (advertir). iii) El aspecto de las presuposiciones del hablante puede especificarse desde el punto de vista de ⋅ la expectabilidad de P: P es de esperar en el transcurso normal de los acontecimientos (advertir), P no es de esperar (pedir, mandar, exigir, ofrecer), no-P es de esperar (amonestar), no-P no es de esperar (prohibir), ⋅ características de P: P es el caso (alabar, elogiar, reprender, criticar), P cuenta como malo (acusar, inculpar), ⋅ los intereses del hablante y del oyente: P atiende al interés de O (prometer, obligarse, comprometerse, ofrecer), P no atiende al interés de O (advertir), y ⋅ la actitud epistémica o cognitiva del oyente desde la perspectiva del hablante: O conoce P (preguntar), O no conoce P (comunicar, informar), O considera como verdadera: P (convencer), O considera como verdadera: no-P (insistir). iv) El aspecto de la proposición puede diferenciarse bajo el punto de vista ⋅ del tipo del acontecimiento de P (estado, suceso, acción), ⋅ de la referencia temporal de P (pasado, presente, futuro) y –en el caso de que P sea una acción– –––––––— 1

Los verbos mencionados en paréntesis son ejemplos de expresiones que lexicalizan las categorías correspondientes.

228

Vanessa González Ribao / Kristel Proost



del agente de P (H, O, o una tercera persona).

Los cuatro aspectos en cuestión son resultado de la estratificación y continua jerarquización de las especificaciones previas de los roles situacionales del hablante y del contenido proposicional. Este sistema jerárquico se obtiene por medio de un análisis minimal inductivo de frases que contienen verbos de comunicación. La gramaticalidad de algunas de esas, frente a la agramaticalidad de otras, muestra qué elementos son los relevantes para definir el significado de los verbos contenidos en dichas frases. Para ilustrar este proceso se toman como ejemplo los verbos afirmar y pedir. Al comparar detenidamente entre sí las frases en (1) y (2) se observa que es posible identificar aquellos elementos que constituyen el significado de los verbos en cuestión: (1) a. Pilar afirma que mañana lloverá en Galicia / que casi siempre llueve en Galicia / que ayer llovió en Galicia. b. Pilar afirma que Pablo le ayudó a cocinar ayer / que Pablo le va a ayudar a cocinar mañana / que le va a ayudar a Pablo mañana. c. Pilar afirma que Pablo se encuentra en casa en este momento. (2) a. [Pilar]i le pide a [Pablo]j que [le]i [ayude]j a preparar la comida / [e]j ayudar[le]i a preparar la comida. b. *Pilar le pide a Pablo llover / que llueva. c. *[Pilar]i le pide a [Pablo]j que ella [le]j [ayude]i a preparar la comida / [e]i ayudar[le]j a preparar la comida. d. *Pilar le pide a Pablo que mañana lloverá en Galicia / que casi siempre llueve en Galicia / que ayer llovió en Galicia. La gramaticalidad de (1a)-(1c) y (2a) y la agramaticalidad de las otras frases pone de relieve que los siguientes aspectos son componentes esenciales del significado de afirmar y pedir: afirmar: • Expresa que H (referente del sujeto de la frase principal) considera verdadero el contenido proposicional expresado en la frase subordinada. En otros términos: afirmar lexicaliza una actitud epistémica de H (cfr. (1a) vs. (2d)). • Expresa la intención de H de que O conozca P (cfr. (1a) vs. (2d)). • Permite que el tipo de acontecimiento de P sea una acción (cfr. (1b)), un estado (cfr. (1c) o un suceso (1a)), es decir, el tipo de acontecimiento de P es indeterminado. • En el caso de que P sea una acción, el agente de esta puede ser H, O, o una tercera persona (cfr. (1b)), es decir, el agente de P es indeterminado. • El acontecimiento al que refiere el enunciado de H tiene lugar antes o después o en el mismo momento de la acción verbal efectuada por H, es decir, la referencia temporal de P es indeterminada.

El campo léxico al servicio de la lexicografía

229

pedir: • Expresa una actitud desiderativa de H hacia P: H quiere P (cfr. (2a) vs. (2d)). • Expresa la intención de H de que O haga P (cfr. (2a) vs. (2d)). • Requiere que el tipo de acontecimiento de P sea una acción (cfr. (2a) vs. (2b)). • Requiere que esa acción sea efectuada por O (cfr. (2a) vs. ((2c)). • Requiere que la acción que ha de ser efectuada por O esté situada en el futuro, es decir, en un momento posterior en relación al instante en que H efectúa la acción verbal. Los aspectos (i)-(iv) coinciden con cinco de los seis componentes de la “fuerza ilocutiva” (illocutionary force) descritos por Searle / Vanderveken (1985: 12-20) y Vanderveken (1990: 103-136): el aspecto de la actitud del hablante hacia la proposición se corresponde con el componente de las condiciones de sinceridad, el aspecto de la intención del hablante con el componente del “punto ilocutivo” (illocutionary point), el aspecto de las presuposiciones del hablante se relaciona tanto con el componente del “modo de realización” (mode of achievement) como con el de las condiciones preparatorias, y por último, el aspecto del contenido proposicional guarda relación con el componente de las condiciones del contenido proposicional (cfr. Harras 2001: 26-31).2 En la Figura 1 se representa la estructura del sistema conceptual a modo de esquema. Mientras los aspectos (i)-(iv) se obtienen a partir de un análisis minimal inductivo, sus posibles especificaciones se calculan de forma sistemática y con independencia de las expresiones lexicales existentes en una lengua determinada para el área del léxico que es objeto de estudio. Por ejemplo, para la especificación “tipo de acontecimiento” del aspecto del contenido proposicional pueden postularse los valores “estado”, “suceso” y “acción”. Concretamente, los valores “estado” y “acción” para la especificación del tipo del acontecimiento de P son lexicalizados tanto en alemán como en español por expresiones verbales específicas como kondolieren/dar el pésame y versprechen/prometer respectivamente. Cuando el hablante se encuentra en una situación en la que quiere expresar al oyente que comparte la pena que este siente a causa de la muerte de una persona estrechamente relacionada con el mismo, utiliza expresiones como kondolieren/dar el pésame. En este caso, el acontecimiento al que H se refiere es evidentemente un estado (estar muerto). Por otro lado, mediante el uso de expresiones como versprechen/prometer se está haciendo referencia a situaciones en las que un hablante comunica a un oyente que intenta efectuar una acción determinada en algún momento en el futuro. Por tanto, el acontecimiento al que H se refiere en este caso es una acción. Sin embargo, no existen ni en español ni en alemán expresiones verbales específicas que lexicalicen el valor “suceso” para la especificación del tipo del acontecimiento de P; a –––––––— 2

El único componente de la fuerza ilocutiva, que no tiene equivalente entre los aspectos (i)(iv), es el del grado de fuerza. Este componente no puede obtenerse por medio de un análisis como el ejemplificado en (1) y (2), ya que el grado de intensidad expresado por un verbo no afecta a la gramaticalidad de las frases.

230

Vanessa González Ribao / Kristel Proost

pesar de que una situación tal sea hipotéticamente factible. Este ejemplo pone de relieve que un cálculo sistemático y particular de las especificaciones permite acceder a posibles situaciones comunicativas que no podrían ser contempladas si el inventario de situaciones de referencia estuviese restringido a las expresiones realmente existentes en una lengua determinada.

3. Las situaciones específicas de referencia y su relación con los campos léxicos Al combinar los distintos valores de las especificaciones de las actitudes del hablante y del contenido proposicional pueden obtenerse representaciones de situaciones específicas de referencia que pueden ser descritas a través de distintos tipos específicos de verbos de comunicación. Por ejemplo, afirmar puede utilizarse para hacer referencia a una situación caracterizada por reunir la siguiente combinación de especificaciones: Contenido proposicional Tipo de acontecimiento: Referencia temporal: Agente: Actitudes de H Actitud hacia P: Intención: Presuposiciones:

indeterminado indeterminada indeterminado H considera verdadera: P H quiere: H considera verdadera: P O no conoce: P

Cuadro 1: Situación específica de referencia descrita por afirmar.

Como se ha mencionado anteriormente, los verbos que pueden emplearse para referirse a un mismo tipo de situación específica de referencia constituyen un campo léxico. Por ejemplo, la situación a la que puede hacerse referencia con el verbo pedir (vid. cuadro 2) puede ser descrita igualmente mediante los verbos requerir, solicitar, rogar y encargar. Por consiguiente, todos estos verbos constituyen un mismo campo léxico. Contenido proposicional Tipo de acontecimiento: Referencia temporal: Agente: Actitudes de H Actitud hacia P: Intención: Presuposiciones:

acción futura O H quiere: P H quiere: O haga P P atiende al interés de O o de una persona asociada a él

Cuadro 2: Situación específica de referencia descrita por pedir.

El campo léxico al servicio de la lexicografía

231

4. Las situaciones específicas de referencia como elementos estructuradores del léxico Tomando como ejemplo ilustrativo aquellos verbos que pueden ser utilizados para hacer referencia al acto de habla en el que un hablante expresa una prohibición, se pretende mostrar en este apartado cómo las situaciones específicas de referencia pueden servir para estructurar el área de los verbos de comunicación.

4.1 La posición del subcampo de los verbos alemanes del tipo ‘prohibir’ dentro del campo general de los verbos directivos La siguiente combinación de especificaciones (cfr. Winkler 2007: 182) se corresponde con el concepto que describe aquella situación en la que un hablante dice a un oyente que no quiere que este último realice una determinada acción en el futuro: Contenido proposicional Tipo de acontecimiento: Referencia temporal: Agente: Actitudes de H Actitud hacia P: Intención: Presuposiciones:

acción futura O H quiere: no-P H quiere: O no haga: P P no es de esperar

Cuadro 3: representación de una situación en la que un hablante dice a un oyente que no quiere que este último realice una determinada acción en el futuro.

Esta combinación de especificaciones se lexicaliza en alemán mediante los verbos verbieten (‘prohibir’), verwehren (‘prohibir’), unterbinden1 (‘prohibir’) y untersagen1 (‘prohibir’). Éstos son, por tanto, los verbos que principalmente conforman el subcampo de los verbos del tipo ‘prohibir’ en alemán. Este subcampo se enmarca dentro de un campo mucho más amplio como es el de los verbos directivos, que a su vez constituye una de las cinco clases superiores de los verbos que hacen referencia a los actos de habla y por ello se sitúa consecuentemente en un nivel de generalización mucho más elevado dentro de esta jerarquía (cfr. Winkler 2007: 125). Más concretamente pertenece al campo de verbos directivos que para el aspecto del tipo de contenido de P lexicalizan el valor ‘contenido: información’, distinguiéndose en este nivel del campo de verbos que para este aspecto lexicalizan el valor ‘contenido: cuestión’, es decir, distinguiéndose de todos los verbos del tipo ‘preguntar’. Dentro del campo constituido por los verbos que lexicalizan el valor ‘contenido: información’ para el aspecto del tipo de contenido de P, los verbos del tipo ‘prohibir’ se distinguen por lexicalizar la actitud proposicional ‘H quiere: no-P’. Frente a estos se encuentran, por un lado, los verbos voluntativos (verbos del tipo ‘requerir’ y del tipo ‘rogar’) y por otro, los verbos del

232

Vanessa González Ribao / Kristel Proost

tipo ‘permitir’. Estos dos últimos subcampos distan del primero en la medida en que para la actitud proposicional de H lexicalizan el valor ‘H quiere: P’ y ‘H no quiere: no-P’, respectivamente. En la figura 2 se puede observar de forma esquemática esta organización jerárquica de los verbos directivos y la posición concreta que el subcampo de los verbos del tipo ‘prohibir’ ocupa dentro de la totalidad de la misma.

           

Fig. 2: Posición del subcampo de los verbos del tipo ‘prohibir’ en la totalidad de los verbos directivos.

4.2 Los micro-campos de verbos del tipo ‘prohibir’ en alemán Continuando hacia una progresiva especificación conceptual, pueden identificarse a mayores dentro del micro-campo que es objeto de estudio otros verbos que son parcialmente sinónimos de los mencionados con anterioridad (verbieten, verwehren, unterbinden1 y untersagen1). Se trata de los verbos unterbinden2, untersagen2, abwürgen, einschreiten, eingreifen, verweigern, abschlagen, sich verbitten y sich verwahren. Estos, al igual que los primeros, también pueden emplearse para describir una situación como la arriba representada. Por lo tanto, todos ellos pueden considerarse, en sentido general, sinónimos. No obstante, los verbos del último grupo lexicalizan de forma adicional especificaciones que no se contemplan en el significado de los primeros (cfr. Harras et al. 2004: 136-142; Winkler 2007: 181-187): - Por su parte, unterbinden2 y untersagen2, al contrario que unterbinden1 y untersagen1, se emplean con referencia a situaciones en las que un hablante dice a un oyente que quiere que este último termine de llevar a cabo una acción que ya ha empezado a efectuar. Aún más específico y restringido es el uso de abwürgen, que tan solo puede ser aplicado con referencia a situaciones en las que la acción que el hablante impide llevar a cabo al oyente es una discusión o un debate.

El campo léxico al servicio de la lexicografía

233

- Los verbos verweigern (‘negar algo a alguién’) y abschlagen (‘rechazar’) son verbos “reactivos”, es decir, que se utilizan para describir situaciones en las que el acto de habla mediante el que el hablante prohíbe al oyente hacer algo es una reacción a un enunciado anterior de ese mismo. En la mayoría de los casos se trata de una reacción a un ruego del oyente para poder hacer algo o a un anuncio de ese mismo de que intenta hacer algo.

Fig. 3: Estructura del campo de los verbos del tipo ‘prohibir’ en alemán.

- Por otro lado, los verbos sich verbitten y sich verwahren se utilizan para describir situaciones en las que un hablante dice con énfasis y cierta carga emocional a un oyente que quiere que éste no haga algo. Sin embargo, sich verwahren, a diferencia de sich verbitten, es capaz de expresar adicionalmente un grado de intensidad más elevado. Los verbos de cada uno de los tres grupos arriba mencionados pueden considerarse sinónimos en sentido específico, ya que se se utilizan para referirse a la misma situación específica de referencia. Son, precisamente, los distintos grados de sinonimia los que permiten ordenar de forma jerárquica las distintas situaciones específicas de referencia. La división del campo de los verbos alemanes del tipo ‘prohibir’ en sus distintos subcampos está representada de forma gráfica en la Figura 3. En la Figura 3 queda reflejado el hecho de que las diferentes especificaciones y sus combinaciones establecen distintos micro-campos que se corresponden con las distintas situaciones específicas de referencia que pueden ser descritas por los verbos que los constituyen. Por ejemplo, la situación a la que puede hacerse referencia con

234

Vanessa González Ribao / Kristel Proost

los verbos unterbinden2, untersagen2, einschreiten y eingreifen se representaría de la siguiente manera: Contenido proposicional Tipo de acontecimiento: Referencia temporal: Agente: Actitudes de H Actitud hacia P: Intención: Presuposiciones:

acción presente O H quiere: no-P H quiere: O no haga: P P no es de esperar

Cuadro 4: Situación específica de referencia descrita por unterbinden2, untersagen2, einschreiten y eingreifen.

En comparación con los verbos anteriores, abwürgen solo se utiliza con referencia a situaciones en las que P es un debate o una conversación, por lo que describe una situación como la ilustrada en el cuadro 5: Contenido proposicional Tipo de acontecimiento: Referencia temporal: Agente: P: Actitudes de H Actitud hacia P: Intención: Presuposiciones:

acción presente O discusión, conversación H quiere: no-P H quiere: O no haga: P P no es de esperar

Cuadro 5: Situación específica de referencia descrita por abwürgen.



Los verbos polisémicos como unterbinden y untersagen pueden utilizarse con referencia a distintas situaciones específicas de referencia. En el Handbuch deutscher Kommunikationsverben, las diferentes acepciones de los verbos polisémicos fueron diferenciadas en base a ejemplos extraídos de un corpus lingüístico. En los ejemplos (3)-(4) se ilustran las dos posibles acepciones del verbo unterbinden: ‘decir a alguien que no haga algo’ (unterbinden1, vid. ej. (3)) y ‘decir a alguien que deje de continuar realizando una acción que ya había empezado a efectuar en el pasado’ (unterbinden2; vid. ej. (4)):3 (3) Gerade deshalb wäre es falsch, eine notwendige Diskussion über das Sterben, […], von vornherein zu verhindern. Falsch wäre es auch, eine solche Diskussion durch eine voreilige Änderung des Strafgesetzes zu unterbinden. [Protokoll der Sitzung des Parlaments Landtag Niedersachsen am 05.10.2005. –––––––— 3

Todos los ejemplos alemanes mencionados en este artículo fueron seleccionados de DeReKo (Deutsches Referenzkorpus), el corpus del Institut für Deutsche Sprache.

El campo léxico al servicio de la lexicografía

235

70. Sitzung der 15. Wahlperiode 2003-2008. Plenarprotokoll, Hannover, 2005 [S. 8045]] Precisamente por eso sería erróneo evitar desde el principio una discusión sobre la muerte. Erróneo sería también impedir tal discusión por medio de un cambio precipitado de la ley penal. (4) Das Innenministerium hatte im Januar 2008 nach einer Interessenabwägung eine Sperrerklärung gemäß Paragraf 96 der Strafprozessordnung abgegeben. Danach kann die Auslieferung von Akten bei Behörden unterbunden werden, wenn deren oberste Dienstbehörde erklärt, dass die Veröffentlichung «dem Wohl des Bundes oder eines deutschen Landes Nachteile bereiten würde». [dpa, 29.08.2009; (Zusammenfassung 1400) Buback-Sohn will Klarheit über Mord an seinem Vater] El Ministerio del Interior había emitido en Enero del 2008, tras sopesar intereses, un Comunicado Oficial de Censura conforme a lo dispuesto en el Artículo 96 de Código de Procedimiento Penal. Por consiguiente, se puede impedir la entrega de las actas en la Administración, si las autoridades superiores declaran, que tal publicación “resultaría perjudicial para el bienestar del Estado Federal o alguno de sus Länder”. Los verbos que pertenecen al mismo campo pueden distinguirse entre sí por otras características adicionales que no conciernen a la situación a la que se está haciendo referencia mediante unos verbos determinados, sino más bien a las propiedades léxicas de estos mismos. Pueden diferenciarse, por ejemplo, en su estructura argumental, en la presencia o ausencia de características como la polisemia o la resultatividad, en la posibilidad de ser usado en voz pasiva o de forma performativa, etc. En el caso concreto de los verbos del subcampo objeto de estudio (unterbinden2, untersagen2, einschreiten, eingreifen, abwürgen) tan solo unterbinden2 y abwürgen son resultativos. Esta es la propiedad que los diferencia de los otros verbos.

5. Las situaciones específicas de referencia como base para realizar estudios comparativos Como se ha estado defendiendo a lo largo de este artículo, los sistemas conceptuales permiten ir más allá de las expresiones realmente existentes en una lengua determinada y a consecuencia de ello, pueden utilizarse para comparar el inventario de las expresiones léxicas en dos o más lenguas o en ciertos subcampos de estas. Para ilustrar de forma concreta dicha hipótesis se compararán en este apartado el conjunto de verbos que lexicalizan en ambas lenguas los conceptos DECIR A ALGUIEN QUE NO EFECTÚE UNA ACCIÓN QUE INTENTABA HACER, COMUNICAR A ALGUIEN UNA INFORMACIÓN QUE NO DEBERÍA SABER y APARTAR A ALGUIEN DE SU INTENCIÓN DE HACER ALGO.

236

Vanessa González Ribao / Kristel Proost

5.1 La estructura del campo de los verbos del tipo ‘prohibir’ desde el punto de vista contrastivo (español-alemán) En la Figura 4 se reflejan los resultados obtenidos tras aplicar para el idioma español los mismos parámetros empleados en la Figura 3 como base para estructurar el campo de los verbos de tipo prohibir en alemán:

           

Fig. 4: Estructura del campo de los verbos del tipo ‘prohibir’ en español.

Al comparar la Figura 3 y la Figura 4 entre sí pueden observarse las siguientes diferencias entre los verbos alemanes y los verbos españoles que expresan el concepto DECIR A ALGUIEN QUE NO EFECTÚE UNA ACCIÓN QUE INTENTABA HACER: No todos los verbos que existen en una de las dos lenguas tienen equivalente en la otra. Dentro del campo de los verbos que lexicalizan el concepto DECIR A ALGUIEN QUE NO EFECTÚE UNA ACCIÓN QUE INTENTABA HACER existen vacíos léxicos en ambas lenguas: - Por un lado, no existe en español equivalente léxico alguno para el verbo abwürgen, es decir, ningún verbo lexicaliza de forma específica el concepto IMPEDIR A ALGUIEN A CONTINUAR UNA CONVERSACIÓN YA EMPEZADA. - Los verbos alemanes que lexicalizan el concepto PROHIBIR CON COMPONENTE EMOCIONAL Y CON INSISTENCIA A ALGUIEN HACER ALGO, sich verbitten y sich verwahren, tampoco encuentran un equivalente léxico en español. - Por otro lado, el verbo español desestimar, que expresa el concepto PROHIBIR ALGO EN UN CONTEXTO JURÍDICO, no tiene equivalente léxico en alemán. El fenómeno de los vacíos léxicos es de gran relevancia desde una perspectiva cognitiva. En este sentido, Slobin (2003: 161) defiende que el tipo de expresión que codifica un concepto determinado es un indicador de la capacidad de este concepto de ser codificado (codability), ya que, según Slobin, un concepto codificado por una

El campo léxico al servicio de la lexicografía

237

expresión léxica, es más codificable que un concepto codificado por una frase o una oración, es decir, por una combinación libre de palabras: “A concept expressed by a single word is more codable than one expressed by a phrase or clause (e.g. run versus while running)” (ibíd.). Slobin afirma que los hablantes de una lengua determinada hacen un mayor uso de aquellas categorías que son más codificables en ella (cfr. ibíd.: 161-164). Ejemplos de categorías especialmente codificables son la categoría MANERA DE MOVIMIENTO en inglés y alemán (cfr. Slobin 2003: 164-176 para inglés y Olsen 1996: 314 para alemán) y la categoría RUTA DE MOVIMIENTO en francés y español (cfr. Slobin 2003: 163; véase Talmy 1985 para una comparación de los verbos de movimiento en inglés y español). En concreto, Slobin defiende que habitualmente la atención de los hablantes de una lengua determinada recae de forma especial sobre aquellas categorías que pueden ser muy codificables y que, a consecuencia de ello, dichas categorías llegan a ser salientes para los hablantes de esa lengua. Para los hablantes del inglés, por ejemplo, la categoría MANERA DE MOVIMIENTO es, en términos de Slobin, una categoría mental saliente. Esta teoría de Slobin pone precisamente de relieve la gran importancia del papel que los vacíos léxicos desempeñan dentro de la lingüística cognitiva, ya que si en verdad las categorías que se caracterizan por ser muy codificables en una lengua determinada resultan ser, a consecuencia de ello, salientes en la mente de los hablantes de la misma y si también es cierto que las categorías codificadas por expresiones léxicas específicas son más codificables que las categorías codificadas por una combinación libre de palabras, entonces se podría afirmar que la presencia o ausencia de una expresión léxica para expresar un concepto determinado sirve para indicar el grado de saliencia mental de este concepto concreto (vid. Proost 2007: 90-95 para una discusión extensa en torno a la relevancia de los vacíos léxicos). Este fenómeno también concierne de forma especial a la lexicografía, pues los diccionarios bi- o multilingües se ven obligados a ofrecer alguna alternativa de traducción al usuario, incluso en aquellos casos en los que para una expresión de la lengua de origen no existe equivalente alguno en la lengua meta. En la mayoría de las ocasiones se opta por recurrir a una expresión de tipo general y complementarla con una descripción perifrástica, como por ejemplo: ‘impedir a alguien continuar una conversación o un debate’ para abwürgen o ‘prohibir con énfasis y cierta carga emocional a alguien hacer algo’ para sich verwahren. De ahí la relevancia de los vacíos léxicos en esta disciplina. Además de revelar la existencia de los vacíos léxicos arriba mencionados, la comparación entre las figuras 3 (alemán) y 4 (español) permite observar que los verbos existentes en ambas lenguas para expresar un mismo concepto no siempre coinciden total y plenamente en la lexicalización del mismo. Por ejemplo, el verbo impedir se corresponde tan solo parcialmente con sus equivalentes alemanes hindern y verhindern, ya que este también puede utilizarse con referencia a acciones verbales mientras los otros se emplean para hacer referencia a situaciones en las que alguien hace algo con la intención de que otra persona no pueda efectuar la acción que originalmente intentaba llevar a cabo. El ejemplo (5), extraído de WebCorp, ilustra el uso de impedir como verbo de comunicación:

238

Vanessa González Ribao / Kristel Proost

(5) Uribe me impidió ir a sacar a Iván Márquez de Venezuela: Gabriel Silva. El exministro de Defensa dijo que había un estudio de inteligencia muy preciso para capturar a Márquez, pero Uribe no permitió ejecutar la operación. [WebCorp: Caracol, 14/11/2012. ] Para representar otras situaciones específicas de referencia y examinar a su vez cuáles son los verbos que pueden utilizarse en alemán y español para hacer referencia a cada una de ellas, se va a proceder en lo sucesivo de igual manera, es decir, combinando los diferentes valores para las especificaciones de los aspectos de la actitud proposicional de H, de su intención, de sus presuposiciones y del contenido proposicional.

5.2 La estructura del campo de los verbos que lexicalizan el concepto

COMUNICAR A

ALGUIEN UNA INFORMACIÓN QUE NO DEBERÍA SABER en español y alemán

Las situaciones en las que un hablante quiere comunicarle a un oyente una información (respecto a un tipo de acontecimiento de tipo indeterminado) que este último no debería saber, se representarían mediante la combinación de especificaciones descritas en al cuadro 6 (cfr. Harras et al. 2004: 82-83; Harras 2007: 115-116): Contenido proposicional Tipo de acontecimiento: Referencia temporal: Agente: Actitudes de H Actitud hacia P: Intención: Presuposiciones: Especificación de P:

no determinado no determinado no determinado H conoce: P H quiere: O conozca: P 1. O no conoce: P 2. conocer P atiende al interés de O P no debería ser sabido por O

Cuadro 6: Situación específica de referencia descrita por zutragen y hinterbringen.

Las situaciones correspondientes a la combinación de especificaciones representada en el cuadro 6 pueden ser designadas por los verbos zutragen y hinterbingen en alemán, no obstante, el español carece de algún verbo con el que se pueda hacer referencia de forma específica a dichas situaciones. Por una parte, a pesar de que el verbo filtrar se parece mucho a ambos verbos alemanes en cuanto a su significado, éste se distingue de los otros por ser utilizado con referencia a situaciones en las que un hablante comunica a varios oyentes, normalmente al público general, una información secreta. Por otra parte, los verbos chivarse en

El campo léxico al servicio de la lexicografía

239

español y petzen en alemán se diferencian de los verbos alemanes arriba mencionados en que H solamente puede ser un niño o un joven, es decir, están restringidos a un contexto de uso infantil. Por último, zutragen y hinterbringen también se diferencian de los verbos delatar y verraten en que estos últimos describen situaciones en las que P es una información secreta. Aunque, en un principio, no parece que existan verbos españoles equivalentes a zutragen y hinterbringen, el vacío en cuestión puede cubrirse en un registro lingüístico coloquial por la expresión fija irle con el cuento a alguien. Puesto que las expresiones fraseológicas también son elementos del léxico, puede afirmarse que la ausencia de verbos españoles equivalentes a zutragen y hinterbringen no representa realmente un vacío genuino en el léxico del español, sino más bien un vacío en el inventario de los verbos existentes en español para este concepto concreto.

5.3 La estructura del campo de los verbos que describen el concepto ALGUIEN DE SU INTENCIÓN DE HACER ALGO en español

APARTAR A

y alemán

El concepto de un acto de habla llevado a cabo por un hablante que quiere que el oyente efectúe una acción futura que en un principio este último no quería realizar, se lexicaliza en alemán mediante los verbos directivos überreden, bereden, breitschlagen, beschwatzen y (he)rumkriegen y en español con los verbos (igualmente directivos) persuadir, convencer, engatusar, enrollar, liar y enredar. No obstante, los verbos persuadir y convencer pueden lexicalizar además un concepto de un acto de habla asertivo, como muestran los siguientes ejemplos extraídos del CREA: (6) La BBC espera batir todos los récords de audiencia el lunes que viene con la entrevista a Diana. La versión oficial es que Martin Bashir, un productor de la cadena que estaba haciendo una serie sobre la “crisis constitucional de la monarquía británica”, persuadió a la princesa de que sería una buena idea “abrir su corazón” al país, al igual que hizo Carlos el año pasado. [CREA: La Vanguardia, 16/11/1995: Rafael Ramos] (7) Ella venía de Sarajevo y me convenció de la urgencia de testimoniar sobre el genocidio y los desastres del asedio. [CREA: El Mundo, 17/06/1995: Juan Goytisolo] A diferencia de estos últimos, los verbos alemanes überreden y überzeugen no son polisémicos, sino que ha de hacerse uso, por un lado, de überreden para hacer referencia a actos directivos y, por otro, de überzeugen para actos asertivos. Las situaciones que pueden ser designadas mediante todos los verbos arriba mencionados reúnen la combinación de especificaciones ilustrada en el cuadro 7 (cfr. Harras et al. 2004: 196-197; Winkler 2007: 140-141): Contenido proposicional Tipo de acontecimiento: Referencia temporal: Agente:

acción futura O

240

Vanessa González Ribao / Kristel Proost

Actitudes de H Actitud hacia P: Intención: Presuposiciones: Cantidad del enunciado:

H quiere: P H quiere: O haga: P P no es de esperar varios enunciados

Cuadro 7: Situación específica de referencia descrita por überreden/persuadir, etc.

Al sustituir los valores descritos en el cuadro 7 para la actitud del hablante hacia la proposición, la intención del hablante y sus presuposiciones por los valores ‘H quiere: no-P’, ‘H quiere: O no haga: P’ y ‘P es de esperar’ respectivamente, se hallan los antónimos de überreden/persuadir. Es decir, al combinar estos valores con los valores para las especificaciones del contenido proposicional mencionados en el cuadro 7 se obtiene la representación de una situación en la que un hablante dice a un oyente que no quiere que haga algo que este último intentaba hacer. La figura 5 representa los dos tipos de situaciones junto con los verbos alemanes y españoles correspondientes a ellas.

Fig. 5: Estructura del campo de los verbos que lexicalizan el concepto APARTAR A ALGUIEN DE SU INTENCIÓN DE HACER ALGO en alemán y español.

Como se puede observar en la figura 5, se emplea en español el verbo disuadir para describir la situación arriba mencionada, o lo que es lo mismo, para lexicalizar el concepto de un acto de habla efectuado por un hablante que dice a un oyente que no quiere que lleve a cabo una acción que este último ya intentaba realizar. Por el contrario, en alemán no existe ningún verbo para expresar este concepto.

El campo léxico al servicio de la lexicografía

241

6. Conclusión Los análisis contrastivos de los subcampos de los verbos de comunicación presentados a lo largo de este artículo son prueba de que el sistema conceptual en el que se basa el Handbuch deutscher Kommunikationsverben se presenta como punto de partida idóneo para la elaboración de un diccionario bilingüe conceptual. Como ya se había adelantado más arriba, las situaciones específicas de referencia pueden utilizarse como tertium comparationis (cfr. Boas 2010; Wotjak 2011) o “medio estructurador común” (common structuring device) en términos de Boas (2001) para la comparación de los verbos empleados en ambas lenguas con referencia a estas mismas. Cuanto más específicas son las situaciones de referencia, más sutiles son a su vez las diferencias de significado entre los verbos que se utilizan para describirlas. Son pues los micro-campos, los que precisamente y en especial, permiten registrar las diferencias más sutiles. Concretamente, la parte conceptual del significado de un verbo determinado se deduce de la posición que éste ocupa dentro de los diversos subcampos jerárquicos y de forma particular, dentro del microcampo al que pertenece. Este hecho simplifica la tarea de reconocer y relacionar aquellos verbos que se encuentran estrechamente ligados entre sí con respecto a su significado. Tal hecho resulta especialmente importante en aquellos casos en los que para lexicalizar un concepto determinado, una de las dos lenguas carece de un lexema verbal que, sin embargo, sí se puede registrar en la otra. De facto, los análisis de los subcampos realizados en apartados anteriores sugieren que este tipo de casos podrían ser más frecuentes de lo que a priori cabría esperar. Ante tales situaciones, los diccionarios semasiológicos se ven obligados a idear una solución ad hoc para cubrir dichos vacíos léxicos. Por lo general, la alternativa más obvia consiste en recurrir (debido a la falta de un equivalente directo) a una expresión de significado más general que la expresión existente en la lengua de partida. Este es, por ejemplo, el caso de los verbos sich verbitten, sich verwahren y abwürgen, los cuales podrían ser definidos o explicados por medio de perífrasis del tipo ‘requerir a alguien con cierta carga emocional que no haga algo’, ‘requerir a alguien con énfasis y con cierta carga emocional que no haga algo’ e ‘impedir a alguien que continúe una conversación o un debate’ respectivamente. Sin embargo, las perífrasis pueden alcanzar un grado de complejidad tal que en ocasiones resulta realmente difícil para el usuario llegar a comprenderlas. Ejemplo de ello es el caso del verbo disuadir. Éste tendría que ser definido en un diccionario semasiológico bilingüe por una perífrasis como ‘inducir a alguien por medio de varios enunciados a desistir de sus propósitos iniciales de llevar a cabo una acción determinada’. Parece evidente que el concepto en cuestión puede ser explicado de forma más sencilla por medio de una comparación de las situaciones específicas a las que se refieren tanto el verbo disuadir como su antónimo persuadir que, a difererencia del primero, tiene un equivalente en alemán (überreden). Dentro de las ventajas de una presentación del léxico en forma de red, se encuentran precisamente la posibilidad de incluir los vacíos léxicos y la de representar las diferencias semánticas más sutiles que se dan entre las expresiones

242

Vanessa González Ribao / Kristel Proost

léxicas registradas para un área determinada del léxico; tal como defiende Engelberg (2014: 250): Strukturierte Darstellungen von Teilwortschätzen, semantisch-ontologischen Verteilungen, Entwicklungen von Wortbildungsmustern oder des Ausbaus von Systemen semantischer Relationen sind als integrale Bestandteile lexikografischer Informationssysteme die Ausnahme. Dabei könnte gerade dadurch die durch die Wortzentriertheit und alphabetische Anordnung atomisierte Struktur des Wortschatzes in einer Weise aufgebrochen werden wie es der tatsächlichen Vernetztheit des Lexikons entspricht. Representaciones estructuradas de las distintas áreas del léxico, de distribuciones semánticoontológicas, de la evolución de modelos en torno a la formación de palabras o de sistemas de relaciones semánticas tan solo forman parte integral de los sistemas de información lexicográficos a modo de excepción. Sin embargo, es precisamente mediante estos aspectos con los que se podría dar fin a la tradicional estructuración del léxico atomizada a causa del “palabra-centrismo” y la organización alfabética, de tal modo que esta estructuración represente la verdadera conexión interdependiente del léxico.

Ejemplo ilustrativo de esta idea es el Handbuch deutscher Kommunikationsverben y su versión electrónica Kommunikationsverben (cfr. Müller-Spitzer / Proost 2013), donde se representa el léxico de los verbos comunicativos alemanes en forma de red semántica. Otras obras lexicográficas que también representan el léxico en forma de red semántica son, por ejemplo, FrameNet y WordNet para el inglés (y sus variantes para otras lenguas como GermaNet para el alemán y FrameNet for Greek para el griego moderno (cfr. Dalpanagioti 2013)), el lexicón del proyecto Salsa para el alemán y el proyecto contrastivo español-alemán DICONALE (cfr. Meliss en prensa, en elaboración) cuya presentación lexicográfica se encuentra en desarrollo. No solo en lexicología y lexicografía sino también en el ámbito de la didáctica y la pedagogía (cfr. Salvador 1985: 67-72) se tiene cada vez más en cuenta la importancia y necesidad de una organización onomasiológica o conceptual del léxico, tal como indica Escobedo (1994: 57): Es bien patente, pues, que una buena parte del interés práctico de la aplicación de los campos léxicos estriba en ofrecer sus logros para una mejor y más moderna confección de diccionarios […] No cabe duda de que otra modalidad de lingüística aplicada en la que los campos léxicos tienen una relevancia particular es en la enseñanza y aprendizaje del léxico en la Enseñanza General Básica y en el Bachillerato […] Creo que es más pedagógico y útil el estudio del léxico por familias o microsistemas, estructurados en los campos léxicos.

La aplicación de esta idea ha conducido a una renovación lexicográfica que se puede observar en la reciente tendencia a incorporar una parte complementaria de carácter onomasiológico dentro de diccionarios semasiológicos ya consolidados, como es el caso del Wörterbuch Deutsch als Fremdsprache (‘Diccionario del alemán como lengua extranjera’) de Kempcke / Seelig / Wolf (2000: XI): Wenngleich das Wortfeld keine so verlässliche Grösse wie die Wortfamilie od. das Wortnetz darstellt und die Gliederungen von Wortfeldern ganz unterschiedlich gehandhabt werden [...] bieten Wortfelder sachliche und semantische Nachbarschaft, die

El campo léxico al servicio de la lexicografía

243

dem Benutzer weitere Möglichkeiten der Systemzusammenhänge eröffnet. Wir haben daher in einem Anhang über 80 Wortfelder aus den Stichwörtern dieses Wörterbuchs zusammengestellt. Aunque si bien el campo léxico no es una unidad tan fiable como la familia léxica o la red de palabras y las estructuraciones de los campos léxicos se organizan de forma muy dispar […], los campos léxicos presentan relaciones semánticas y de vecindad entre los referentes de las expresiones léxicas que ofrecen al usuario nuevas posibilidades de [reconocer las] conexiones del sistema. De ahí que nosotros a modo de apéndice hayamos clasificado cada una de las entradas de este diccionario en más de 80 campos léxicos.

Los beneficios de estructurar un diccionario en base a campos léxicos se pueden observar de modo aún más claro al establecer una relación entre los campos léxicos y los conceptos correspondientes.

Referencias bibliográficas Ballmer, Thomas / Brennenstuhl, Waldtraud (1981): Speech Act Classification: A Study in the Lexical Analysis of English Speech Activity Verbs. (=Springer Series in Language and Communication; 8) Berlin/Heidelberg/New York: Springer. Baumgärtner, Klaus (1977): «Lexikalische Systeme möglicher Performative», Zeitschrift für Germanistische Linguistik, 5, 257-276. Boas, Hans C. (2001): «Frame Semantics as a Framework for describing Polysemy and Syntactic Structures of English and German Motion Verbs in Contrastive Computational Lexicography », en Paul Rayson et al., eds., Proceedings of Corpus Linguistics 2001. Lancaster, U.K: University, 64-73. — (2010). «Comparing constructions across languages», en Hans C. Boas, ed., Contrastive Studies in Construction Grammar. Amsterdam/Philadelphia: John Benjamins, 1-20. CREA. Corpus de Referencia del Español Actual: l [Consulta: 21/09/2014]. Dalpanagioti, Thomai (2013): «Frame-semantic issues in building a bilingual lexicographic resource. A case study of Greek and English motion verbs», Constructions and Frames 5:1, 1-34. DeReKo. Das Deutsche Referenzkorpus: [Consulta: 21/09/2014]. Engelberg, Stefan (2014): «Gegenwart und Zukunft der Abteilung Lexik am IDS: Plädoyer für eine Lexikographie der Sprachdynamik», en Institut für Deutsche Sprache, ed., Ansichten und Einsichten: 50 Jahre Institut für Deutsche Sprache. Mannheim: IDS, 243-253. Escobedo Rodríguez, Antonio (1994): Estudios de Lexicología y Lexicografía. Almería: Universidad, Servicio de Publicaciones. Fontenelle, Thierry (2012): «WordNet, FrameNet and other semantic Networks in the International Journal of Lexicography - the net result? », International Journal of Lexicography, Vol. 25 No. 4. Oxford: Oxford University Press, 437-449. FrameNet: [Consulta: 21/09/2014]. Kempcke, Günter / Seelig, Barbara / Wolf, Birgit (2000): Wörterbuch Deutsch als Fremdsprache. Berlin: de Gruyter. Kommunikationsverben. Versión electrónica del Handbuch deutscher Kommunikations-verben (Harras et al. 2004, 2007) revisada y actualizada por Kristel Proost: [Consulta: 21/09/2014].

244

Vanessa González Ribao / Kristel Proost

GermaNet: [Consulta: 21/09/2014]. Harras, Gisela (2001): «Performativität, Sprechakte und Sprechaktverben», en Gisela Harras,ed., Kommunikationsverben: Konzeptuelle Ordnung und semantische Repräsentation. Tübingen: Narr, 11-32. — (2007): «Lexikalische Strukturen der Repräsentative», en Gisela Harras / Kristel Proost / Edeltraud Winkler (2007): Handbuch deutscher Kommunikations-verben. Teil II: Lexikalische Strukturen. Berlin/New York: de Gruyter, 73-124. Harras, Gisela / Winkler, Edeltraud / Erb, Sabine / Proost, Kristel (2004): Handbuch deutscher Kommunikationsverben. Teil I: Wörterbuch. Berlin/New York: de Gruyter. Harras, Gisela / Proost, Kristel / Winkler, Edeltraud (2007): Handbuch deutscher Kommunikationsverben. Teil II: Lexikalische Strukturen. Berlin/New York: de Gruyter. Lutzeier, Peter R. (1981): Wort und Feld: Wortsemantische Fragestellungen mit besonderer Berücksichtigung des Wortfeldbegriffs. Tübingen: Niemeyer. — (1995): «Lexikalische Felder – was sie waren, was sie sind und was sie sein könnten», en Gisela Harras, ed., Die Ordnung der Wörter: Kognitive und lexikalische Strukturen. Berlin/New York: de Gruyter, 4-29. Meliss, Meike (en prensa): «(Vor)überlegungen zu einem zweisprachigen Produktionslernerwörterbuch für das Sprachenpaar DaF und ELE», en Daniel Reimann, ed., Kontrastive Linguistik und Fremdsprachendidaktik Iberoromanisch – Deutsch. Studien zu Morphosyntax, nonverbaler Kommunikation, Mediensprache, Lexikographie und Mehrsprachigkeitsdidaktik (Spanisch/Portugiesisch/Deutsch). Tübingen: Narr. — (en elaboración): «Argumentstrukturen, Valenz und Konstruktionen im Umfeld der WAHRNEHMUNG: Eine korpusbasierte Studie deutscher und spanischer Verben im Kontrast.», en Stefan Engelberg et al., eds., Argumentstrukturen zwischen Valenz und Konstruktionen. Tübingen: Narr. Müller-Spitzer, Carolin / Proost, Kristel (2013): «Kommunikationsverben in OWID: An Online Reference Work of German Communication Verbs with Advanced Access Structures», en Iztok Kosem et al., eds., Electronic lexicography in the 21st century: thinking outside the paper. Proceedings of the eLex 2013 Conference, 17-19 October 2013, Tallinn, Estonia. Ljubljana/Tallinn: Trojina, Institute for Applied Slovene Studies/Eesti Keele Instituut, 296309. Olsen, Susan (1996): «Pleonastische Direktionale», en Gisela Harras / Manfred Bierwisch, eds., Wenn die Semantik arbeitet: Klaus Baumgärtner zum 65. Geburtstag. Tübingen: Niemeyer, 303-329. Proost, Kristel (2006): «Speech Act Verbs», en Keith Brown, ed. jefe, Encyclopedia of Language and Linguistics, 2ª ed., XI. Oxford: Elsevier, 651-656. — (2007): Conceptual structure in lexical items: The lexicalisation of communication concepts in English, German and Dutch. Amsterdam/Philadelphia: John Benjamins. Salsa. The Saarbrücken Lexical Semantics Acquisition Project: [Consulta: 21/09/2014]. Salvador, Gregorio (1985): Semántica y Lexicología del Español: Estudios y Lecciones. Madrid: Paraninfo. Searle, John R. / Vanderveken, Daniel (1985): Foundations of Illocutionary Logic. Cambridge: CUP. Slobin, Dan I. (2003): «Language and Thought Online: Cognitive Consequences of Linguistic Relativity», en Dedre Gentner / Susan Goldin-Meadow, eds., Language in Mind: Advances in the Investigation of Language and Thought. Cambridge/MA: MIT Press, 157-192. Talmy, Leonard (1985): «Lexicalization Patterns: Semantic Structure in Lexical Forms», en Timothy Shopen, ed., Language Typology and Syntactic Description. Vol. 3. Cambridge: CUP, 57-149.

El campo léxico al servicio de la lexicografía

245

Vanderveken, Daniel (1990): Meaning and Speech Acts. Vol. I: Principles of Language Use. Cambridge: CUP. Verschueren, Jef (1980): On Speech Act Verbs. Amsterdam: John Benjamins. Winkler, Edeltraud (2007): «Lexikalische Strukturen der Direktive», en Gisela Harras / Kristel Proost / Edeltraud Winkler, Handbuch deutscher Kommunikationsverben. Teil II: Lexikalische Strukturen. Berlin/New York: de Gruyter, 125-221. Wierzbicka, Anna (1987): English speech act verbs: A semantic dictionary. Sydney: Academic Press. WordNet. A Lexical database for English: [Consulta: 21/09/ 2014]. Wotjak, Gerd (2011): «Las lenguas ¿comparables o incomparables? À la recherche du tertium comparationis (perdu)», en Eva Lavric / Wolfgang Pöckl / Florian Schallhart, eds., Comparatio Delectat: Akten der VI. internationalen Arbeitstagung zum romanischdeutschen und innerromanischen Sprachvergleich. Innsbruck, 3.-5. September 2008, vol. 1. Frankfurt: Peter Lang, 19-60.

 Sobre algunos conflictos en la 'pre'-lexicografía: la selección de corpus para la elaboración de un diccionario contrastivo alemán-español Vanessa González Ribao Universidade de Santiago de Compostela / Red de Lexicografía RELEX

On some conflicts in 'pre'-lexicography: Corpus selection for the development of a GermanSpanish contrastive dictionary Abstract This article is concerned with the choice of a corpus to be used as the empirical basis of a bilingual, bidirectional and conceptual learner dictionary of German and Spanish. Several standard corpora as well as web corpora for German and Spanish will be compared with respect to their size, the variety of genres they contain, the time span and geographical areas covered and what kind of search facilities they allow (e.g. word queries based on lemmata rather than on word forms). It will be argued that, when standard corpora fail to meet a particular requirement, web data may provide a useful alternative for lexicographical purposes provided they are both linguistically (i.e. morpho-syntactically) and meta-linguistically tagged. Keywords Corpus linguistics, web as/for corpus, bilingual lexicography, German, Spanish.

1. Introducción La incursión en lexicografía, o mejor dicho, en las fases previas a la elaboración del producto lexicográfico de temas y cuestiones propias de la lingüística de corpus encuentra su explicación en el intento de valerse de esta última para optimizar los recursos de la primera. En tal hecho encuentran su justificación estas líneas, que han sido concebidas con el propósito de hacer hincapié en las dificultades que las tareas 'pre'-lexicográficas conllevan y reivindicar la necesidad de profundizar en este área, especialmente en relación al trabajo con corpus lingüísticos. Para ello, se tomarán



248

Vanessa González Ribao

como ejemplo las reflexiones surgidas a este respecto en el marco del proyecto de investigación DICONALE.1 El objetivo de DICONALE es crear un diccionario conceptual para la producción a partir de un nivel B2 en español y alemán como lenguas extranjeras y para la traducción indirecta a las mismas. Al basarse en una ordenación semánticoconceptual del léxico (es decir, el léxico se estructura y organiza en distintos (sub)campos conceptuales y (mini)paradigmas léxico-semánticos), este diccionario pretende ser de especial utilidad en la desambiguación y correcta selección (y en consecuencia en el uso correcto) de un lexema determinado de entre la variedad de posibles lexicalizaciones existentes para el concepto que se quiere expresar. La investigación se lleva a cabo siguiendo la metodología propia de la lingüística de corpus (Katinas 2012: 78-86; Biber / Conrad / Reppen 1998: 21-54) con la intención de obtener, así, un reflejo “real” de la lengua en uso. Por un lado, los datos del corpus relativos a la frecuencia tanto de las verbalizaciones como de sus significados han de servir como criterio para delimitar y acotar el campo de estudio del proyecto; a pesar de que la selección provisoria (realizada a priori) de los lexemas verbales (tanto simples como complejos) que se han de incluir en el diccionario toma como referencia los trabajos lexicográficos ya existente en éste área. Por otro lado, el análisis de las realizaciones concretas extraídas del corpus ha de permitir identificar estructuras recurrentes, colocaciones y combinaciones frecuentes y tendencias de uso en general, discernir ente lo habitual y lo excepcional y, sobre todo, registrar lo idiomático para ofrecer un equivalente lingüístico adecuado a nivel de la producción. De este modo, la información proporcionada por el corpus hará posible cubrir ciertos vacíos observados en la lexicografía contrastiva español-alemán (cfr. Meliss 2013a, b, c) y que DICONALE se ha propuesto subsanar (cfr. Meliss / Sánchez Hernández 2014). El grosso de este artículo lo constituyen, por tanto, las reflexiones en torno a los criterios de selección de un corpus lingüístico para el español y para el alemán, respectivamente, cuyas características reúnan las condiciones necesarias para poder sustentar el proyecto lexicográfico tomado como ejemplo; haciendo especial hincapié en el aspecto contrastivo del mismo. Concretamente, se comenzará por realizar un breve repaso al estado de la cuestión presentando una selección de los corpus actualmente disponibles para el español y el alemán, describiendo sus características y discutiendo sobre los pros y contras de su utilización para los fines del proyecto en cuestión. A continuación, se expondrán, por un lado, los principales problemas y dificultades surgidos en torno a la utilización y compatibilidad de uso de los distintos corpus lingüísticos y, por otro, se reflexionará sobre el empleo de la web con fines lexicográficos y la viabilidad de esta alternativa. Una recapitulación final cerrará el artículo. –––––––— 1

“Elaboración de un diccionario conceptual alemán-español con acceso online (Financiación: MINECO FFI2012-32658: FEDER); IP: Prof. Meike Meliss (USC) y vinculado a la red de lexicografía RELEX (Financiación: Xunta de Galicia CN2012/290); Coord. Mª Dolores Sánchez Palomino (UDC).

249

Sobre algunos conflictos en la 'pre'-lexicografía

2. Estado de la cuestión El primer paso ha sido buscar información en torno a los corpus actualmente disponibles para el español y para el alemán, que podrían ser relevantes para los fines aquí perseguidos.

2.1. Corpus para el español La tabla 1 muestra la selección de corpus del español que ha sido sometida a evaluación en el marco del proyecto y sus principales características: CORPORA

Tamaño

Tipo de texto

Época

Lematizado

Área geográfica

CREA

~ 86 Mi. Palabras

~ 40 Mi. Palabras (Prensa), ~ 44 (Libros 2 ), ~ 2.5 (Otros)

19752004

No

Todas (peninsular3)

~ 100 Mi. Palabras (s. XX: ~ 20,5 Mi.)

s. XX: ~ 5 Mi. Palabras (x 4: académico, prensa, ficción, oral)

S. XIII - XX

Si

Todas

V124: ~ 1,6 Bi. Tokens

Textos Web: escrito 86%, oral 2,5%, espontáneo 3,5%, blogmix 8% Textos Web

DAVIES (CdE)

ESCOW V11: ~ 1,3 Bi. Tokens

2012

2011

Si: TreeTagger

Español peninsular

Si: FreeLing

–––––––— 2

3

4

El término “libros” se utiliza aquí en contraposición a “prensa” (periódicos, revistas y publicaciones similares), hace referencia tanto a textos escritos en prosa como en verso y abarca todo tipo de géneros de ficción y de no-ficción (académico, de carácter divulgativo, etc.). El CREA registra textos escritos en las distintas variedades geográficas del español, no obstante, es posible utilizar tal criterio como filtro y restringir la(s) consulta(s) a la(s) variedad(es) deseada(s). Entre la colección de corpus COW existen para el idioma español dos versiones. Una versión ESCOW2012 (V12) realizada en 2012 y otra de prueba ESCOW2011 (V11) en el 2011, de la que no hay información disponible en relación a los textos que la componen. Para mayor información véase Schaefer / Bildhauer (2012).

250

Vanessa González Ribao

UniLeipzig_es

1 Mi. Oraciones

Textos (Prensa)

Ngram: Google Books_es

~ 84 Bi. Tokens

DAVIES (GBC_es)

~ 45 Bi. Palabras (s. XX: ~ 9 Bi.)

Web

20092011

No

Todas

Libros

1500 2008

Si

Todas

Libros

1500 2008

Si

Todas

Tabla 1: Selección de corpus lingüísticos actualmente disponibles para el español.

Dentro de esta selección se pueden distinguir dos grupos: los corpus lingüísticos en línea “tradicionales” y los corpus originados siguiendo un sistema de crawling o araña web. El primer grupo lo integran el Corpus de Referencia del Español Actual (CREA) de la Real Academia Española (RAE) y el Corpus del Español de Mark Davies (CdE): El CREA ha sido, hasta el momento, el corpus de referencia del español por excelencia para llevar a cabo estudios de la lengua escrita del s. XX y principios del s. XXI, debido a su tamaño y a la distribución relativamente equilibrada de sus textos. No obstante, presenta el inconveniente de haber sido cerrado en el año 2004, por lo que no resulta adecuado para realizar estudios de la lengua inmediatamente actual y la desventaja de no estar lematizado, lo que dificulta la búsqueda y consulta de ciertos fenómenos lingüísticos, sobre todo en cuanto a estructuras complejas o casos de apofonía. A pesar de ello, posee una interfaz agradable al uso que permite utilizar de forma sencilla filtros de selección que ayudan a especificar y restringir los criterios de búsqueda adaptándolos a las necesidades concretas de cada usuario.5 Por su parte el CdE también presenta una interfaz completa y flexible que sirve de especial utilidad para investigar aspectos gramaticales y sintácticos (p. ej. concordancias, coocurrencias o colocaciones), pues juega con la ventaja de estar lematizado. La selección y distribución de los textos que lo componen puede calificarse de variada y equilibrada; acorde con las premisas de la lingüística de corpus tradicional expuestas, entre otros, por Biber (1993) y Sinclair (1991) y revisadas por Leech (2007). Abarca el periodo comprendido entre el S. XV y el S. XX presentándose, así, como óptimo para llevar a cabo estudios de tipo diacrónico. Sin embargo, no permite investigar la lengua actual, ya que sus textos más recientes datan de 1999. Tampoco contempla la opción de seleccionar o distinguir a priori

–––––––— 5

Más información sobre CREA se encuentra disponible en .

Sobre algunos conflictos en la 'pre'-lexicografía

251

entre las distintas variantes geográficas del español, por lo que no es la herramienta indicada para realizar estudios en los que la variedad lingüística sea relevante.6 El segundo grupo se presenta como la nueva generación de corpus lingüísticos. Se trata de recopilaciones de textos web, en el amplio sentido del término. La selección se realiza de forma automática mediante un crawler o araña web. Este método consiste en identificar y registrar textos web a partir de seeds previamente seleccionados. Los seeds son palabras clave que un motor de búsqueda genérico utiliza para identificar aquellas páginas web que establecen una conexión temática con los mismos e indexar posteriormente sus URLs. Para definir los seeds se suelen utilizar listas de palabras o vocabularios frecuentes extraídas de otros corpus, diccionarios o estudios piloto ad hoc (cfr. Fuertes-Olivera 2012:54). Este tipo de corpus se caracterizan por su extenso tamaño, lo que permite manejar gran cantidad de datos. Además, tienen la ventaja de trabajar con material muy actual, lo que también permite contemplar fenómenos in statu nascendi. Por el contrario, la calidad y cualidades de dicho material -textos web- son llevadas continuamente a discusión, especialmente en relación a su representatividad, debido a la imprecisión en la meta-información de las fuentes, así como a la dificultad de ordenar sus propiedades y características lingüísticas dentro de una tipología textual tradicional (vid. infra 4.1, 4.2, 5.). Ejemplo representativo de este segundo grupo es el Wortschatz de la Universidad de Leipzig; proyecto a gran escala llevado a cabo por el departamento de ciencias computacionales de dicha universidad. Se trata de un portal lexicográfico basado en corpus monolingües generados automáticamente a parir de material web y que abarcan un amplio abanico de idiomas entre los que se encuentran el español y el alemán. El objetivo del portal es poner a disposición de cualquier usuario información lexicológica (paradigmática, sintagmática, sobre relaciones de sentido, coocurrencias y frecuencias de uso basadas en estadísticas, etc.) extraída y fundamentada en los mencionados corpus de material web (cfr. Quasthoff / Richter / Biemann 2006). Concretamente, para el español han recopilado gran cantidad de textos extraídos de periódicos en línea de habla española (ofrecen un corpus para el español de México y otro para el español de carácter internacional). No obstante, los principales inconvenientes a la hora de utilizar este recurso son: la imposibilidad de seleccionar a priori a la variante geográfica (dentro del corpus de habla española en general) y las dificultades que emanan del trabajo con textos no lematizados. Dentro de este grupo también se inscriben los corpora from the web (COW) creados por el departamento de gramática alemana de la Universidad Libre de –––––––— 6



En este punto puede llamar la atención que no se mencione dentro de este grupo al CORDE de la RAE. Esto se debe a que, a diferencia del CdE (el cual contiene textos que datan de finales del S. XX), el CORDE está constituido por textos anteriores a 1975 y por tanto, no se considera relevante en relación al proyecto utilizado aquí como ejemplo. Para más información sobre el CdE y el CORDE consúltese y , respectivamente.

252

Vanessa González Ribao

Berlín. Los corpus COW siguen la metodología empleada en los proyectos BootCaT y WaCky (cfr. Schaefer / Bildhauer 2012:486) desarrollados en la Universidad de Trento por Marco Baroni y sus colaboradores (Baroni et al. 2004, 2009). Al igual que el proyecto de los colegas de Leipzig, se trata de un trabajo de gran envergadura y con amplias perspectivas de futuro, pues ya abarcan gran variedad de lenguas, entre las que se incluyen el alemán y el español, y pretenden extenderse aún más. Las ventajas que presenta el COW español (ESCOW) son las mismas que poseen todos los corpus de características similares: manejo de gran cantidad de datos totalmente actuales. En concreto, este corpus está compuesto por material web variado, como se puede observar en la Tabla 1. Está etiquetado y lematizado de forma automática, lo que permite realizar búsquedas en base a gran variedad de combinaciones morfosintácticas, aunque con cierto margen de error. Ha de ser consultado mediante algún programa de administración y análisis de corpus como CWB o similares. También se adapta fácilmente para trabajar de forma directa desde la interfaz de cualquier sistema Linux o MacOs. Recientemente han habilitado, además, un acceso online, el explorador COLiBrI, que permite consultar el corpus directamente desde la web sin necesidad de descargar ningún programa o aplicación específica, sin embargo, el uso de esta interfaz se encuentra restringido por el momento. Por las características arriba mencionadas, puede pronosticarse que los corpus COW serán en un futuro no muy lejano una herramienta idónea para llevar a cabo estudios contrastivos de la lengua actual. No obstante, el talón de Aquiles de dichos corpus reside, por un lado, en la cuestión de la representatividad de los textos que los componen (problema que se enmarca dentro de la discusión entorno a las propiedades y características lingüísticas del material web - vid. infra 4.1, 4.2, 5.) y por otro, en la imposibilidad de recuperación de las fuentes originales y otros metadatos (problema que, por norma general, surge al trabajar con gran cantidad de datos en línea extraídos por crawling). Aparte de los corpus lingüísticos descritos, merecen mención los “productos google” que pueden ser utilizados con fines lingüísticos. Entre estos se distinguen Google Ngram Viewer (GNV) y Google Ngram Corpus (GNC), ambos basados en la recopilación de textos constituida por Google Books (GB). Estos recursos están constituidos por libros de diverso carácter que datan de entre el s. XV hasta el año 2008, por lo que podrían resultar de utilidad para un análisis diacrónico de este tipo de lengua escrita; sobre todo en relación a cuestiones de frecuencia de uso (cfr. Lin et al. 2012). No obstante, ha de tenerse en cuenta que se trata de una selección de textos que ha pasado por el filtro de Google, cuyos criterios de selección no son revelados al usuario (cfr. Leech 2007:144). Sin embargo, el lingüista Mark Davies ha creado para el español un corpus lingüístico basado en el Google Books Spanish (GBS) siguiendo la misma metodología y criterios científicos que caracterizan todos sus corpus.7 El material de GBS ha sido procesado desde la óptica lingüística de tal modo que al acceder a éste desde la interfaz del Google Books Corpus (GBC) para el español de Mark Davies puede consultarse utilizando sus opciones de búsqueda –––––––— 7

Para más información al respecto véase .

Sobre algunos conflictos en la 'pre'-lexicografía

253

avanzada. Además, como se trata de un corpus cerrado (45 billones de palabras) aporta fiabilidad a los estudios estadísticos que puedan realizarse en base al mismo.

2.2. Corpus para alemán En cuanto a la selección de corpus realizada para el alemán (vid. Tabla 2), se puede efectuar la misma división que para el español. Por un lado, se encuentran los corpus lingüísticos con una relativamente larga tradición y por otro, los nuevos corpus de carácter más innovador constituidos con material en línea y basados en el método de crawling.



CORPORA

Tamaño

Tipo de texto

Época

Lematizado

1964-2013

Si

Área geográfica

~ 3 Bi. Prensa (incl. Radio), ~ 1 DeReKo

~ 6,1 Bi. Palabras

Bi. Wikipedia, ~

Todas

1,1 Bi. Libros, ~ 1

(Alemán de Alemania8)

Bi. Otros Kernkorpus: Ficción

~

26%,

Prensa

~

27%,

académico ~22%,propaganda Kernkorpus: 123 Mi. Tokens DWDS

~

~ 20%, oral ~ 5%) Zeitungskorpus: Berliner Z. ~ 242

Zeitungskorpus: ~ 1,7 Bi. Tokens

Mi. Tokens, Bild ~ 121

Mi.,

Süddeutsche Z. ~ 454

Mi.,

KK:

S.

XX

(en

construcc ión

S.

XXI)

Si Todas

ZK: 19462009

Tagesspiegel ~ 184 Mi., WELT ~ 238 Mi. ZEIT, ~ 417 Mi.

–––––––— 8

A través de COSMASII es posible predefinir un corpus de trabajo adaptado a las necesidades del usuario. De tal modo, es posible seleccionar aquellos textos y archivos que se corresponden con la variedad geográfica deseada, pudiendo trabajar así de forma independiente con cada una de ellas.

254

Vanessa González Ribao Textos

Web:

V12 9 : ~ 9,2 Bi.

escrito 71%, oral

Tokens

1%,

DECOW

espontáneo

22,5%, V11: ~ 1,2 Bi.

Si:

2012

TreeTagger

blogmix

4,5%

Si:

2011

Tokens

Alemán

de

Alemania

TreeTagger

Textos Web Uni-

~

Leipzig_de

Oraciones

(Prensa)

~ 65 Bi. Tokens

Libros

Ngram:Googl e Books_de

130

Mi.

Textos

Web

2005-2006 1500 2008

-

No Si

Alemán

de

Alemania Todas

Tabla 2: Selección de corpus lingüísticos actualmente disponibles para el alemán.

De entre los corpus de referencia del alemán destacan el Deutsche Referenzkorpus (DeReKo) del Instituto del Idioma Alemán (IDS) y el corpus del Digitales Wörterbuch der deutschen Sprache (DWDS) elaborado por la Academia de las Ciencias de Gotinga (AdW zu Göttingen) y la Academia de las Ciencias de Berlín y Brandemburgo (BBAW): El corpus del IDS pretende servir de referencia y base para cualquier estudio en torno a la lengua alemana, por ello está compuesto por una extensa cantidad de textos del s. XX y XXI, además de una recopilación de obras de determinados escritores canónicos de la literatura de habla alemana, así como otros corpus específicos creados ad hoc para los distintos proyectos llevados a cabo en el IDS (cfr. Kupietz et al. 2010). En general, la composición de DeReKo es variada, aunque puede apreciarse una clara tendencia a la inclusión de material periodístico de tipo regional y cierta escasez en prosa de ficción; hechos que principalmente atienden a cuestiones prácticas relacionadas con los derechos de autor y la predisposición de los grandes grupos editoriales a ceder su material.10 Este corpus no solo está lematizado, sino que a él se asocia el sistema de búsqueda, administración y análisis de corpus del IDS: COSMAS II. Este recurso esta dotado de una amplia oferta de filtros y criterios de selección que permite afinar detalladamente la búsqueda e incrementar la probabilidad de éxito y precisión de la consulta. Además, ofrece al usuario la posibilidad de configurar, a partir de los materiales que conforman los corpus de DeReKo, su propio corpus de trabajo adaptado a las exigencias concretas del mismo. Por su parte el corpus del DWDS más que un corpus es, en realidad, un conjunto de corpus de entre los que destacan el Kernkorpus (corpus central o nuclear) y el Zeitungskorpus (corpus de periódicos). Por una parte, el Kernkorpus se compone por textos del S. XX y principios del XXI (en proyecto) cuya naturaleza está distribuida –––––––— 9

10

Al igual que para el español conviven para el alemán una versión DECOW2012 (V12) que data del 2012 y otra experimental del 2011 DECOW2011 (V11) para la que no existe una descripción completa de sus propiedades (cfr. Schaefer / Bildhauer 2012). Para más información al respecto consúltese .

Sobre algunos conflictos en la 'pre'-lexicografía

255

de forma relativamente equitativa, como se muestra en la Tabla 2 (cfr. Geyken 2007: 25-30). Éste podría considerarse, dadas sus características, como el corpus de referencia alemán equivalente o más comparable al CREA, con la ventaja de que éste sí está lematizado, al igual que todos los corpus que componen el banco de datos del DWDS. Por otra parte, el Zeitungskorpus lo constituye una amplia variedad de textos extraídos de diversos periódicos, sobre todo de tirada suprarregional, lo que complementa la oferta de DeReKo. La consulta de los corpus del DWDS se realiza a través de una interfaz propia que permite filtrar la búsqueda en base a restricciones cronológicas, de autoría, tipo de texto, etc. Sin embargo, no es posible realizar un filtrado en base a las variedades geográficas del alemán y es que el punto débil de estos corpus radica precisamente en la infrarepresentación de las variedades suizas y austriacas (cfr. Geyken 2007: 30). En lo relativo a los corpus del alemán elaborados principalmente por un crawler son válidas las mismas restricciones, ventajas e inconvenientes que se han comentado más arriba para sus homónimos españoles (cfr. 2.1), pues sus características son muy similares, a salvedad de que para el alemán no se ha creado aún ningún corpus específico basado en el Google Books German (GBG), como queda reflejado en la Tabla 2.

2.3. Breve recapitulación sobre el estado de la cuestión De la comparación de los corpus seleccionados para el español y el alemán ( vid. supra Tablas 1 y 2) se pueden extraer las siguientes conclusiones que sirven para cerrar este apartado sobre el estado de la cuestión. En resumen, los corpus tradicionales alemanes son corpus abiertos y ricos en material de prensa, mientras que en los corpus tradicionales españoles se observa una mayor presencia de textos literarios y a penas se registra material del S. XXI, pues están cerrados. Por su parte, los corpus “de nueva generación” se caracterizan, tanto en español como en alemán, por la actualidad de sus textos y su gran tamaño. Además juegan con la ventaja de poseer características similares para los dos idiomas aquí tratados, a pesar de que para el alemán no existe ningún corpus basado en GBG y el corpus de la Universidad de Leipzig para el español está menos trabajado que su homónimo alemán. No obstante, estos recursos no están salvos de inconvenientes, pues al estar generados de forma automática y mecánica presentan dificultades para recuperar información sobre las fuentes y otros metadatos, como por ejemplo es el caso de los corpus COW.

3. Dificultades en la búsqueda del corpus de trabajo adecuado Requisito fundamental para llevar a acabo cualquier estudio contrastivo es que materiales, herramientas y condiciones de trabajo sean iguales para las distintas lenguas que se quieren comparar. Esto significa que los corpus han de poseer aproximadamente el mismo tamaño y enmarcarse cronológicamente en un mismo periodo. También la distribución y proporción de los distintos tipos de texto que los

256

Vanessa González Ribao

componen han de ser similares. Para lenguas que presenten notables discrepancias entre sus variedades geográficas, como es el caso, es importante poder seleccionar la variedad con la que se quiere trabajar. Idealmente ambos corpus han de estar lematizados y poder ser analizados bajo criterios de búsqueda y filtrado comunes. En cuanto a la pareja de idiomas que atañe a este artículo, el principal problema para escoger un corpus adecuado reside precisamente en que los corpus lingüísticos ofertados para ambas lenguas (vid. supra 2.) son difícilmente comparables entre sí, tanto desde un punto de vista cuantitativo como cualitativo. Por un lado, el tamaño de los corpus es bastante dispar y por otro, la variedad y tipo de textos que los constituyen así como su proporción y distribución atienden a intereses distintos. Tampoco se puede establecer una comparación equilibrada en cuanto al periodo de tiempo o época en la que se inscriben los textos o en relación a la variedad lingüística que en estos se registra, sobre todo desde un punto de vista geográfico. Una posible solución sería valerse de los filtros y opciones de especificación de búsqueda que algunos corpus ofrecen, para así restringir el área de estudio a un grupo de textos de características similares y, por tanto, comparables. Por ejemplo, si se acota la búsqueda en el Kernkorpus del DWDS al período comprendido entre 1975 y 2004, entonces se obtiene un material de trabajo comparable al proporcionado por el CREA. De hecho, aún es posible afinar más la selección de textos. En el CREA podría efectuarse una búsqueda solo en aquellos textos que reúnan la siguiente combinación de cualidades: tipo = prensa, variedad lingüística = español peninsular, época = a partir del año 2000 y tema = todo (sin restricción). Si a su vez se restringe la búsqueda en DeReKo a textos de prensa alemanes datados del 2000 al 2004, se podrían utilizar sin problema los dos corpus para llevar a cabo un estudio contrastivo. No obstante, tal procedimiento suele generar nuevas dificultades a las que enfrentarse: por un lado, puede conducir a la obtención de un número de ejemplos insuficientes como para poder llevar a cabo cualquier estudio lingüístico y, por otro, es posible que la selección de textos obtenida tras el filtrado en el corpus español y la del corpus alemán no coincidan en su tamaño. En tal caso han de utilizarse otros criterios, por lo general de carácter arbitrario, que permitan restringir aún más la búsqueda en el corpus que corresponda, para poder trabajar con materiales cuantitativamente comparables. Por último, ha de tenerse en cuenta que las opciones de filtrado no siempre están disponibles para todos los corpus. Otro problema añadido es la cuestión de la lematización, más concretamente, la ausencia de la misma. En muchas ocasiones los textos carecen de cualquier tipo de anotación morfosintáctica, lo que dificulta considerablemente su consulta. A pesar de ello, cada día los lingüistas idean nuevas estrategias de búsqueda valiéndose de los conocidos parámetros booleanos y de otros recursos estandarizados que, por norma general, casi todos los buscadores ofrecen. No obstante, en casos especialmente complicados, como son por ejemplo los verbos con prefijo separable en alemán, la apofonía o la metafonía, es necesario para el estudio de un mismo fenómeno realizar múltiples consultas en base a formas concretas y aisladas para combinarlas posteriormente. Este modo en que los datos son consultados implica un alto grado de reconstrucción y manipulación de los mismos condicionando, así, negativamente el valor de los resultados, sobre todo en relación a su objetividad y representatividad.

Sobre algunos conflictos en la 'pre'-lexicografía

257

En lo que a estudios de tipo corpus-driven o con fines estadísticos se refiere, este método resulta definitivamente inviable. Los siguientes ejemplos ilustran de forma clara esta problemática. 11 Para consultar en el CREA el verbo difamar con el fin de recuperar todas sus formas verbales para realizar un estudio sobre sus estructuras argumentales, se pueden seguir dos estrategias de búsqueda distintas. Una alternativa es utilizar la fórmula difam* mediante la que se está pidiendo al buscador que muestre todas las formas registradas en los textos que comiencen por dicha combinación de caracteres. Esto significa que los datos devueltos por la máquina no solo contienen formas verbales, por lo que una revisión y limpieza manual de los datos es obligatoria. Concretamente, de dicha búsqueda en los textos de periódicos y revistas de España con la marca se han recuperado 185 casos en 141 documentos. Tras la revisión manual de los mismos se obtienen 28 ejemplos que contienen el verbo difamar, de los cuales la mitad (14) se corresponden con la forma su infinitivo (incluida su combinación con todas las formas clíticas posibles). La segunda alternativa consiste en buscar por formas verbales concretas. Cierto es que se puede realizar una consulta para cada una de las formas conjugadas del verbo, sin embargo, lo más oportuno y rentable es establecer de antemano qué formas verbales concretas resultan de mayor relevancia para los fines del estudio en cuestión; teniendo siempre en cuenta la naturaleza del verbo y con vistas a obtener el mayor número posible de casos. De ahí que para el verbo difamar se hayan buscado en primer lugar las formas de presente y pretérito de indicativo de la tercera persona. Además de que por norma general esta persona verbal es la más recurrente,12 en el caso concreto del verbo difamar carecería de sentido buscar formas en la primera persona, ya que resultaría verdaderamente extraño que alguien afirmase haber difamado a alguien, pues se estaría hablando entonces de un “suicidio elocutivo” (cfr. illocutionary suicide Searle / Vanderveken 1985). Pues bien, siguiendo los mismos criterios restrictivos de selección que para la consulta anterior, las formas encontradas para la tercera persona singular de presente (difama) han sido 2 y 3 más, para la forma de plural (difaman). Los casos obtenidos para el pretérito ascienden a 2, uno para difamó y otro para difamaron respectivamente. A mayores se ha consultado la forma difamado con vistas a obtener ejemplos en las formas de perfecto, sin embargo, al tratarse de una forma polisémica también se recuperan las formas masculinas de la pasiva y del adjetivo en singular. Finalmente, se puede contar con 3 ejemplos válidos para esta búsqueda, incluyendo casos en pasiva. Actuando de modo consecuente, se ha buscado también la forma pasiva de femenino difamada; lamentablemente sin obtener ningún resultado válido. La suma total de los casos hallados siguiendo este –––––––— 11

12

Se toma como ejemplo el verbo español difamar y su homólogo alemán diffamieren por considerarse verbos con una frecuencia de uso estándar en comparación con verbos de carácter más general como p. ej. comunicar / mitteilen. Para más información consúltense las listas de frecuencias del CREA y DWDS, respectivamente. Para verificar esta información también se han consultado a posteriori el resto de personas verbales en el modo y tiempos indicados. La hipótesis queda constatada, pues no se ha hallado ejemplo alguno.

258

Vanessa González Ribao

método asciende a 10. Se puede concluir pues que ambos procedimientos conducen indistintamente a resultados similares: imprecisión de los datos recuperados y alto riesgo de falsos positivos, necesidad de revisión manual e insuficiente numero de ejemplos, incluso como para llevar a acabo un sample o pequeño estudio piloto. En cuanto a los corpus en alemán no lematizados, puede procederse del mismo modo. Por ejemplo, al realizar la consulta diffamier* en el Corpus de la Universidad de Leipzig para el alemán de Alemania con la misma finalidad que la consulta anterior, se obtiene una lista con todas las formas registradas que empiezan por la secuencia diffamier- y el número de veces que éstas aparecen. Por supuesto, como se puede observar en la Figura 1, no todas las formas obtenidas son verbales e incluso se registran como formas léxicas casos en los que no se ha sabido identificar nombres propios, erratas u otros fallos tipográficos. Como ya se ha mencionado, esto se debe a que la búsqueda y selección de textos se realiza de forma automática y mecánica.

Figura 1: Formas recuperadas de la consulta diffamier* en el Corpus de la Universidad de Leipzig para el alemán de Alemania.



Tras la eliminación de todos aquellos casos no relevantes para la investigación en cuestión, se procede a examinar detenidamente cada uno de los ejemplos que contienen las formas seleccionadas. El número final de casos válidos que resulta de



Sobre algunos conflictos en la 'pre'-lexicografía

259

esta segunda criba puede ser muy variado. Cierto es que se podrían tomar todos los casos válidos sin restricción alguna, no obstante, para estudios contrastivos es recomendable establecer numerus clausus que permitan trabajar en ambas lenguas con un material comparable. Póngase a modo de ejemplo como cifra intermedia el 100. Es decir, que de todos los casos obtenidos se toman 100 por cada lexema consultado en cada idioma. Volviendo a los ejemplos anteriores, se puede observar que el hecho de establecer una restricción numérica conduce a dos posibles problemas. Por un lado, puede suceder que la suma total de todos los ejemplos recuperados para un lexema no alcance la cifra tope preestablecida, como ocurre con el caso de difamar en el CREA. Ante esta situación ha de prescindirse de estudiar tal lexema u optar por completar el material de trabajo utilizando otras fuentes, pues la cantidad inicial obtenida no se considera adecuada ni suficiente para llevar a cabo un estudio piloto o sample de calidad. Por otro lado, puede darse el caso contrario, que el número de casos recuperados sobrepase la barrera impuesta. Cuando se trabaja con corpus lematizados este hecho no suele suponer un grave problema, pues, por norma general, se ejecutaría un corte tras los 100 primeros ejemplos válidos recuperados sin afectar a la objetividad de la selección. No obstante, las dificultades se manifiestan cuando, como ocurre con el caso de diffamieren en el Wortschatz de la Universidad de Leipzig, los textos no están lematizados y se ha tenido que recurrir a la combinación de numerosas consultas para un mismo lexema. Por tanto, el resultado final no es una lista de ejemplos con formas mixtas distribuidas al azar, sino una amalgama de formas que se presentan por separado en diferentes listas. Esto obliga a efectuar una selección manual de los ejemplos, intentando respetar los criterios de representatividad y variedad en las formas. No obstante, siempre existen formas más frecuentes y recurrentes que otras dependiendo de la naturaleza del lema consultado, tal y como se puede observar en la Figura 1. La cuestión es entonces qué formas se han de escoger. En un intento de mantener las proporciones podría tratarse cada lista de forma independiente y realizar una selección porcentual en base al número de casos obtenidos por cada forma. Sin embargo, todavía queda abierta la duda de si este modo de proceder es realmente sinónimo de representatividad. Aún mayores dificultades presenta la consulta de formas compuestas o complejas en textos no lematizados. Por ejemplo, para buscar el verbo con prefijo separable mit|teilen ('comunicar') en el Wortschatz de la Universidad de Leipzig no es posible realizar una consulta en la que se especifique que se desea obtener todos aquellos casos en los que además de la raíz de verbo teilen al final de la frase aparezca el prefijo separable correspondiente, aquí la partícula mit (teilen … mit). Por consiguiente, la única alternativa posible es llevar a cabo la tarea herculina de buscar todas las formas de la raíz verbal teilen (que no solo puede actuar como base combinable con otros prefijos separables como por ejemplo einteilen (‘dividir’), zuteilen (‘distribuir’), o austeilen (‘repartir’), sino que por sí sola ya constituye un verbo pleno ('partir' o 'compartir') y revisar manualmente todos los casos extrayendo solo aquellos pertinentes. Queda pues de relieve que tal procedimiento no es en absoluto rentable dado el alto numero de falsos positivos y la gran inversión de tiempo que ello exige.

260

Vanessa González Ribao

Por último, merecen mención los problemas que emanan del trabajo con corpus generados automáticamente y que registran grandes cantidades de material web. Como ya se ha explicado, dentro de estas grandes bases de datos no suele ser posible escoger de antemano o filtrar a posteriori el material utilizando el criterio de la variedad lingüística. Para idiomas como el español y el alemán que no solo se extienden por diferentes zonas geográficas de carácter muy diverso, sino que además son lenguas oficiales de múltiples países distintos, puede recurrirse al dominio geográfico de la URL que localiza un texto determinado para, así, poder deducir dentro de qué variante se inscribe. No obstante, el hecho de que una página web posea un domino “.es”, por ejemplo, no es sinónimo de garantía para poder asegurar que los textos contenidos en dicha página están escritos por un hispanohablante nativo que utiliza una variante estandarizada del español peninsular. La dudosa fiabilidad de la información proporcionada por las URLs también afecta a la recuperación de las fuentes, la datación y otras informaciones que atañen a las propiedades del texto.

4. Web como alternativa En los últimos tiempos se ha visto en la Web una posible solución a las carencias que a menudo los corpus lingüísticos pueden presentar. La Web es una herramienta de gran tamaño y alcance que se encuentra en continuo movimiento y renovación. Se caracteriza por la innovación, inmediatez y gran variedad de sus recursos; además de por la fácil accesibilidad a los mismos. Por ello y como bien defiende Fletcher (2011), se ha instaurado recientemente como una concurrente alternativa dentro de la lingüística de corpus: The Web corpus owes its popularity to its tremendous size; broad linguistic, geographic and social range; up-to-dateness; multimodality; and wide availability at minimal cost […] The Web is the most effective resource to research and document linguistic reflections of contemporary culture. In contrast, any static corpus is cut off at the moment of its compilation […] Besides Web-only content, such a corpus can contain material available in other forms, such as articles from newspapers and magazines, entire books and even movie subtitles (Fletcher 2011: 1339-1340).

A este respecto existen básicamente dos posibles vías para valerse de tal herramienta (cfr. Lüdeling / Evert / Baroni 2007: 8-10). Por un lado, es posible consultar la web tal y como se procedería a consultar cualquier otra base de datos lingüísticos y por otro, se pueden aprovechar los materiales lingüísticos que ésta contiene para moldear un corpus de uso propio a partir de los mismos. La cuestión entonces es constatar el estatus de la web como alternativa, es decir, comprobar si la web es capaz de cubrir las exigencias y reunir las cualidades propias de corpus adecuado para un estudio lexicográfico contrastivo (vid. infra breve

Sobre algunos conflictos en la 'pre'-lexicografía

261

digresión); y en caso afirmativo, determinar cuál de las dos metodologías a seguir ofrece mejores posibilidades de trabajo para los fines aquí expuestos.13

4.1.Breve digresión Teniendo en cuenta las reflexiones de Lüdeling, Evert y Baroni (2007), puede decirse que son 5 los tipos de estudio básicos que un corpus destinado a sustentar un trabajo lexicográfico de las características aquí descritas debe permitir llevar a cabo: (i) Estudio cualitativo: Descripción del paradigma de los diferentes campos léxicos, detección de diferencias en los significados o nuevos usos, combinaciones, etc. Para poder llevar a cabo este tipo de estudio es requisito fundamental que el corpus sea estable, permita la reproducibilidad de los datos y posterior verificación de los resultados obtenidos y, sobre todo, que sus textos estén anotados morfosintácticamente, de modo que sea posible su consulta a través de un motor de búsqueda adecuado que a su vez garantice cierto grado de precisión en la recuperación de los datos. (ii) Estudio distribucional: Determinar en qué contextos de uso concretos tiene lugar una u otra expresión determinada, resolver a qué tipo de textos y registros pertenecen ciertos lexemas u acepciones o detectar restricciones de carácter pragmático. Requisito fundamental para estas tareas es la anotación y etiquetación de los textos tanto a nivel lingüístico como extralingüístico. El corpus debe ofrecer suficiente meta-información sobre los materiales que lo componen para poder evaluar y categorizar los datos también desde un punto de vista social o geográfico, por ejemplo. (iii) Estudio cuantitativo: En relación a cuestiones como la reproductividad o frecuencia de uso queda nuevamente de relieve la importancia de la estabilidad en un corpus y la proporcionalidad balanceada y equitativa en la distribución de sus textos. (iv) Estudio diacrónico: Para poder señalar cuándo, cómo y eventualmente por qué un fenómeno lingüístico determinado aparece en la lengua y poder rastrear la posterior evolución del tal fenómeno ha de remitirse, de nuevo, tanto a la estabilidad y reproducibilidad del corpus como a la necesidad de (meta-)anotación de sus textos. (v) Estudio contrastivo: En cuanto a la observación y análisis de las divergencias así como semejanzas entre los fenómenos lingüísticos de distintas lenguas, con independencia del nivel de lengua tratado (semántico, pragmático, sintagmático, paradigmático, etc.), es esencial que los aspectos calificados en los puntos anteriores como “fundamentales” se den de igual manera en los distintos corpus para las determinadas lenguas y que los materiales que los componen sean comparables. –––––––— 13

En este punto se considera necesario realizar una breve digresión del tema para explicar concretamente cuáles son las características que ha de reunir un corpus orientado al trabajo en lexicografía contrastiva y poder evaluar así si la web es capaz de reunir tales condiciones.

262

Vanessa González Ribao

4.2. Web como corpus La única vía posible para servirse de los datos web es a través de un motor de búsqueda comercial (Search Engine, SE). Entre los más conocidos destacan por ejemplo Google, Alta Vista, Bing o Yahoo. Estos bien pueden ser consultados directamente como es la forma usual o bien se puede efectuar una búsqueda en base a los mismos, pero por medio de un motor de búsqueda de pre- y/o postprocesamiento lingüístico específico del tipo WebCorp (Renouf et al. 2005), KWiCFinder (Fletcher 2001) o Linguist's Search Engine (LSE) (Elkiss / Resnik 2004), de modo que tal consulta perfeccionada conduzca a obtener resultados más refinados y precisos. A pesar de ello, los datos han de ser interpretados con cautela (cfr. Meyer et al. 2003: 253), pues como ya se ha mencionado con anterioridad, el usuario ignora los algoritmos empleados por los buscadores comerciales no pudiendo evadir la influencia que los intereses ajenos a la lingüística (principalmente económicos y comerciales) ejercen sobre los datos recuperados en cualquier consulta. Y aún así, ¿es posible cumplir con los requisitos arriba mencionados (vid. 4.1) al utilizar la web como corpus? De esos requisitos se deduce que un corpus lingüístico debe ser ante todo estable; no tanto en cuanto la representatividad y proporcionalidad o equilibrio de sus materiales, sino en relación a la reproducibilidad de sus datos (cfr. Lüdeling / Evert / Baroni 2007: 10-11). Por norma general, un corpus lingüístico es validado por un contra-corpus que contrasta y legitima los resultados obtenidos o por el contrario funciona como indicador de las carencias de sus datos ayudando a completarlos. Es evidente que para la Web como corpus no existe una “Web como contra-corpus” que actúe como agente controlador. De facto, entre las principales objeciones al uso de la Web como corpus destacan las dificultades existentes en torno a la recuperación e identificación de los datos y meta-datos de las páginas web (cfr. Kilgarriff / Grefenstette 2003: 344-345). Un buen corpus, pues, no solo debe permitir la consulta de datos, sino también posibilitar la categorización y valoración de la información obtenida a partir de los mismos. A este respecto, la utilización de la Web como corpus no aporta realmente una solución alternativa a los corpus presentados en los apartados 2.1 y 2.2, pues los textos web no suelen estar lematizados, de modo que, al igual que en los corpus lingüísticos que presentan este mismo inconveniente, la precisión en la recuperación de datos es relativamente baja e inversamente proporcional al alto número de falsos positivos que se obtienen, exigiendo, de igual modo, una gran inversión de tiempo y trabajo manual. Además, la Web es relativamente inestable, de ahí que los datos no sean siempre recuperables, la calidad y cualidad de sus textos sean en ocasiones difícilmente identificables y la meta-información en las páginas web, en caso de ser ofrecida, sea con frecuencia dudosa y poco fiable. En resumen, haciéndose eco de las palabras de Meyer et al., puede afirmarse que “when conducting a search on the Web, we have no idea what kinds of texts our search results have been taken from” (2003: 241). Cierto es que por su naturaleza resultaría inapropiado establecer valoraciones sobre la web como corpus en base a criterios propios de los corpus

Sobre algunos conflictos en la 'pre'-lexicografía

263

tradicionales (cfr. Schaefer / Bildhauer 2012: 248), no obstante, aún teniendo presente esta consideración, la respuesta a la pregunta arriba formulada sigue siendo negativa. Una solución intermedia entre los corpus lingüísticos específicos y el uso directo de la Web, serían los bancos de datos en línea de tipo BDS, ADESSE, WiSo, LexisNexis, Lemmurproject, Wikipedia, entre otros. A pesar de que muchos de estos bancos de datos no están concebidos con fines exclusivamente lingüísticos, sus textos suelen estar anotados, sus buscadores permiten, por norma general, restringir y precisar las consultas por medio de distintos filtros y criterios de selección y el aspecto más decisivo: se puede identificar qué textos concretos los conforman y, por tanto, determinar exactamente su tamaño. No obstante y de forma sorprendente, el idioma español se encuentra en desventaja cuantitativa en lo que a este tipo de recursos se refiere, lo que para el estudio contrastivo español-alemán aquí tratado supone volver a enfrentarse al problema de la escasez de datos e imposibilidad de comparar los materiales disponibles para ambas lenguas; único obstáculo que con el uso directo de la Web como corpus se había salvado con éxito.

4.3. Web para corpus Confeccionar un corpus de trabajo propio diseñado a medida valiéndose de los materiales disponibles en la Web parece la opción más propicia. Sin embargo, no es ni la más rápida ni la más sencilla. Por un lado, se ha de disponer de los recursos técnicos y económicos necesarios para extraer y procesar los textos (cfr. Lüdeling / Evert / Baroni 2007: 18), así como enfrentarse a cuestiones de autoría, derecho a la propiedad intelectual, plagio, etc., cuya frontera hacia la transgresión es, especialmente en relación al material web, de carácter difuso (Wilks 2004). Por otro lado, se ha de reflexionar sobre qué criterios generales y específicos se han de seguir para llevar a cabo la confección de un corpus determinado (Sinclair 1991, Biber 1993). Generalmente, estos criterios están regidos por la finalidad que el corpus está destinado a seguir; con independencia de si se trata de un corpus “tradicional” o de uno elaborado con material web (Leech 2007). Por tanto, lo que se ha de comprobar en este caso es si un corpus compuesto por material web es capaz de cubrir los criterios y requisitos descritos anteriormente (vid. supra breve digresión). Para extraer material web se puede proceder bien realizando una selección previa de determinadas páginas, sitios o dominios web escogidos en base a la finalidad del futuro corpus o bien utilizando un crawler (vid. supra). En ambos casos lo que se está haciendo en realidad es “an enormous sample of the web” (Leech 2007: 144), una instantánea de la web que inmortaliza un momento o estado concreto de ésta, en otras palabras, un corpus offline (cfr. Claridge 2007: 89). Esto implica trabajar con un conjunto de materiales acotado, mesurable y reproducible, ganando así en estabilidad. Por un lado, un corpus offline determinado puede ser validado por un corpus offline sucesivo, es decir, por otras capturas de la web realizadas bajo las mismas condiciones pero en momentos posteriores; lo que al mismo tiempo significa que los corpus offline permiten realizar estudios desde una perspectiva

264

Vanessa González Ribao

diacrónica (cfr. Claridge 2007: 89). Por otro lado, el éxito y precisión en la recuperación de los datos ya no depende de terceros, sino que la responsabilidad recae sobre el propio lingüista, pues es éste el que debe decidir bajo qué criterios y con qué recursos (programas de conversión, anotación, búsqueda, etc.) va a procesar y analizar sus textos. A pesar de que mediante este método es posible alcanzar, en gran medida, los requisitos arriba mencionados (vid. supra breve digresión), aún siguen surgiendo dificultades en torno a la categorización y valoración de los tipos de textos que componen un corpus offline determinado. Para poder realizar una distribución proporcional y balanceada de los textos que han de componer un corpus offline dado, ha de poderse llevar a cabo, en primer lugar, una etiquetación de los mismos. El sistema de etiquetado de las páginas web o “meta-tags” es de naturaleza extralingüística y atiende generalmente a razones económicas o comerciales, de ahí que no siempre resulten de utilidad para fines lingüísticos. Por su parte, los criterios de etiquetación lingüísticos que tradicionalmente definen las categorías textuales no siempre son aplicables a los textos web o en palabras de Karlsgren (2000: cap. 15.1) “there is no well-established genre palette for Internet materials". He precisamente aquí dónde, en base, reside el problema de la cuestión. Como bien apunta Storrer (cfr. 2012: 277), la web ha evolucionado recientemente de tal manera que ha pasado de ser un medio de recepción a convertirse en un potente medio de comunicación. Conforme al desarrollo de nuevas formas de comunicación en la web, han surgido, de igual modo, dentro de la misma nuevos tipos de texto. En este sentido puede considerarse a la web como objeto de estudio en si misma. Ya no se trata solamente de una herramienta o recurso que permite generar un conjunto de textos, sino que también es posible entender la web como un tipo de discurso propio con sus respectivos géneros y categorías textuales. De ahí que haya que distinguir entre los conceptos web corpus (corpus web, ergo, de material web) y web-based genre corpus (corpus de la web, ergo, de géneros web como por ejemplo chat, foros, blogs, wikipedia, etc. - cfr. Fuertes-Olivera 2012: 62; Beißwenger et al. 2012: 1 y Gamallo / González 2010). En este marco, Beißwenger et al. (cfr. 2012: 2) demandan una colaboración interdisciplinar encomendada a la elaboración de modelos de descripción específicos y herramientas de análisis adecuadas para el estudio de estas nuevas formas de comunicación con el fin de entenderlas mejor; requisito previo fundamental para poder incluir de forma constitutiva en la investigación lingüística dichos géneros que cada vez están más presentes en las actividades diarias de nuestra sociedad (cfr. Storrer 2010). De cualquier modo, independientemente del aprovechamiento que se quiera realizar de la web (bien como recurso o bien como fuente), queda de relieve la necesidad de identificar las características propias de los textos web para poder finalmente determinar, en términos lingüísticos, qué es lo que una página web contiene en realidad (cfr. Biber / Kurjian 2007: 110-112), pues una vez solventado este obstáculo se podrá retomar la discusión en torno al uso de dichos materiales con fines lexicográficos.

Sobre algunos conflictos en la 'pre'-lexicografía

265

5. Recapitulación y desiderata Se ha comprobado que el trabajo cooperativo entre la lingüística de corpus y la lexicografía ha favorecido el desarrollo recíproco de ambas disciplinas (cfr. Katinas 2012: 83-86). Desde hace unas décadas, al instaurarse la web como potente herramienta de trabajo e inmensa fuente de recursos también han querido estas dos disciplinas participar de las posibilidades que las nuevas tecnologías ofrecen. De ahí que actualmente ambas se ocupen de forma conjunta con cuestiones como las aquí planteadas en Meyer et al.: is [it] possible to gauge the size of the Web and the rate at which its size is increasing, to determine with any certainty the kinds of texts that exist on the Web, to calculate which portion of the Web commonly available search engines actually obtain results from, and to describe the very real limitations of search engines in terms of what they can or cannot search for [?] (Meyer et al. 2003:241-242).

El deseo común es, por tanto, lograr responder positivamente a estas cuestiones en el futuro, pues si las barreras que presentan actualmente los materiales web fuesen vencidas, si We could parse the Web. Web searches could be specified in terms of lemmas, constituents (e.g., noun phrase), and grammatical relations rather than strings. The way would be open for further anatomizing of Web text types and domains. Thesauruses and lexicons could be developed directly from the Web (Kilgarriff / Grefenstette 2003: 345).

Para cubrir las expectativas arriba formuladas por Kilgarriff y Grefenstette, debe llevarse a cabo un estudio multidimensional que atienda a criterios tanto lingüísticos como situacionales obteniendo, de este modo, una clasificación del material web (cfr. Biber / Kurjian 2007: 112). Por un lado, se han de analizar e identificar los parámetros lingüísticos de variación subyacentes en los textos. Por otro lado, se han de distinguir las características situacionales y de uso propias de cada contexto comunicativo para establecer un espectro de géneros o registros. La suma de ambos procedimientos definirá las distintas categorías textuales en base a las que se podrá elaborar un sistema de etiquetado adecuado a las necesidades del lingüista que permita a su vez optimizar los “meta-tags” de las páginas web y anotar los textos lingüísticamente de forma detallada (cfr. Meyer et al. 2003: 253). Dicha tarea ha de realizarse con la ayuda de los recursos y procedimientos metodológicos propios de la lingüística de corpus, de la lingüística computacional, de la lexicología, de la semántica, así como de la sociolingüística entre otras (cfr. Beißwenger et al. 2012: 2). En este marco interdisciplinar, la clave para evitar o solventar gran parte de las dificultades está en que las relaciones entre las disciplinas sean establecidas correctamente. A este respecto, Fuertes-Olivera (2012: 67) advierte que “the corpus is fundamental in lexicography if it is not taken as an act of faith, but as a tool for performing certain tasks”, pues las tareas lexicográficas le corresponden al lexicógrafo y es éste el encargado de valorar, en última estancia, cómo y en qué medida ha de ser utilizada dicha herramienta.

266

Vanessa González Ribao

Es, precisamente, en este contexto en el que se debe entender la noción de representatividad. Cierto es que tal noción es severamente cuestionada dentro de la lingüística de corpus y que en relación al material web goza aún de una mayor controversia a la habitual debido al desconocimiento de la naturaleza de dicho material. Sin embargo, tal y como explican Kilgarriff y Grefenstette, la web puede ser tan representativa como cualquier otro corpus: The Web is not representative of anything else. But neither are other corpora, in any wellunderstood sense. ‘Text type’ is an area in which our understanding is, as yet, very limited. Although further work is required irrespective of the Web, the use of the Web forces the issue. Once we move to the Web as a source of data, and our corpora have names like ‘April03-sample77’ the issue of how the text type(s) can be characterized demands attention (Kilgarriff / Grefenstette 2003: 243).

Como se ya ha explicado, un corpus debe ser confeccionado teniendo en cuenta la finalidad que está destinado a seguir y es, por tanto, en base a dicha finalidad que su representatividad debe ser medida. En este sentido, la web ofrece la posibilidad de configurar un corpus X que sea representativo de Y para la finalidad Z. Por consiguiente, se puede afirmar que la web, a pesar de las dificultades, sí es una alternativa válida, es decir, la web como o para corpus puede ser útil para optimizar las tareas (pre-)lexicográficas. Esta argumentación es, por lógica extensión, igualmente válida para los corpus de nueva generación originados a partir de material web. A lo largo del artículo se ha observado que el trabajo con los corpus tradicionales disponibles así como con los corpus de la Universidad de Leipzig es costoso y poco rentable para los fines aquí perseguidos (vid. supra 3.) y que los recursos Google y otras herramientas lingüísticas (vid. supra 2.3, 4.1), a pesar de ser de gran utilidad para cuestiones concretas, no sirven para llevar a cabo un estudio como el aquí planteado. También se ha comprobado que el uso de material web para fines lingüísticos, a pesar de ser polémicamente discutido, resulta útil y ventajoso (vid. supra 4., 5.). De ahí que este texto concluya con un alegato en pro de los corpus COW, pues son totalmente comparables entre sí tanto en tamaño y composición como en relación a la variedad geográfica y al intervalo cronológico que abarcan. Su gran extensión y la actualidad de sus textos no solo permiten establecer frecuencias de uso e identificar fenómenos lingüísticos y estructuras recurrentes, sino también registrar aquellos casos excepcionales y poco estudiados; y además, aunque automáticamente, están etiquetados (vid. supra Tabla 1 y 2). No obstante, el desiderátum final aboga por la mejora en el aprovechamiento de dichos corpus, en la medida en que se haga posible recuperar información sobre las fuentes y otros metadatos, se revise la anotación morfosintáctica y se optimicen las condiciones de uso, búsqueda y, sobre todo, acceso a los mismos.

Sobre algunos conflictos en la 'pre'-lexicografía

267

Referencias bibliográfícas Baroni, Marco / Bernardini, Silvia / Ferraresi, Adriano / Zanchetta, Eros (2009): «The WaCky Wide Web: A Collection of Very Large Linguistically Processed Web-Crawled Corpora», Language Resources and Evaluation, 43.3, 209-226. Baroni, Marco / Bernardini, Silvia (2004): «Bootcat: Bootstrapping corpora and terms from the web», Proceedings of LREC 2004, 1313-1316. Beißwenger et al. (2012): «A TEI Schema for the Representation of Computer-mediated Communication», Journal of the Text Encoding Initiative (TEI and Linguistics), Noviembre 2012/3, 1-85. Disponible en [Consulta: 24/09/2014]. Biber, Douglas (1993): «Representativeness in Corpus Design», Literary and linguistic computing, 8.4, 246-257. Biber, Douglas / Conrad, Susan / Reppen, Randi (1998): Corpus Linguistics: Investigating Language Structure and Use. Cambridge: CUP. Biber, Douglas / Kurjian, Jerry (2007): «Towards a taxonomy of web registers and text types: a multidimensional analysis», en Marianne Hundt et al., eds., Corpus Linguistics and the Web. Amsterdam: Rodopi, 109-131. Claridge, Claudia (2007): «Constructing a corpus from the web: message boards», en Marianne Hundt et al., eds., Corpus Linguistics and the Web. Amsterdam: Rodopi, 87-108. Elkiss, Aaron / Resnik, Philip (2004): The Linguist's Search Engine User's Guide. Disponible en [Consulta: 17/09/13]. Fletcher, William H. (2011): «Corpus Analysis of the World Wide Web», en Carol A. Capelle (2011), ed., Encyclopedia of Applied Linguistics. Wiley-Blackwell, vol. III, 1339-1347. — (2001): «Concordancing the Web with KWiCFinder», Proceedings of the 3rd North American Symposium on Corpus Linguistics and Language Teaching, Boston. Borrador. Disponible en [Consulta: 17/09/13]. Fuertes-Olivera, Pedro Antonio (2012): «Lexicography and the Internet as a (Re-)source», en Rufus Hjalmar Gouws et al., eds., Lexicographica. International Annual for Lexicography / Revue Internationale de Lexicographie / Internationales Jahrbuch für Lexikographie, 28, 4970. Gamallo, Pablo / González, Isaac (2010): «Wikipedia as Multilingual Source of Comparable Corpora», Proceedings of the 3rd Workshop on Building and Using Comparable Corpora, LREC 2010, Malta, 21-25. Geycken, Alexander (2007): «The DWDS corpus: a reference corpus for the German language of the twentieth century», en Christiane Fellbaum, ed., Idioms and collocations: corpusbased linguistic and lexicographic studies. London: Continuum, 23-40. Hundt, Marianne / Nesselhauf, Nadja / Biewer, Carolin, eds. (2007): Corpus Linguistics and the Web. Amsterdam: Rodopi. Karlsgren, Jussi (2000): Stylistic Experiments for Information Retrieval. Stockholm: SU. Katinas, Daumantas (2012): Zur Position und Methodik der kontrastiven Lexikologie: eine Untersuchung am Beispiel des lexikalischen Feldes Relief im Litauischen und im Deutschen. Marburg: Tectum. Kilgarriff, Adam / Grefenstette, Gregory (2003): «Introduction to the Special Issue on the Web as Corpus», Computational Linguistics, 29.3. Reeditado en Thierry Fontenelle (2008), ed., Practical Lexicography: a Reader. Oxford: OUP, 89-101. Kupietz, Marc / Belica, Cyril / Keibel, Holger / Witt, Andreas (2010): «The German Reference Corpus DeReKo: A primordial sample for linguistic research» en Nicoletta Calzolari et al., eds., Proceedings of the 7th conference on International Language Resources and Evaluation, LREC 2010, Malta: European Language Resources Association (ELRA), 1848-1854.

268

Vanessa González Ribao

Leech, Geoffrey (2007): «New resources, or just better old ones? The Holly Grail of representativeness», en Marianne Hundt et al., eds., Corpus Linguistics and the Web. Amsterdam: Rodopi, 133-149. Lin, Yuri et al. (2012): «Syntactic Annotations for the Google Books Ngram Corpus», 50th Annual Meeting of the Association for Computational Linguistics (ACL2012), Korea. Disponible en [Consulta: 24/09/2014]. Lüdeling, Anke / Evert, Stefan / Baroni, Marco (2007): «Introduction Using web data for linguistic purposes», en Marianne Hundt et al., eds., Corpus Linguistics and the Web. Amsterdam: Rodopi, 7-24. Meliss, Meike (2013a). «Das zweisprachige Wörterbuch im bilateralen deutsch-spanischen Kontext. Alte und neue Wege», en Mª José Domínguez Vázquez, ed., Trends in der deutschspanischen Lexikographie (Sapnische Akzent 1), 61-87. — (2013b): «Online-Lexikographie im DaF-Bereich: Eine erste kritische Annäherung: Bestandsaufnahme – Nutzen – Perspektiven», Real Revista de Estudos Alemães, 4, 176-199. — (2013c): «Das verbale Kombinationspotenzial in einsprachigen DaF-Lernerwörterbüchern: Kritische Bestandsaufnahme – Neue Anforderungen», ZDaF (en prensa). Meliss, Meike / Sánchez Hernández, Paloma (2014): «Theoretical and methodological foundations of the DICONALE project: a conceptual dictionary of German and Spanish», en João Paulo Silvestre et al., eds., Dicionários que não existem. Tipologias lexicográficas. Lissabon. (en prensa) Meyer et al. (2003): «The World Wide Web as Linguistic Corpus», en Pepi Leistyna, Charles F. Meyer, eds., Corpus Analysis. Language Structure and Language Use. Amsterdam/New York, 241-254. Quasthoff, Uwe / Richter, Matthias / Biemann, Christian (2006): «Corpus Portal for Search in Monolingual Corpora», Proceedings of the LREC 2006, Genova, 1799-1802. Renouf, Antoinette / Kehoe, Andrew / Banerjee, Jay (2005): «The WebCorp Search Engine: a holistic approach to Web text Search», Electronic Proceedings of CL2005, University of Birmingham. Disponible en [Consulta: 24/09/2014]. Schaefer, Roland / Bildhauer, Felix (2012): «Building Large Corpora from the Web Using a New Efficient Tool Chain», en Nicoletta Calzolari et al., eds., Proceedings of the Eight International Conference on Language Resources and Evaluation (LREC'12), ELRA, 486493. Searle, John R. / Vanderveken, Daniel (1985): Foundations of Illocutionary Logic. Cambridge: CUP. Sinclair, John McHardy (1991): Corpus, concordance, collocation. Oxford: OUP. Storrer, Angelika (2012): «Neue Text- und Schreibformen im Internet: Das Beispiel Wikipedia», en Juliane Köster, Helmuth Feilke, eds., Textkompetenzen für die Sekundarstufe II. Freiburg: Fillibach, 277-304. — (2010): «Über die Auswirkungen des Internets auf unsere Sprache», en Hubert Burda, Mathias Döpfner, Bodo Hombach, Jürgen Rüttgers, eds., 2020 – Gedanken zur Zukunft des Internets. Essen: Klartext Verlag, 219-224. Wilks, Yorick (2004): «On the Ownership of Text», Computers and the Humanities, 38,2, 115127.

Sobre algunos conflictos en la 'pre'-lexicografía

269

Corpus y recursos lingüísticos ADESSE. Base de datos de Verbos, Alternancias de Diátesis y Esquemas Sintáctico-Semánticos del Español: < http://adesse.uvigo.es/>. BDS. Base de Datos Sintácticos del español actual: < http://www.bds.usc.es/>. BootCat. Simple Utilities to Bootstrap Corpora And Terms from the Web: . CORDE. Corpus diacrónico del español: < http://corpus.rae.es/cordenet.html>. COW. Corpora from the Web: < https://hpsg.fu-berlin.de/cow/>. Consultado con COLiBrI, COW's Light Browsing Interface: < http://hpsg.fu-berlin.de/cow/colibri/>. CREA. Corpus de referencia del español actual: < http://corpus.rae.es/creanet.html>. CWB. The IMS Open Corpus Workbench: < http://cwb.sourceforge.net/>. Davies Corpus: CdE, Corpus del Español y GBS, Google Books Spanish: . DeReKo. Deutsches Referenzkorpus: < www.ids-mannheim.de/DeReKo>. Consultado con COSMAS II, Corpus Search, Management and Analysis System: . DWDS. Das Digitale Wörterbuch der deutschen Sprache: . GNV. Google Ngram Viewer: . KWiCFinder. Key Word in Context search tool for the web: Lemurproject. The Lemur Project: . LexisNexis. Deutschesprachige Quellen: . LSE. Linguist's Search Engine: . WaCky. The Web-As-Corpus Kool Yinitiative: . WiSo. Datenbank für Hochschulen: . WebCorp. Concordance the web in real-time: . Wortschatz Uni Leipzig: .

 Propuestas para un diccionario conceptual bilingüe para Ele y DaF: ¿Qué aportan los diccionarios de aprendizaje para situaciones de expresión escrita en lengua extranjera? Meike Meliss Universidad de Santiago de Compostela / Red de Lexicografía RELEX

Some proposals for a conceptual bilingual dictionary of German and Spanish as foreign languages. Abstract This paper presents some theoretical and methodological foundations of the research project DICONALE, which concerns the development of an online dictionary of verbal lexemes with a special conceptual-onomasiological access and a paradigmatic structure in response to studies which have shown that conventional dictionaries (both monolingual and bilingual), do not satisfy the specific needs of users involved in the production of texts in foreign language. Keywords bilingual lexicography, learner dictionaries, paradigmatic sense relations, syntagmatic relations.

1. Introducción Esta aportación se centra en la relevancia de un tratamiento específico de la variedad y la variación léxica en determinadas obras lexicográficas a nivel inter- e intralingual para favorecer los contextos de la expresión (escrita) en alemán y/o español como lenguas extranjeras (en adelante: DaF y Ele). Partiendo de un análisis crítico de algunas obras lexicográficas seleccionadas para conocer su utilidad en el proceso de output en la lengua extranjera (en adelante: L2), se somete a discusión una propuesta lexicográfica innovadora elaborada en el marco del proyecto de investigación



272

Meike Meliss

DICONALE1 y que surge de las deficiencias lexicográficas en contextos de la producción lingüística en DaF y Ele. A la hora de producir un texto en lengua extranjera – sea como expresión libre o vinculado al proceso de traducción - es de suma importancia, disponer del léxico adecuado junto con toda la información lexicológica relevante para verbalizar la intención comunicativa concreta en cuestión. Este estudio parte de la observación que tanto los procesos de búsqueda de lexemas adecuados - a veces incluso desconocidos en contextos de L2 - que lexicalicen o bien un concepto determinado en consonancia con la intención comunicativa del hablante L2 o que sirvan de equivalente de traducción, al igual que los mecanismos de selección del lexema adecuado entre la posible variedad léxica en la lengua meta, siguen caracterizándose por un tratamiento deficitario en la lexicografía actual de las lenguas que aquí nos interesan (cfr. Meliss 2013a, 2013b, 2014a, 2014b). La oferta informativa para el adecuado y correcto uso del lexema seleccionado en la lengua meta L2 resulta igualmente insuficiente en el contexto de la producción en L2 y requiere un tratamiento más adaptado a la situación de uso que aquí está en el centro del interés. Por consiguiente, el capítulo 2 de esta aportación examinará la utilidad de diferentes diccionarios bi- y monolingües para los procesos de producción en L2. Como propuesta lexicográfica alternativa a los déficits que resultan del análisis, se presentarán en el capítulo 3 algunos aspectos relevantes del proyecto DICONALE. En consonancia con los objetivos aquí dibujados, se encuentran en el centro del interés de esta aportación (i) el proceso de búsqueda de lexemas adecuados para el proceso de producción en L2, (ii) los mecanismos de selección entre la posible variedad de expresión a nivel inter- e intralingual y (iii) la oferta informativa para su uso adecuado en procesos de producción en la respectiva L2. Los análisis se basan de modo ejemplar en algunas posibles verbalizaciones que existen en ambas lenguas para expresar el concepto PERCEPCIÓN AUDITIVA. A su vez, los fundamentos empíricos resultan de los estudios pertinentes basados en los corpus lingüísticos de referencia DeReKo/Cosmas II para el alemán y CREA para el español.2

2. El acercamiento a diferentes tipos de diccionarios en el proceso de la expresión (escrita) en contextos de L2: buscar – seleccionar - usar A la hora de redactar un texto en una lengua extranjera y querer expresar determinados conceptos e ideas estamos sujetos a la búsqueda de verbalizaciones adecuadas, a la selección entre la variedad de posibilidades y finalmente a la necesidad de conocer las reglas para el uso correcto del lexema elegido. –––––––— 1

2

Esta aportación se ha elaborado en el marco de los proyecto de investigación DICONALEestudios (Xunta de Galicia: IN.CI.TE: 10PXIB204188PR) y DICONALE-online (MINECOFEDER: FFI2012-32658) y en relación con la red lexicográfica RELEX (Xunta de Galicia/FEDER: CN2012/290). Para la base empírica de DICONALE véase González Ribao (2014) (en este mismo tomo).

Propuestas para un diccionario conceptual bilingüe para Ele y DaF

273

Metodológicamente podemos enfrentarnos de diferente manera a la tarea. En contextos de L2 preferentemente se realiza la consulta mediante diccionarios bilingües y diccionarios monolingües pedagógicos. Es menos frecuente la consulta en obras lexicográficas específicas, como pueden ser los diccionarios de relaciones paradigmáticas y sintagmáticas o en obras con una perspectiva onomasiológica,3 ya que no suele estar disponible tal variedad de obras lexicográficas, al no ser que tengan un acceso en línea que permita al usuario una búsqueda gratuita, cómoda y rápida. Por este motivo se analizarán a continuación con especial atención las obras de consulta online que están a disposición del usuario que aquí se enfoca.

2.1. Los diccionarios bilingües En los diccionarios bilingües de las lenguas en cuestión, la búsqueda y selección del lexema adecuado resulta a menudo dificultosa tanto por la escasa desambiguación semántica y sintáctica en caso de polisemia en la L2 como lengua de partida, como por la falta de criterios coherentes que restringen la selección en caso de equivalencias múltiples en la L2 como lengua de llegada. La falta de información lexicológica detallada y distintiva para la lengua de llegada dificulta además su correcto uso en caso de tratarse de L2 (Meliss 2011, 2013a, 2013b, 2014a). En el proceso de búsqueda de un lexema adecuado mediante la consulta en diccionarios bilingües se presentan a mayores las siguientes dos dificultades. A la hora de partir de la lengua materna (L1) solo podemos buscar lo que está lexicalizado en la L1 como lengua de partida y se nos “escapa” todo aquello para lo cual no existen verbalizaciones en la L1 pero si en L2. Los vacíos léxicos que quedan sobre todo plasmados en estudios contrastivos de paradigmas léxico-semánticos son un buen ejemplo de ello (González Ribao / Proost 20144; Proost 2007). Los diccionarios delimitan además el número de sus entradas según criterios comerciales y en consonancia con el tamaño y su usuario mediante determinados criterios, entre los cuales se puede mencionar la frecuencia de uso. De ese modo resulta evidente que determinados lexemas no aparecen en las obras de consulta y el número de equivalencias para un lexema en L2 como lengua de llegada sea igualmente restringido. –––––––— 3

4

Los diccionarios onomasiológicos clásicos como son p. ej. para el alemán las obras de Dornseiff et al. (20048) y de Wehrle / Eggers (1961/199317) o el diccionario ideológico de Casares (1942/2011) para el español nos ofrecen una primera visión acerca de la variedad de posibles lexicalizaciones, pero no aportan datos que ayuden a la selección de uno u otro y no aseguran su correcto y adecuado uso en una situación de producción en L2, ya que se trata únicamente de listas de palabras (cfr. Hausmann 1990a y b; Engelberg / Lemmnitzer 2001/20094; Meliss 2005). Además se trata de diccionarios específicos que en la situación aquí en cuestión no suelen estar disponibles. Un caso especial dentro de esta tipología son los diccionarios visuales, que gozan de más aceptabilidad en entornos de L2. En este mismo volumen.

274

Meike Meliss

Se puede afirmar, pues, que los diccionarios bilingües no siempre aportan la información adecuada para los procesos de búsqueda, selección y uso en el proceso de la producción lingüística en la L2 (cfr. Fuentes Morán 1997; Model 2010). Por ello, el usuario acude a menudo mediante los enlaces externos a la información que ofrecen los diccionarios en línea para así ampliar su consulta a diccionarios monolingües generales y/o diccionarios específicos, como son p. ej. los diccionarios de relaciones paradigmáticas. A modo de ejemplo es de mencionar que los diccionarios bilingües en línea de los portales de Leo y Pons ponen a disposición del usuario un amplio repertorio de recursos externos a obras lexicográficas y corpus lingüísticos para el español y el alemán (figuras 1-2). Pero en un contexto de L2 estas obras resultan a menudo inadecuadas, no solo por su complejidad informativa debido al hecho de seguir principalmente un enfoque dirigido hacia usuarios de L1 (Español: MM, DRAE, CLAVE, etc.; Alemán: OWID, DWDS, Wortschatz UniLeipzig, etc.) sino también debido a la falta de una preparación lexicográfica adecuada del usuario aquí en cuestión.5

Figura 1: Links externos del diccionario bilingüe alemán/español del portal de Pons para consultas en otras obras lexicográficas del español y del alemán

 –––––––— 5

El usuario L2 que no ha recibido una instrucción previa no sabe, en general, aprovechar la cantidad de información modular que ofrecen portales como DWDS, Wortschatz UniLeipzig o cannoNet.

275

Propuestas para un diccionario conceptual bilingüe para Ele y DaF



        

           

              

     

Figura 2: Links externos del diccionario bilingüe alemán/español en línea de Leo para consultas en otras obras lexicográficas del español y del alemán

2.2. La búsqueda, selección y uso en diccionarios específicos de relaciones paradigmáticas y sintagmáticos 2.2.1. Los diccionarios específicos de estructuración paradigmática permiten una búsqueda mediante la indicación de relaciones léxico-semánticas entre diferentes lexemas. A parte de las versiones clásicas en formato print, se puede acceder mediante diferentes portales lexicográficos a módulos que ofrecen información paradigmática de significado.6 Los diccionarios bilingües arriba mencionados (cap. 2.1.) ofrecen enlaces directos a alguno de estos recursos lexicográficos (figuras 1-2).7 Pero tanto su formato clásico print como los correspondientes módulos de los portales lexicográficos mencionados, muestran poca información para la selección y el uso en contextos de producción en L2.8 Suelen ser sobre todo listas de palabras con diferentes recursos lingüísticos, escasea la información que facilite la selección de uno u otro lexema y carecen de información que pueda asegurar un correcto uso, ya que, en general, no son sinonimias distintivas. La posibilidad de ampliar la información mediante mecanismos de enlaces con otros módulos informativos del –––––––— 6

7

8

Para el alemán son de especial mención los módulos de los siguientes portales y diccionarios online: elexiko, DWDS, Wortschatz Uni-Leipzig, cannoNet, woxikon, Wörterbuch für Synonyme, OpenThesaurus, etc.. Para el español se pueden nombrar entre otros el “diccionario de sinónimos” diccionarios.com y la información ofrecida en WordReference. OWID ofrece enlaces externos a cannoNet, Wortschatz Uni-Leipzig ofrece enlaces externos a la versión electrónica del diccionario onomasiológico de Dornseiff et al. (20048) y DWDS enlaza con OpenThesaurus. El portal WordReference enlaza la información con los materiales lexicográficos de la editorial española Espasa-Calpe así como con el DRAE y el portal diccionarios.com enlaza con materiales de las editoriales Vox y Larousse. Véanse los siguientes ejemplos para la información sobre relaciones paradigmáticas de sentido en ambas lenguas: Alemán: (a) Módulo informativo de DWDS para la entrada zuhören, (b) secuencia del portal canooNet para la entrada zuhören. Español: (a) escuchar del portal diccionarios.com (“diccionario de sinónimos”), (b) oír del portal WordReference.

276

Meike Meliss

mismo portal o incluso mediante enlaces externos facilita, sin embargo, la ampliación de la información y proporciona al usuario una considerable ventaja frente a los diccionarios clásicos print, pero requiere por parte del usuario un elevado conocimiento sobre los diferentes recursos lexicográficos online para no correr el peligro de perder la orientación (lost in hyperspace: Haß / Schmitz 2010: 4).9 Con alguna excepción no existen hasta el momento obras lexicográficas con acceso en línea que se basan en amplios estudios de paradigmas léxico-semánticos complejos10 (cfr. Meliss 2005). 2.2.2. Los diferentes diccionarios específicos de relaciones sintagmáticas y especialmente los diccionarios de construcciones, colocaciones y de régimen verbal deben ofrecer al interesado sobre todo la información pertinente para el correcto uso. Si bien existen para ambas lenguas diferentes tipos de diccionarios sintagmáticos en formato print,11 hay que afirmar que para la situación que aquí nos interesa, escasea la oferta en la red. Ninguno de los links externos ofrecidos a diccionarios arriba mencionados (cap. 2.1.: figuras 1-2) lleva al usuario a una información explícitamente sintagmática. Únicamente un buen conocedor de los diferentes recursos electrónicos sabe, por ejemplo, que el diccionario de valencias verbales del alemán VALBU (2004) tiene una versión electrónica E-Valbu a la que se accede desde la página Web del IDS de Mannheim, que a través del portal OWID se accede al diccionario elexiko y a los módulos de colocaciones, construcciones y gramática con la información pertinente sobre la combinatoria, y que detrás de los links externos a los diccionario DWDS y Wortschatz Uni Leipzig se esconde p. ej. información sintagmática en torno al potencial combinatorio mediante información generada automáticamente y visualizado con los “Wortprofile”. En caso de acceder a esta información resulta por otra parte de difícil interpretación en entornos DaF sin haber tenido una instrucción lexicográfica previa. –––––––— 9

10

11

El acceso a la información de WordNet, GermaNet, WordNetespañol y EuroWordNet etc. está fuera del alcance de un usuario de DaF o Ele. La información ofrecida en estas redes requiere un proceso de adaptación para los entornos DaF y Ele. Merece especial atención el diccionario en línea que trata los verbos de comunicación del alemán (KV-online), alojado en el portal lexicográfico OWID del IDS de Mannheim. Esta versión online se basa en la versión print de Harras et al. (2004, 2007). Para el español podemos mencionar el prototipo DiCe ( diccionario de colocaciones del español) que ofrece las colocaciones en torno a los “sustantivos de sentimiento” (Alonso Ramos 2004, 2008). De especial mención son los diccionarios con información sintagmática que facilitan al usuario la información adecuada para sus necesidades de producción y por tanto la información sobre la correcta y adecuada combinatoria, como son p. ej., para el alemán los diccionarios de colocaciones (p. ej.: Quasthoff 2011; Duden Stilwörterbuch 20109) y los diccionarios de valencias (p. ej. VALBU 2004). Para el español destacan las obras lexicográficas de Seco et al. (DEA: 1999) y Cuervo (1953/1998) con información sobre el régimen verbal, los diccionarios combinatorios (Bosque 2004) y el proyecto lexicográfico para la elaboración del Diccionario Coruña (Porto Dapena et al. 2007, 2008).

Propuestas para un diccionario conceptual bilingüe para Ele y DaF

277

Para la información sintagmática del español estamos igualmente ante una situación compleja. No está disponible en línea ninguna de las obras lexicográficas con un enfoque específicamente sintagmático y proyectos como el diccionario de colocaciones del español (DiCE: Alonso Ramos 2004, 2008), el diccionario de aprendizaje del español como lengua extranjera (DAELE: Battaner Arias 2008; Bernal / Renau 2010) o el diccionario contrastivo de valencias verbales: españolalemán (DCVVEA: Domínguez Vázquez et al. 2008a, 2008b) hasta el momento son o bien únicamente prototipos o bien abarcan un número reducido de entradas. 2.2.3. Los diccionarios monolingües pedagógicos / de aprendizaje: Ante la situación arriba descrita, los diccionarios monolingües pedagógicos / de aprendizaje para DaF 12 y Ele 13 pretenden ofrecer una alternativa tanto a los diccionarios bilingües como a los diccionarios monolingües generales. Sin embargo, la búsqueda de lexemas desconocidos en diccionarios monolingües de aprendizaje de L2 lleva a pocos resultados satisfactorios para la situación que aquí nos preocupa, ya que dichos diccionarios siguen un orden alfabético y una perspectiva semasiológica que no favorece la tarea de buscar y encontrar un lexema de antemano desconocido. A excepción del diccionario pedagógico alemán de Kempcke et al. (1999), 14 la lexicografía pedagógica monolingüe para entornos de DaF y Ele ha reaccionado hasta el momento de forma insuficiente a los problemas específicos de búsqueda y selección de un lexema adecuado a la hora de producir un texto en L2, ya que no ofrecen alternativas reales a las consultas semasiológicas por orden alfabético.15 De allí que el interés de la consulta lexicográfica mediante este tipo de obras pedagógicas para los fines aquí en cuestión, se centra primordialmente en la información que pueden ofrecer éstas para el correcto uso. Se ha observado en la última década un enorme esfuerzo – sobre todo en el ámbito de DaF – para incorporar información de uso que se materializa por un lado en la información acerca de las relaciones paradigmáticas de sentido que aportan –––––––— 12

13

14

15

En este estudio se ha delimitado el análisis a los diccionarios DaF de Götz et al. (LGWBDaF: 2007, 2010) y de Kempcke et al. (1999). Para más información sobre diccionarios de aprendizaje para DaF remito a los estudios de Meliss (2013b, 2014a, 2014b). Se ha delimitado aquí el análisis a los diccionarios Ele de Salamanca (DSA: 2006), de Alcalá (DA: 1995) con libre acceso restringido desde el portal y el análisis de DAELE. Otros diccionarios para el uso en situaciones de Ele, como puede ser el diccionario Clave con libre acceso online o el DEE (2002) no se han tenido en cuenta. Kempcke et al. (1999) combina en su diccionario para DaF el proceso de búsqueda desde una perspectiva semasiológica con una perspectiva onomasiológica. A falta de una preparación lexicográfica adecuada, el usuario no se suele aprovechar de esta oferta informativa. La representación de las interrelaciones entre el léxico está además muy limitada en el marco de un diccionario print (Roelcke 2002). En este lugar hay que mencionar el Diccionario Coruña (Porto Dapena et al. 2007, 2008) que, aunque no se haya concebido expresamente como diccionario para Ele, presenta como novedad un carácter reversible. Se propone añadir a la parte semasiológica una parte onomasiológica. La interrelación de ambas partes se expone a modo de ejemplo con los verbos relacionados con la alimentación (Porto Dapena et al. 2007).

278

Meike Meliss

recursos para la variedad estilística de expresión (Wolski 2002) y por otro en la información combinatoria. 16 El diccionario para DaF analizado aquí de forma ejemplar (figura 3) ofrece información a nivel semántico (relaciones paradigmáticas de significado y rasgos semánticos distintivos) que permite la selección de una u otra acepción junto con la información combinatoria que abarca el rasgo sintáctico de la transitividad, el esquema actancial, el contorno sintáctico-semántico y colocaciones frecuentes.

Figura 3: horchen de LGWBe-DaF (2007) y resumen esquemático de la información

Los diccionarios de Ele, y concretamente los diccionarios de Salamanca (DSA 2006) y de Alcalá (DA 1995) ofrecen información a nivel semántico mediante perífrasis y relaciones paradigmáticas de significado que facilitan la selección de una u otra acepción. El uso de una u otra acepción se describe además mediante información sobre la combinatoria que abarca la transitividad, indicaciones sobre el esquema actancial y el contorno sintáctico- semántico. Las colocaciones más frecuentes, sin embargo, no se contemplan (figuras 4-5):

Figura 4: escuchar de DSA (2006) y resumen esquemático de la información

–––––––— 16

En el ámbito de DaF son de especial interés los estudios lexicográficos que tratan los esquemas sintácticos (Dentschewa 2006; Gouws 1998; Schafroth 2002) y la inclusión de las combinaciones usuales o colocaciones (Köster / Neubauer 2002; Lehr 1998).

Propuestas para un diccionario conceptual bilingüe para Ele y DaF

279

280

Meike Meliss

Figura 5: escuchar de DA (formato online: cfr. diccionario.com: Portal vox-Larousse) y resumen esquemático de la información

Entre los diccionarios pedagógicos de Ele destaca además el “Diccionario de aprendizaje del español como lengua extranjera” (DAELE). “Es un diccionario monolingüe, dirigido a estudiantes de nivel avanzado, pensado principalmente para la producción” (cfr. presentación del diccionario en la propia web), que ofrece en línea la información acerca de 363 verbos17 del español y su combinatoria (figura 6). Es el único diccionario de Ele que aporta información sistemática sobre el potencial combinatorio mediante información acerca de las colocaciones más frecuentes y abundantes ejemplos:

Figura 6: sentir de DAELE (secuencia)

Según el diccionario DaF y Ele en cuestión, la descripción de los mencionados parámetros puede ser más o menos sistemática y rigurosa, como queda expuesto en los ejemplos (figuras 3-6). A pesar de tratarse de diccionarios que pretenden aportar la información necesaria al usuario para procesos de redacción en L2, tal como queda expuesto en sendos prefacios, no gozan de un elevado índice de uso. Los –––––––— 17

DAELE es un diccionario todavía en construcción que se desarrolla en el Institut Universitari de Lingüística Aplicada de la Universitat Pompeu Fabra (cfr. Battaner Arias 2008; Bernal / Renau 2010).

Propuestas para un diccionario conceptual bilingüe para Ele y DaF

281

motivos pueden ser, entre otros, la falta de accesibilidad al carecer en la mayoría de los casos de un libre acceso en línea.18 En resumen, cabe decir que tanto los procesos de búsqueda para lexemas desconocidos en la lengua extranjera como la selección del lexema adecuado y posteriormente su correcto uso con información detallada sobre el potencial combinatorio requieren del usuario una gran competencia lexicográfica.19 La gran oferta informativa a la que puede acceder el interesado mediante los portales lexicográficos no se aprovecha suficientemente, debido a un desconocimiento generalizado de la información que se encuentra detrás de cada portal. Además se puede afirmar que en general excede la capacidad de un estudiante de lengua extranjera. Surge, pues, la propuesta de un nuevo tipo de diccionario DICONALEonline que se presenta a continuación.

3. DICONALE: buscar – seleccionar – usar DICONALE-online (diccionario conceptual del alemán y del español) pretende dar una respuesta a las lagunas arriba dibujadas y quiere ofrecer información lexicológica para una situación de uso muy determinada y definida: la libre producción de textos en lengua extranjera DaF/Ele a partir de un nivel B2. Se trata de un diccionario bilingüe y bilateral de lexemas verbales y deverbales que se centra especialmente en el proceso de búsqueda y selección del lexema adecuado mediante diferentes marcos de referencia (en adelante: MR) que permiten vincular e interrelacionar desde una perspectiva inter- e intralingual los conceptos mentales y el conocimiento sobre los escenarios verbales con las posibles verbalizaciones en una y otra lengua. Para el posterior uso correcto del lexema seleccionado se ofrece una serie de informaciones lexicológicas que se presentan al usuario de forma estructurada en cuatro módulos informativos 20 (figura 7). A continuación se –––––––— 18

19 20

El diccionario de Kempcke et al. (1999) y el de Salamanca (DSA: 2006) únicamente existen en formato print, el diccionario de Götz et al. (LGWB-DaF 2010) tiene un acceso electrónico (LGWB-DaF 2009) de difícil ubicación en el portal ThefreeDictionary (ejemplo: zuhören), mientras que el diccionario de Alcalá (DA: 1995) ofrece un acceso gratuito restringido. Por otra parte, los diccionarios con libre acceso como son p. ej. Pons-DaFonline (cfr. portal Pons) y Clave (portal SM) aportan escasa información a nivel sintagmático. Únicamente el diccionario DAELE ofrece mediante un acceso libre una amplia información especialmente dirigida a situaciones de producción, pero de momento no abarca más que una selección de algo menos de 400 verbos. La información que nos aportan los FrameNet (Boas 2013; Boas / Dux 2013) tampoco no suele estar al alcance de los usuarios aquí enfocados. Se ha confeccionado un modelo de descripción de 5 niveles mediante el cual se establecen las bases para la Macro- Medio- y Microestructura del diccionario a nivel inter- e intralingual. Para información más detallada sobre las bases teóricas y metodológicas de DICONALE remito a los siguientes estudios, elaborados en torno al proyecto: Meliss / Sánchez Hernández (2014), González Ribao / Meliss (2014), Egido Vicente / Fernández Méndez / Franco Barros (2014) y Fernández Méndez / González Ribao / Meliss (2014).

282

Meike Meliss

describen los mecanismos de búsqueda y selección y los parámetros lexicológicos que se ofrecen para su uso:



Figura 7: Los 4 módulos de descripción del modelo DICONALE

3.1. Buscar lo desconocido y seleccionar DICONALE-online quiere ofrecer nuevas opciones de búsqueda en la lexicografía pedagógica para procesos de producción en L2. Para ello centra su atención en un acceso al diccionario desde una perspectiva conceptual-onomasiológica. La Macroestructura del futuro diccionario se constituye en una primera fase de trabajo de 10 campos conceptuales (CC) con sus respectivos subcampos conceptuales (SCC) de diferentes grados de especificación. En el caso de AUDICIÓN se trata de un SCC de primer grado (SCC1), asociado al CC de la PERCEPCIÓN. El usuario accede al diccionario principalmente desde una perspectiva conceptual que puede realizar en alemán o español como L1 o L2 según la opción inicialmente predeterminada. Se le ofrece un detallado sistema de búsqueda guiada y oferta multiselección para encontrar una forma léxica adecuada en combinación con la información pertinente para el uso correcto en relación a los propósitos comunicativos. Dos marcos de referencia (en adelante: MR) que a la vez sirven de tertium comparationis entre ambas lenguas forman las guías principales a las que se añaden en pasos sucesivos otras opciones para afinar la selección de una u otra variante léxica. El primer MR abarca las referencias conceptuales con diferente grado de especificación (MR1) mientras que el segundo se aproxima a la descripción del escenario verbal indicando los diferentes roles semánticos involucrados (MR2). Ambos marcos de referencia forman la base para la principal opción de acceso al diccionario (acceso 1) que a su vez permite diferentes especificaciones (1a-c). A mayores se ofrece también una búsqueda clásica por orden alfabético de los lemas (acceso 2), cuya opción no lleva, sin embargo, ni a equivalentes de traducción ni a una perspectiva semasiológica



Propuestas para un diccionario conceptual bilingüe para Ele y DaF

283

tradicional, sino reconduce al usuario a una información guiada por los marcos de referencia arriba indicados. En la figura 8 se visualizan los diferentes modos de búsqueda y los accesos iniciales que a continuación se presentan detalladamente:

Figura 8: Diferentes posibilidades de acceso inicial a DICONALE-online para el proceso de búsqueda de formas de expresión21

3.1.1. El marco de referencia 1: En el caso de querer conocer en la L2 todas las posibles lexicalizaciones para los conceptos PERCEPCIÓN & AUDICIÓN, el interesado selecciona mediante la estructura inicial del diccionario el CC PERCEPCIÓN y a continuación, en un menú desplegable se le ofrece la posibilidad de especificar su consulta en diferentes grados. La especificación conceptual del primer grado llevaría a los SCC AUDICIÓN / VISUAL / TACTIL / OLFATO / GUSTO. El resultado de esta búsqueda por conceptos de primer grado son listados de lemas que lexicalizan en ambas lenguas los conceptos básicos buscados. Estos listados incluyen en ambas lenguas lemas verbales simples, afijados y también formas léxicas complejas y otras construcciones frecuentes así como una selección de nombres, adjetivos y adverbios deverbales, como puede verse a modo de ejemplo en la figura 9 para las posibles lexicalizaciones de AUDICIÓN. Estos listados resultan únicamente útiles si posteriormente se usan los enlaces creados en cada –––––––— 21

Las figuras 8-13 no reproducen la interfaz de la aplicación web del futuro Diccionario DICONALE.

284

Meike Meliss

lema para acceder a la información lexicológica relevante que permita asociar mediante la especificación conceptual una acepción a un paradigma léxicosemántico (cfr. apartado 3.1.3. y figura 12):

Figura 9: Listado de lemas: posibles lexicalizaciones en alemán y español para AUDICIÓN

Si por otra parte, el usuario prosigue con una búsqueda por conceptos cada vez más específicos, es conducido directamente a los diferentes paradigmas léxicosemánticos. Para ello es necesario ofrecerle un marco de referencias conceptuales muy específicas. Así, p. ej. la selección de los conceptos PERCEPCION & AUDICIÓN & INTENCIONALIDAD & ATENCIÓN conduce a un Paradigma léxico-semántico (Pls3) determinado y se diferencia de otros posibles Pls vinculados igualmente al concepto PERCEPCIÓN AUDITIVA por corresponder a un MR1 diferente. Como resultado de esta búsqueda recibimos los recursos lingüísticos de ambas lenguas mediante los cuales se verbalizan los conceptos específicos en cuestión y que corresponden al mismo MR1. La figura 10 (cfr. apéndice 1) refleja de forma ejemplar el resultado de la búsqueda realizada mediante la especificación conceptual correspondiente al MR1 (alemán: (sich) anhören1, zuhören1, hören2, horchen1, lauschen1; español: escuchar 2 y oír2). Una selección de ejemplos ilustra el significado de cada lexema en cuestión. Por consiguiente, no se incluyen en este paradigma lexemas como al. abhören, abhorchen, belauschen, etc. y esp.: auscultar, etc., ya que no corresponden en ninguna de sus posibles acepciones al MR1 establecido para el Pls3. 3.1.2. La búsqueda mediante el marco de referencia 2: Para los fines aquí relevantes es preciso delimitar todavía más la búsqueda iniciada mediante el MR1. El usuario parte con sus necesidades comunicativas no solamente de unos conceptos determinados para los que busca posibilidades de expresión. Parte también de un escenario concreto que quiere verbalizar en la L2. Mediante la descripción de los

Propuestas para un diccionario conceptual bilingüe para Ele y DaF

285

escenarios se especifica la búsqueda y selección de posibles lexemas para las necesidades comunicativas concretas. En base al paradigma Pls3 que corresponde al marco de referencias conceptuales PERCEPCIÓN & AUDICIÓN & ATENCIÓN & INTENCIONALIDAD, se ejemplifica a continuación esta búsqueda y selección guiada por el MR2. Los diferentes roles que participan en el escenario de “escuchar atentamente” son entre otros: el perceptor (R1), la actividad perlocutiva percibida (R2), la persona percibida como fuente acústica (R3), la entidad no animada percibida como fuente acústica (R4) y el sonido percibido (R5). En base a la participación de dichos roles se realizan diferentes estructuras argumentales del lexema verbal: A1 A2, A1 A3, etc. Si el usuario quiere decir “alguien atiende con el oído a lo que dice alguien”, alude a un escenario concreto en el que participan un perceptor (R1) y la actividad perlocutiva de una persona (R2). En consecuencia, los roles que participan en el escenario y que corresponden en este caso concreto al esquema argumental alguien A1 V algo A2 constituyen el segundo marco de referencias comunes. Para las necesidades de output en L2 el usuario únicamente busca los lexemas del paradigma léxico-semántico con los que pueda verbalizar su escenario ideado. En función de la estructura argumental (cantidad y calidad de los argumentos) que puede seleccionar el usuario, se le ofrece un conjunto u otro de posibles variantes léxicas en un mismo Pls al compartir ambos marcos de referencia22 (figura 11, cfr. apéndice 1). La opción de especificación y delimitación que proporciona el MR2 es relevante, ya que no todos los lexemas de un mismo Pls comparten los mismos escenarios. Así, por ejemplo, podemos observar que según la información empírica sobre las posibles coocurrencias de lauschen y zuhören (CCDB: Belica 2011), el verbo lauschen aparece frecuentemente vinculado al escenario: “alguien (R1: perceptor) sigue atentamente con el oído un sonido (R5: sonido: Klang, Gesang, Geräusch…)”, mientras que zuhören prioriza otros escenarios (p. ej.: R1: perceptor & R3: fuente acústica animada: Leute …). Una vez seleccionada la variante léxica que más se ajuste a las necesidades comunicativas, el usuario puede obtener en un siguiente paso información lexicológica detallada correspondiente a los cuatro módulos de descripción (cfr. figura 8). Aunque la perspectiva conceptual de DICONALE favorece el acceso desde la L2, se permite también el acceso desde el español y el alemán como L1. En cualquier caso la búsqueda y selección siempre pasa por ambos marcos de referencias y no se ofrecen posibles equivalencias en la lengua de contacto (con la opción de obtener la información léxica acerca de los diferentes módulos de descripción) hasta no haber desambiguado al máximo a nivel semántico y sintáctico mediante ambos marcos de referencia (figura 12).23 –––––––— 22

23

Cfr. Engelberg (2010, 2014), Engelberg et al. (2011), Engelberg et al. (eds., 2012). El volumen de Engelberg / Meliss / Proost / Winkler (eds., 2014) reúne algunos estudios que analizan las estructuras argumentales referentes a algunos paradigmas verbales en contraste (alemán-español). Para la discusión teórica sobre diferentes aspectos generales de la lexicografía bilingüe remito a los siguientes estudios: Fuentes Morán / Model (2009), Haensch / Omeñaca (20042), Hausmann (1991), Hausmann / Werner (1991), Korhonen (2001), Meyer /

286

Meike Meliss

3.1.3. Búsqueda por lema: Si el interesado ya conoce alguna posible lexicalización para sus necesidades comunicativas, puede realizar en la lengua que decida una búsqueda mediante un lema por orden alfabético (acceso 2: figura 8). Al contrario de lo habitual, el resultado es en primer lugar un cuadro general del CC al que se le puede atribuir el lema en cuestión. En caso de homonimia o polisemia se indicarán los diferentes CCCC a los que pueda pertenecer (figura 12).

Figura 12: Búsqueda por lema: escuchar: vinculación con los marcos de referencias MR1 y MR2 y los correspondientes listas de lexemas y listas de variantes construccionales correspondientes a cada SPls

De ese modo escuchar se atribuye al campo conceptual PERCEPCIÓN & AUDICIÓN y se le abre al usuario la posibilidad de visualizar todos los elementos léxicos asociados a este CC (lista de lemas: figura 9). Por otra parte, mediante una especificación conceptual y con la ayuda de un ejemplo ilustrativo se asocian las diferentes acepciones de escuchar indicadas con un índice numérico (1-4) a los diferentes (sub)paradigmas léxico-semánticos correspondientes al CC AUDICIÓN. A partir de esta búsqueda el interesado llega a relacionar cada acepción con uno u otro Pls y accede al listado de los lexemas vinculados al paradigma en cuestión (figuras 10 y 11; cfr. apéndice 1). 3.1.4. Otros factores distintivos para la selección entre la variedad: En base a una descripción sistemática de los diferentes parámetros a nivel del contenido y la forma, tal como lo prevén los módulos de descripción lexicológica 2 y 3 (figura 7), se pueden plasmar las divergencias entre los lexemas que comparten los mismos marcos de referencia en un mismo (sub)paradigma léxico-semántico a nivel inter- e intralingual. Es un requerimiento imprescindible visualizar estas divergencias en su conjunto para facilitar al usuario la tarea de selección entre la variedad en situaciones de output en L2. De modo ejemplar se presenta a continuación la información correspondiente al escenario “alguien escucha lo que dice alguien” materializado en la estructura argumental A1 A2 vinculado al Pls3 del SCC AUDICIÓN. Para la selección de una de las posibilidades entre la variedad que se nos ofrece, es preciso disponer de elementos distintivos. Junto a los rasgos –––––––— Wiegand (2000), Model (2010), Ruhstaller / Gordón (2010), Werner (1998) y Wiegand (2005).

Propuestas para un diccionario conceptual bilingüe para Ele y DaF

287

semánticos distintivos [genau] y [konzentriert] son relevantes las informaciones acerca de las posibilidades combinatorias más frecuentes y sus delimitaciones distributivas. Así, el verbo anhören puede combinar con “Beschimpfung” y “Beschwerde” (= escuchar insultos, quejas) – posibilidad que no se documentó para los demás verbos del Pls3 con la estructura argumental A1 A2. Para estos casos es de especial interés tener la opción de acceder a la información sistematizada en contraste sobre las colocaciones más frecuentes de todos los lexemas de un mismo Pls (figura 12). 3.1.5. Limitaciones distributivas de uso: Paralelo a la búsqueda y selección resultan otras cuestiones de interés inter-e intralingual que están sobre todo relacionadas con el uso correcto y adecuado en situaciones de output en L2. Entre los lexemas que comparten un mismo marco de referencias conceptuales (MR1) y referencias escénicos (MR2) puede existir variedad respecto a la realización morfo-sintáctica de cada argumento y sus características semánticas (cfr. módulo 3 del modelo DICONALE: figura 7). El alcance de esta información para la producción en L2 se presenta de modo ejemplar en base a algunos lexemas seleccionados correspondientes al MR1 y MR2 agrupados en el SPls3 del SCC AUDICIÓN (figura 13, cfr. apéndice 2). El análisis demuestra, por ejemplo, que algunos lexemas verbales del SPls3al realizan el argumento A2 como complemento directo (akk): (sich) anhören y hören (ejemplos: 2dt-3dt) o como complemento indirecto (dat): zuhören, lauschen y horchen (ejemplos: 1dt,4adt,5adt). En lauschen1, hören2, horchen1 existen además alternancias entre diferentes formas de realización morfosintáctica del argumento A2 (ejemplos: 4adt-4bdt, 5adt-5bdt). La información sobre posibles realizaciones oracionales de los argumento es igualmente de interés y ayuda a la variación estilística a la hora de producir un texto en L2: (1dt) Mit großem Interesse hatten die Pflegekräfte [...], dem Vortrag zugehört [...]. (M03/FEB.11701 Mannh. Morgen, 22.02.2003). (2dt) Sie hören sich die Probleme an, die den Kindern auf den Nägeln brennen [...]. (R97/SEP.72386 Frankf. Rundschau, 15.09.1997, S. 4). (3dt) Sie hörte die Aussagen der verängstigten Kinder. (RHZ05/JUN.16629 RZ, 15.06.2005). (4adt) Man setzt sich, horcht der Feldpredigt und geniesst die Sonne. (A00/JUN.38103 St. Galler Tagblatt, 02.06.2000) (4bdt) Er horchte auf die Worte der Reisenden, die von Bord gingen, und wenn sie deutsch sprachen, redete er sie an. (P97/MAR.11400 Die Presse, 22.03.1997). (5adt) Rund ein Drittel der Steinacher Ortsbürger lauschten den Worten des Präsidenten, als dieser auf das vergangene Jahr zurückblickte. (A13/APR.06663 St. Galler Tagblatt, 17.04.2013, S. 34). (5bdt) Gemeinsam mit Lehrerin Ilka Peter hatten sich zehn Kinder aus den Klassen Zwei, Drei und Vier versammelt und lauschten auf die Erzählung „Weihnachten im Möwenweg“ von Kirstin Boie. (M08/DEZ.95513 Mannh. Morgen, 08.12.2008, S. 19). Los diccionarios monolingües pedagógicos consultados no aportan información sobre lexemas en contraste, a pesar de ser una información muy pertinente, no

288

Meike Meliss

solamente en situaciones de producción en lengua extranjera (Wolf 2001). Toda esta información detallada es útil a la hora de redactar un texto en la lengua extranjera y le ofrece al usuario un amplio abanico de posibilidades de expresión entre las cuales puede seleccionar teniendo en cuenta las peculiaridades de uso de cada uno de los lexemas. La información sobre las posibilidades de construcción en pasiva y sobre posibles productos de formación de palabras (cfr. módulo 4 del modelo DICONALE: figura 7) completan la información detallada que debe estar a disposición del usuario para producir un texto en L2. Se dedica especial atención a la visibilidad de las divergencias a nivel del contenido, formal y funcional entre ambas lenguas, por lo que se le ofrecen al usuario en este nivel de descripción posibles equivalencias en la lengua de contacto y el acceso a la información lexicográfica modular que puede ser consultada según las necesidades del usuario (figura 13, cfr. apéndice 2).

4. Reflexiones finales A lo largo de este trabajo se ha demostrado que los diccionarios mono- y bilingües de aprendizaje en contextos de DaF y Ele no contemplan lo suficiente el proceso de buscar, seleccionar y usar para la producción en la lengua extranjera. En respuesta a las deficiencias en la lexicografía bilingüe y monolingüe de aprendizaje de DaF y Ele se han elaborado algunas propuestas en el marco de la creación de DICONALE que pretenden ofrecer soluciones a la falta de recursos lexicográficos adecuados para la situación aquí en cuestión. Dos marcos de referencia constituyen por un lado la base para la agrupación de los lexemas en paradigmas léxico-semánticos y por otro forman el tertium comparationis entre ambas lenguas en contraste. La descripción del significado mediante la combinación de diferentes parámetros (rasgos semánticos y relaciones paradigmáticas de sentido, etc.) y la descripción detallada del potencial combinatorio tomando como punto de partida las estructuras argumentales, son las bases de los módulos centrales de descripción. La bilateralidad del diccionario bilingüe, en el que la lengua meta L2 puede ser alemán o español, y la complejidad de las interrelaciones léxicas justifica entre muchas otras razones como pueden ser la comodidad, rapidez e interrelación de información el formato online.24 Una consulta modular según las necesidades del usuario enlaza a su vez con una base metodológica empírica que comprende información tanto de los corpus de referencia del español y alemán como de la web como corpus.

–––––––— 24

Para más información sobre diferentes aspectos actuales en torno a la lexicografía online y la lexicografía computacional remito a los siguientes estudios: Aguilar Escobar (2009), Chuchuy / Moreno (2002), Haß / Schmitz (2010), Haß (2005), Klein / Geyken (2010), Klosa (2008, 2009), Mann (2010), Müller-Spitzer / Engelberg (2011, 2013), Pöll (2010), Sanmarco Bande (2008), Storrer (2010), Tarp (2012) y Torres del Rey (2009).

Propuestas para un diccionario conceptual bilingüe para Ele y DaF

289

Referencias bibliográficas Diccionarios, portales lexicográficos, corpora Bosque, Ignacio (2004): Redes. Diccionario combinatorio del español contemporáneo. Madrid: Ediciones SM. CanooNet: Portal: Deutsche Wörterbücher und Grammatik. Disponible en