En los diccionarios se recogen voces de una o más lenguas, de una ciencia o de una materia determinada (Cfr. DRAE, 2002), y/o se plasman las recopilaciones sistematizadas y ordenadas de los significados asociados a “todas” las palabras que usa una determinada comunidad de hablantes. Por ende, estas fuentes de información –impresas o en formato electrónico- se convierten en la referencia fonética, gramatical, léxica, cultural, histórica, científica y técnica de los usuarios de una lengua. Desde los primeros listados de palabras, recopilados en los estadios incipientes de la lexicografía, hasta el tipo de libro –o programa de ordenador- que hoy se conoce como diccionario, mucho ha cambiado; se percibe claramente que la ciencia lexicográfica ha experimentado una importante mejora y perfeccionamiento. Hoy en día los diccionarios ya no se limitan a recoger un repertorio de palabras con sus significados, sino que incluyen, además, información complementaria extremadamente útil, permitiéndonos ubicar un determinado vocablo en sus contextos de uso más frecuentes, aportar información gramatical sobre su categoría morfológica y/o sintáctica, etc. Parece existir un cierto consenso en cuanto al hecho de que nueva lingüística del corpus (Leech, 1991:9-10), avalada por los hallazgos informáticos de las tres últimas décadas, represente el renacimiento de la investigación lingüística basada en la observación y el análisis de datos, típica del paradigma estructuralista. En este sentido, el presente trabajo de investigación propone de recopilación de un diccionario electrónico de la lengua guaraní -DRAC- a partir del corpus de referencia del guaraní contemporáneo (CORACON), desarrollado en el ámbito del Proyecto AVAKOTEPA (Rodrigues et al., 2008:1-3).
Palabras-clave: lexicografía – drac – diccionario de Referencia – lengua guaraní
1. Introducción:
Desde los primeros listados de palabras, recopilados en los estadios incipientes de la lexicografía, hasta el tipo de libro –o programa de ordenador- que hoy se conoce como diccionario, mucho ha cambiado; se percibe claramente que la ciencia lexicográfica ha experimentado una importante mejora y perfeccionamiento. Hoy en día los diccionarios ya no se limitan a recoger un repertorio de palabras con sus significados, sino que incluyen, además, información complementaria extremadamente útil, como, por ejemplo, ubicar un determinado vocablo en sus contextos de uso más frecuentes, aportar información gramatical sobre su categoría morfológica y/o sintáctica, las locuciones más frecuentes en las que aparece el término buscado, etc.
2. La tradición lexicográfica y la lengua guaraní:
3. La «moderna lingüística de corpus» en los estudios lingüísticos
(…) a collection of naturally occurring language text, chosen to characterize a state or variety of a language. (Sinclair, 1991:17)
En las anteriores definiciones ambos autores enfatizan uno de aspectos más importantes a la hora de seleccionar los textos: éstos deben basarse en reproducciones de situaciones reales que expresan una condición natural de uso de la lengua. Es decir, ya sea una colección de diálogos de un seminario, transcripciones de discursos grabados, etc., uno de los criterios que deberá seguirse para el análisis lingüístico será contar con muestras lo más fiables posible. Otro aspecto que merece especial atención en las definiciones que hemos visto anteriormente es que los lingüistas ya tienen tan asumido el hecho de que la compilación y el almacenamiento de los textos serán en formato digital que ni lo mencionan. En este sentido siempre que citamos el término corpus[3], en realidad nos referimos a un corpus electrónico o corpus legible por máquina.
3.1 La recopilación de diccionarios a partir de corpus lingüísticos
Mientras tanto hay una serie de palabras que se han adaptado completamente a la fonética e integrado al vocabulario considerado guaraní, escapando por lo tanto al caudal léxico español con el que el hablante espontáneamente puede desvirtuar la “guaranidad” del discurso. Algunos ejemplos nominales son: kavaju (caballo), kavara (cabra), ovecha (oveja), guéi (buey), Huã (Juan), aramirõ (almidón), aramboha (almohada), kesu (queso), sevói (cebolla), korasõ (corazón). Pero también hay verbos, que muchas veces han sufrido un cambio de significado, como malisia (maliciar / suponer, creer), dipara (disparar / correr, huir) o pika (picar / tomar, chupar)[4].
Aunque, en algunos casos, la influencia del español sobre la lengua guaraní ha sido tan fuerte que parece haber aumentado la permeabilidad lingüística –proceso natural cuando dos lenguas permanecen en contacto durante mucho tiempo-, dando origen a un proceso –a veces- exacerbado de trasvase, préstamos lingüísticos y asimilaciones de hispanismos por parte de la lengua guaraní, este factor no debe ser entendido como negativo; si acaso, peculiar y enriquecedor. En consonancia con Germán de Granda (1990:162-164), quien opina que la interferencia léxica del guaraní sobre el español paraguayo, no representa un elemento desestructurador de este último código lingüístico, sino más bien, constituye, por el contrario, un factor positivo de enriquecimiento del mismo, creemos que el guaraní paraguayo goza de muy buena salud en cuanto a su estructura morfosintáctica y el repertorio léxico.
4. DRAC: Diccionario de Referencia del Guaraní Contemporáneo
§ La trascripción ortográfica de la lengua guaraní se realiza a mediados del siglo XVII y hasta la actualidad, en los albores de la era informática, no se cuentan con materiales específicos en formato digital para enseñanza-aprendizaje de la lengua guaraní;
§ Existe una considerable producción literaria en lengua guaraní. Dicha lengua fue elevada al rango constitucional, pero hasta el presente no se dieron iniciativas que apunten a la realización de materiales educativos, principalmente en lo que concierne a la recopilación de diccionarios en formato digital;
§ Dicho material puede constituirse en una oportunidad histórica y cultural, dado su alcance y demanda existente en los diferentes sectores de la sociedad paraguaya;
§ El proyecto “Una laptop por niño”, de Negroponte, comenzó a funcionar en Paraguay en noviembre del presente año, no obstante, si se pretende que dicha iniciativa tenga éxito en Paraguay, para que podamos sumarnos al mundo de las nuevas tecnologías de la información y comunicación, debemos empezar a crear materiales didácticos que se adecuen a las necesidades del nuevo modelo educativo que exige la sociedad del conocimiento;
§ Por último, cabe señalar que los más afectados por la “exclusión informática” y la “alienación educativa” que ha vivido Paraguay en las últimas décadas son los ciudadanos paraguayos de las generaciones venideras; es decir, los niños y niñas que se encuentran en edad escolar y que, en la actualidad, viven al margen de la “posrevolución informática” en la que está inmersa el mundo globalizado y los países más desarrollados.
5. Características estructurales del DRAC
AVA: indio, hombre, individuo, persona (Decir ava a uno puede ser un insulto o un piropo); ava ra'y juky péva: ¡ qué niño tan lindo, simpático!;
MBO'EHÁRA - No registra;
MBO'EHAO - No registra;
U: raíz del verbo ha'u, re'u: comer, beber (menos agua, que tiene verbo propio). Ejemplo de "u" en composición: hi'upy: comestibles. hi'upyrâ: comestibles para después. ka'avo'uha: herbívoro. pira'uha: ictiófago (que se alimenta e pescado o peces). so'o uha: carnívoro. tuguy'uha: hematófago (que come o chupa la sangre). (785).
TA'ANGAMBYRY. No registra.
SANABRIA (2000):
AVA. s. Hombre, individuo, persona (Ava ha' Kuñáva ha kuimba'éva = Hombre es mujer y varón);
MBO'EHÁRA. s. Maestro/a. Persona que se dedica al magisterio.(159);
MBO'EHAO. s. escuela, colegio. Casa de la enseñanza. (159)
U. v. ar. Comer, beber, (menos agua, que tiene v. propio) (Che ha'u, nde re'u, etc.) Es un verbo irregular. (303)
TA'ANGAMBYRY. .s. neol. Televisión (=téle). (271)
AVA. s. Hombre, indígena, persona,, sujeto, a. joguaha. Aindiado. a. Kachape. Arribeño. a. pajé. Mago, hechicero, brujo, sacerdote indígena. a. reko. Capricho. a. táva. Reducción, pueblo de indios. 2. pron. ind. Alguien. 3. pron. Int. Quién, cuál, a. mba'épa. De quién. (18);
MBO'EHÁRA. neol., s. Maestro, profesor, docente educador, instructor, pedagogo, preceptor.(59);
MBO'EHAO. neol., s. Escuela, colegio (59).
'U. v. Comer beber, ingerir, tomar. 'u kuña. Fornicar.
TA'ANGAMBYRY. neol., t. s. Televisión. (107)
ORTIZ MAYANS (1960):
AVÁ. s. Hombre. /Indio. /Persona indeterminada. /Zambo o hijo de negro y de india o al contario. / pron. int. ¿Quién? - catú. Hombre de bien./ Bot. Nombre de dos arbustos e propiedades afrodisíacas. (420);
MBO-JHARA. S. Maestro; instructor; enseñante; predicador; profesor; preceptor; / Ú. t .p. el femenino. (529);
MBO'EHAO - No registra.
U. v. Comer; beber. / Carcomer / Venir (3ª pers.). Oú pîa-e: viene rápido. /Poseer (en sentido sexual). (529)
TA'ANGAMBYRY. No registra.
e) Diccionario sincrónico:
En el proceso de selección de las entradas se tendrá nos ceñiremos al criterio sincrónico, ya que pretendemos recoger solamente el léxico utilizado en los últimos 50 años. Es importante mencionar que pretendemos informar sobre el repertorio léxico y el uso, sin instituir ni postular criterios normativos, aunque incluiremos algunos vocablos obsolescentes e históricos. Dentro del espacio de tiempo antes señalado, se recogerá el léxico usual, teniendo en cuenta criterios de frecuencia y una actualidad mínima.
f) Índice de frecuencia:
Al disponer de los índices de frecuencia que nos proporcionará el CORACON, incluiremos marcas de frecuencia en las voces del diccionario. De este modo, el DRAC se convertirá en el primer diccionario de la lengua guaraní que contará con información relativa a este aspecto:
Ausencia de marca: Frecuencia no significativa
- Frecuencia baja
- Frecuencia moderada
- Frecuencia notable
- Frecuencia alta
- Frecuencia muy alta
g) Muestras de audio:
Además de incluir una referencia de audio, que nos permitirá escuchar la correcta pronunciación de cada una de las palabras del DRAC, pretendemos añadir una funcionalidad específica que nos ofrecerá muestras de audio de algunas frases y/o ejemplos de uso.
h) Transcripción fonética:
La inclusión de información fónica en el DRAC tiene por objetivo indicar la pronunciación correcta de las palabras desde una concepción normativa (Cfr. Haensch et al., 1982:179-180; Quilis, 1982; Walter, 1990). Debido a que está orientado con un fin didáctico a usuarios –nativos y extranjeros- (Cfr. Haas, 1975; Harrel, 1975; entre otros) aprendices de la lengua guaraní, esta opción será muy útil, ya que la relación existente entre la representación ortográfica y la pronunciación de la lengua guaraní entraña ciertas dificultades en su aprendizaje.
i) Herramienta para el estudio lingüístico:
La novedad del diccionario es que constará de autoridades o ejemplos documentales, esto es, se dará al usuario un ejemplo de uso de los lemas, que se extraerán del Corpus de referencia del Guaraní Contemporáneo (CORACON). Al estar interrelacionado con el corpus, se convertirá en una herramienta indispensable para los estudiosos del léxico, pues ofrecerá una muestra de la prensa escrita, muestras textuales de distinta índole y procedencia y recogerá, asimismo, la mayoría de las páginas Web escritas en guaraní en el Paraguay. Lo que pretendemos como este planteamiento es que las lexías seleccionadas representen un repertorio reconocido y utilizado por todos los hablantes, ya que incluirá términos de la lengua viva, diaria y cotidiana.
j) Diccionario didáctico-pedagógico:
El diccionario estará dirigido a diferentes usuarios: el usuario común que se interese por el léxico de su país, los estudiantes de diversas edades, los docentes, técnicos, especialistas de distintas áreas del conocimiento, lingüistas, lexicógrafos, lexicólogos, investigadores, etc. Hay que subrayar que obra incluirá el primer conjugador de verbos en lengua guaraní, biografía de autores y corrientes de pensamiento. Por ello, se dirige fundamentalmente al ámbito educativo.
6. Proceso de recopilación de las entradas y asignación de las definiciones
- Definir con palabras sencillas y accesibles
- Describir, siempre que posible, la función de la palabra definida, evitando así la definición demasiado abstracta
- Ofrecer las distintas acepciones que pueda contener un vocablo, atendiendo a su frecuencia de uso.
El paquete informático que estamos utilizando en la recopilación del DRAC, y que ha sido especialmente diseñado para este proyecto, nos permitirá el acceso rápido y constante a los ejemplos de uso dentro de los contextos, facilitando la captación del significado y, por consiguiente, la definición de las voces atendiendo a criterios de frecuencia y/o campos semánticos. Se ha adoptado este procedimiento para evitar la incorporación de información impertinente y/o en desuso. La adopción de criterios de recopilación basados en frecuencia nos permitirá conocer las acepciones más frecuentes de los vocablos, incidiendo directamente en la calidad de la obra, al ofrecer consultas más eficaces sobre la ortografía y/o significados más frecuentes de una palabra.
7. Conclusiones
Como es bien sabido, el guaraní es una de las lenguas oficiales del Paraguay y está reconocida como “tercera” lengua del Mercosur. Actualmente, está incluida como una materia obligatoria en todas las instituciones educativas de nivel inicial y media, de acuerdo con la Reforma Educativa de 1992. Hoy en día se constituye en una necesidad de la población contar con herramientas tecnológicas adecuadas, que faciliten la generación de contenidos escritos en guaraní, y ayuden en el proceso de valorización de esta minorizada lengua mayoritaria, aportando los elementos que propiciarán su estructuración y normalización y la adaptarán a los cánones de la lingüística moderna; eso facilitaría su difusión y ayudaría sobremanera en su proceso de revalorización lingüístico-cultural. En este sentido, el objetivo del presente proyecto es el diseño e implementación de una herramienta ofimática –diccionario electrónico- que permitirá tanto la realización de consultas a través de Internet como su instalación en los ordenadores, al igual que ocurren con todas las lenguas modernas que gozan de más prestigio.
La recopilación de un diccionario de referencia en formato electrónico, incidirá directamente en los siguientes aspectos: i) revalorización de la lengua guaraní a través de la publicidad y visibilidad más allá de las fronteras del Mercosur; ii) incorporación en la plataforma AVAKOTEPA, lo que permitirá la participación de toda la comunidad guaraní-hablante, que podrá ir enriqueciéndolo mediante sus aportaciones; y por último, iii) apoyar en el proceso de incorporación de las NTICs en la realidad de las aulas paraguayas, ya que todos los niños y niñas paraguayos que se encuentran en edad escolar, tarde o temprano, formarán parte del mundo globalizado e informatizado, como ocurre en todos los países más desarrollados.
La elaboración de un diccionario con estas características es una necesidad emergente en el Paraguay, no solamente por el hecho de que no existe ningún diccionario electrónico con esas características, sino que servirá de referencia para los hablantes paraguayos, que en muchas ocasiones se cuestionan aspectos relacionados con él, pero no encuentran las respuestas a tales cuestionamientos. Ofrecerá un repertorio que servirá para la enseñanza de la lengua, porque no solo evidenciará el léxico sino también estructuras gramaticales propias del guaraní paraguayo.
Asimismo, puede convertirse en la base para futuras investigaciones en el ámbito sociolingüístico, pragmático, lexicológico, lexicográfico dentro del territorio nacional y en el extranjero, ya que el DRAC se está concibiendo como un Diccionario de Referencia especialmente diseñado para recoger una amplia gama de muestras reales de habla que ocurren en interacciones y conversaciones auténticas en la actualidad en el Paraguay, tanto en la modalidad escrita como oral.
Referencias Bibliográficas:
ACOSTA, Feliciano y KRIVOSHEIN DE CANESE, Natalia (2002): Ñe’ëryru Avañe’ë – Karaiñe’ë. Segunda Edición, Colección Ñemity.
AHMAD, K., DAVIES, A. HULFORF, H. & ROGERS, M. (1994): What is a term? The semi-automatic extraction of terms from text, en M. Snell-Hornby, F. Pöchhacker & K. Kaindl (eds.): 267-278.
AHUMADA, Ignacio (2000): Estudios de lexicografía regional del español. Universidad Nacional a Distancia.
ATKINS, B., J. CLEAR & N. OSTLER (1992): Corpus Design Criteria. Literary and Linguistic Computing. Vol. 7, No. 1, 1-16.
DIETRICH, Wolf (1994-95): «La importancia de los diccionarios guaraníes de Montoya (1640) para el estudio comparativo de las lenguas tupí-guaraníes de hoy », Amerindia, 1994-95, n° 19-20.
GRANDA, Germán de. (1990): Hacia una valoración del proceso de interferencia léxica del guaraní sobre el español paraguayo. En: Revista Paraguaya de Sociología, año 27, N ° 77, Asunción.
___________________ (1996): Interferencia y convergencias sintácticas e isogramatismo amplio en el español paraguayo. In International Journal of the Sociology of Language 117, 63-80. Berlin / New York.
GUASCH, P. Antonio. (1978): Diccionario castellano-guaraní y guaraní-castellano, sintáctico, fraseológico, ideológico. Reimpresión de la 4ª ed. española. Asunción: Loyola.
_________________. (1998): Diccionario Castellano-Guaraní / Guaraní-Castellano. S. J. –Diego Ortiz S. 13ª, CEPAG J, Asunción.
TRINIDAD SANABRIA, Lino. (2000): Gran Diccionario Avañe’ë Ilustrado. Editorial Occidente S. R. L., Asunción.
HAAS, M. R. (1975): What Belongs in the Bilingual Dictionary?, en F. W. Householder y S. Saporta (eds.), Problems in Lexicography. 3ª ed., Bloomington: Indiana University Publications, pp. 45-50.
HAENSCH, G. WOLF, L. ETTINGER, S. y R. WERNER (1982): La lexicografía. De la lingüística teórica a la lexicografía práctica, Madrid: Gredos. Biblioteca Románica Hispánica. Manuales, 56.
HAENSH, Günther (1997): Los diccionarios del español en el umbral del siglo XXI. Salamanca: Ediciones de la Universidad de Salamanca.
HARREL, R. S. (1975): Some Notes on Bilingual Lexicography, en F. W. Householder y S. Saporta (eds.), Problems in Lexicography. 3ª ed., Bloomington: Indiana University Publications, pp. 51-62.
QUILIS, A. (1982): Diccionarios de pronunciación, Lingüística Española Actual IV,II: 326-332.
i FONTANALS, Joaquim, i BOU. Joan. (2003) El procesamiento de corpus- La lingüística empírica. Las tecnologías del lenguaje. , 41-73.
KRIVOSHEIN de CANESE (2000), Natalia. Cultura y bilingüismo en el Paraguay. www.staff.uni-mainz.de/lustig/texte/culpares.htm [EN LÌNEA]
KRIVOSHEIN de CANESE, Natalia y CORVALAN, Graziella. (1993): El español del Paraguay en contacto con el guaraní. Centro Paraguayo de Estudios Sociológicos. Asunción.
LARA, Fernando (1987). El objeto diccionario. En Luis Fernando Lara. 1990. Dimensiones de la lexicografía. A propósito del Diccionario del español actual de México. El Colegio de México: 15-20
LEECH, G. (1991): Corpora, en Malmkjaer (ed.) The Linguistics Encyclopedia, London: Routledge: 73-80.
___________ (1992): Corpus and theories of linguistic performance: in Svartvik, J. ed., Directions in corpus linguistics: proceedings of Nobel symposium 82, Berlin and New York, Mouton de Gruyter, 125-148.
LUSTIG, Wolf. (1996): "Mba'eichapa oiko la guaraní", in: Papia, 4:2 (1996), S. 19-43; En Red: http://www.uni-mainz.de/~lustig/texte/jopara2.txt
MCENERY, T. & A. WILSON (1996): Corpus Linguistics. Edinburgh Textbooks in Empirical Linguistics. Edinburgh: Edinburgh University Press.
_________________________ (2001): Corpus Linguistics. 2nd. Edition. Edinburgh: Edinburgh University Press.
ORTIZ MAYANS, Antonio. (1960): Gran Diccionario Castellano-Guaraní / Guaraní-Castellano. Ed. Abaco, Buenos Aires.
PÉREZ HERNÁNDEZ, M. Chantal: (2002): "Explotación de los córpora textuales informatizados para la creación de bases de datos terminológicas basadas en el conocimiento", en Estudios de Lingüística Española, 18, Málaga.
SÁNCHEZ, Aquilino (2001): Cómo se hace un diccionario en el siglo XXI: Gran Diccionario de Uso del Español Actual. SGEL, Madrid.
SINCLAIR, J.M. (ed.) (1987): Collins Cobuild English Language Dictionary. London: Harper Collins.
________________ (1987b). Looking Up: an Account of the COBUILD Project in Lexical Computing. London: Collins.
_________________ (1990). "Progress in Computational Lexicography", en World Englishes. Vol.9 (1). Oxford: Pergamon: 233-257.
_________________ (1991): Corpus, Concordance, Collocation. Oxford: Oxford University Press.
__________________ (1996): The Empty Lexicon, International Journal of Corpus Linguistics. Vol. 1 (1): 99-119.
SINCLAIR, J. M., J. Payne & Ch. Pérez (eds.) (1996). Corpus to Corpus: A Study of Translation Equivalence. International Journal of Lexicography. Vol. 9 (3).
ONU, (2003): Objetivos de desarrollo del milenio. Informe de Paraguay. Sistema de las Naciones Unidas en Paraguay. Asunción, 2003
WALTER, H. (1990): Le dictionnarie de prononciation, en F. J. Hausmann, O. Reichmann, H. E. Wiegand y L. Zgusta (eds.) Wörterbücher. Dictionaries. Dictionnaries. Ein internationales Handbuch zur Lexicographie. An International Encyclopedie of Lexicography. Enciclopédie internationale de lexicographie. Tomo II: 1309-1311. Berlín-Nueva York: Walter de Gruyter.
[1] El CORACON (Corpus de Referencia de Guaraní Contemporáneo), desarrollado en el ámbito del proyecto AVAKOTEPA, se compone de dos partes: el CORACON, corpus oral que recoge muestras reales de habla que ocurren en interacciones y conversaciones auténticas y son almacenadas en una base de datos textual acompañada de su respectivo archivo de audio, y el COTRACON, corpus textual que reúne un conjunto de textos lingüísticos y reales almacenados en formato electrónico. En ambos corpus se siguen las recomendaciones hechas por EAGLES y, a posteriori, se pretende adoptar las normas de codificación definidas en el TEI P4. El CORACON abarcará un espacio cronológico que va desde 1950 hasta la actualidad. Las bases de datos que componen dicho corpus son abiertas, es decir, están diseñadas para albergar los últimos 58 años del guaraní, de modo que vayan actualizando sus materiales con el paso del tiempo.
[2] Cfr. BNC – British National Corpus. Disponible en: http://www.natcorp.ox.ac.uk/
[3] Las dos siguientes definiciones propuestas por EAGLES (1996) se encuentran recogidas en Internet en la publicación titulada “EAGLES Preliminary recommendations on Corpus Typology EAG--TCWG--CTYP/P” –mayo, 1996- (Consulta: 10 mayo 2008). http://www.ilc.cnr.it/EAGLES96/corpustyp/node5.html#SECTION00041000000000000000
a) A computer corpus is a corpus which is encoded in a standardized and homogenous way for open-ended retrieval tasks. Its constituent pieces of language are documented as to their origins and provenance.
b) A corpus is a collection of pieces of language that are selected and ordered according to explicit linguistic criteria in order to be used as a sample of the language.
[4] Véase también al respecto, el Diccionario guaraní-español de Natalia KRIVOSHEIN DE CANESE, Asunción 1990.
[5] Cfr Granda (1996:64-65)
[6] En el marco del proyecto AVAKOTEPA se ha diseñado un programa de incentivo a la incorporación de las NTICs en las escuelas paraguayas. Dicho programa todavía se encuentra en ciernes, pero sus objetivos coinciden con los objetivos de desarrollo del milenio para el Paraguay. (ONU, 2003)
[7] Datos extraídos del estudio Educación Media en el Paraguay: Logros, opciones y desafíos, 2007.