Patricia Rodríguez-Inés
Departament de Traducció i d’interpretació
Universitat Autònoma de Barcelona

Un corpus, que és bàsicament un conjunt de textos en format electrònic reunits sota uns criteris determinats amb l’objectiu de representar una llengua o varietat de llengua, pot considerar-se tant un recurs per l’extracció d’informació, com part d’una metodologia per l’estudi empíric de la llengua, o fins i tot com tota una forma d’entendre la llengua quant a fenomen observable, mesurable i, fins a cert punt, previsible.

El principal interès de la lingüística de corpus és proporcionar proves empíriques per tal de procurar millors descripcions de la llengua a partir de dades i poder explicar, provar o exemplificar teories ja existents o assumpcions respecte la llengua. És més, la lingüística de corpus es un medi per descobrir patrons i revelar fets sobre la llengua que potser abans ni tan sols haguéssim pensat a buscar. En aquest punt, sembla apropiat recordar un comentari fet l’any 2000 per part de l’acadèmic de la traducció Ian Mason a la conferència UMIST, de Manchester, titulada “Research Models in Translation Studies". Parlant de la investigació en els estudis sobre la traducció, Mason va voler insistir en la diferència entre la investigació que ens permet afirmar que “un fenomen va passar", "un fenomen passa" o "un fenomen passa freqüentment, típicament o sempre". Gràcies a la lingüística de corpus sembla segur afirmar que ara estem més a prop que mai de poder sostenir que un fet passa freqüentment, típicament o sempre, respecte a una llengua sense por a confiar exclusivament en la nostra intuïció, sempre que es trobi la manera de formular la pregunta.

Tanmateix, eren molts els escèptics quan als anys 90 es va donar un boom en l’ús de corpus en els estudis sobre la traducció i es va pensar que el seu ús seria efímer. Publicacions com les de Baker (1993, 1995) van ser clau per donar a conèixer les possibilitats que oferia l’aplicació de la metodologia de corpus, especialment a les branques descriptiva i aplicada de la nostra disciplina. Actualment, els corpus gaudeixen de més protagonisme que mai i fins i tot es fa difícil trobar un estudi sobre la traducció que no presumeixi d’estar basat en un corpus, si bé es cert que no sempre es segueixen uns criteris estrictes o els principis de la lingüística de corpus.

Per aquest número de la revista Tradumàtica s’han buscat autors que poguessin fer aportacions a les àrees dels estudis sobre la traducció més rellevants en les que s’utilitzen corpus.

En el primer article, "Principles of corpus linguistics and their application to translation studies research, la Dra. Gabriela Saldanha (University of Birmingham) comença repassant diverses definicions del concepte de corpus per tal de tractar després el veritable objecte d’estudi de la lingüística de corpus, l’ús de la llengua. Així, si bé és cert que amb els corpus que normalment es dissenyen i el programari existent els investigadors i usuaris d’aquests recursos tendeixen a centrar-se en qüestions de microlingüística, també ho és que cada cop més, l'interès avança cap a l’observació d’elements macrolingüístics (socioculturals, discursius o ideològics).

Entre les principals aplicacions relacionades amb la traducció que s’han donat als corpus s’hi troben la traducció automàtica i l’elaboració de diccionaris. En l'article "Sobre la construcción de diccionarios basados en corpus", l’acadèmic de la Real Academia Española Guillermo Rojo comenta els beneficis d’una aproximació basada en corpus a la lexicografia i l’elaboració de diccionaris, tot oferint-ne exemples, sobretot nascuts de projectes institucionals o d’editorials de gran envergadura.

Ja en l’esfera de projectes individuals de creació de corpus per a un propòsit específic, Internet s’ha revelat com la font principal de matèria primera, és a dir, textos, per alimentar corpus de diversos tipus i de més o menys volum. En aquesta línia, la investigadora Cristina Castillo (Universidad de Màlaga) exposa en el seu article “La elaboración de un corpus ad hoc paralelo multilingüe" les fases i protocols a seguir a l’hora de construir un corpus d’aquestes característiques, amb especial atenció a la gestió dels bitextos i la seva alineació.

La Internet ja no només com a font d’extracció de textos per a un corpus, sinó com a corpus en sí mateixa és el tema que tracta l'investigador Adriano Ferraresi (University of Naples “Federico II”) en el seu article “Google and beyond: web-as-corpus methodologies for translators". Ferraresi il·lustra els avantatges de l’explotació del web com un macrocorpus mentre que crida l’atenció sobre els possibles riscos d’aquest ús.

A més de les aplicacions mencionades, Internet també serveix com a objecte d’estudi de la traducció d’alguns gèneres textuals com, en el cas que descriu el Dr. Miguel Ángel Jiménez-Crespo (The State University of New Jersey), la pàgina web corporativa. En el seu article “El uso de corpus textuales en localización”, l’autor il·lustra els avantatges de la compilació i l’ús de corpus per la localització amb la fi de fer el text meta el més natural i proper possibles a les expectatives del lector i la cultura d’arribada.

Seguint amb l’estudi de gèneres textuals, però en aquest cas amb la caracterització de gèneres d’àmbit jurídic, mèdic i tècnic, trobem l’article “La recerca en traducció basada en corpus: aplicacions professionals i didàctiques del projecte GENTT”. Aquí, les Dres. Esther Monzó i Pilar Ordóñez (Universitat Jaume I) comenten la composició del corpus de gèneres creat pel grup GENTT i l’ús que docents i discents li han donat, per després centrar-se en les possibilitats del mateix quant a la seva utilització en el món professional.

Precisament els professionals de la traducció es troben entre els que més s’han beneficiat de la compilació de textos i, més concretament, bitextos, que han alimentat corpus paral·lels o memòries de traducció. En el seu article “Future Trends in Translation Memory", Daniel Benito, cofundador de l'empresa Atril, comenta la situació dels sistemes de memòria de traducció i les seves possibilitats d’evolució amb vistes a millorar la qualitat i consistència de les traduccions. Tanmateix, l’autor crida l’atenció sobre els interessos de la indústria de la traducció, més centrats en el mer estalvi de temps pel traductor.

Claudio Bendazzoli (Università di Bologna) i Annalisa Sandrelli (Libera Università San Pio V) ens introdueixen al poc explorat ús de corpus en interpretació amb el seu article “Corpus-based Interpreting Studies: Early Work and Future Prospects". Aquí els autors exposen la precària situació dels estudis sobre la interpretació basats en corpus a causa de les dificultats que implica la recollida de material real, però proporcionen dades sobre projectes concrets que ja han aportat o aportaran llum a la investigació en aquesta modalitat.

Finalment, aquest número de la revista es completa amb dos catàlegs. El primer, elaborat pel Dr. Jorge Vivaldi (Universitat Pompeu Fabra), “Catálogo de herramientas informáticas relacionadas con la creación, gestión y explotación de corpus textuales”, conté alguns exemples de corpus ja existents, així com recursos informàtics que en faciliten la compilació, el processament i l’explotació. El catàleg elaborat per la investigadora Viviane Possamai (Universidade Federal do Rio Grande do Sul), “Catalogue of Free-Access Translation-Related Corpora”, recull una gran quantitat de corpus gratuïts variats pel que fa a tipus i llengües representades.

L’aplicació de corpus a la disciplina dels estudis sobre la traducció és recent en alguna de les seves àrees, si bé ja té dècades d’experiència en d’altres. En aquest número s’han abordat temes diversos i s’ha comptat amb autors de procedència molt diversa. Esperem que els lectors i lectores de la revista que no estiguin avesats a l’ús de corpus en traducció s’animin a abraçar aquesta metodologia i que aquells que ja la coneixien ampliïn els seus coneixements.

Referències

Baker, M. (1993). “Corpus Linguistics and Translation Studies: Implications and Applications”, a Baker, M.; G. Francis; E. Tognini-Bonelli (eds.). Text and Technology: in Honour of John Sinclair. Amsterdam; Filadelfia: John Benjamins, 233-250.

Baker, M. (1995). “Corpora in translation studies: an overview and some suggestions for future research”. Target 7(2), 223-243.

 

Tradumàtica 07
L'aplicació dels
corpus lingüístics
a la traducció

ISSN: 1578-7559