
Míriam Pérez-Carrasco 309
Hikma 22(1) (2023), 307 - 337
forma, combinamos las ventajas para la documentación que nos ofrece la
consulta de textos paralelos, con los beneficios que aportan los programas
de gestión de corpus en cuanto a la cantidad de información que podemos
analizar, el nivel de sofisticación de las búsquedas y el poco tiempo que nos
requieren todas estas tareas que antes solo podían realizarse de forma
manual. Como señala Borja Albi (2019, p. 23), actualmente podemos tanto
compilar nuestros propios corpus, como acceder a miles de corpus de
distintos tipos y sobre diferentes temáticas ya compilados y puestos a
disposición del público para poder ser explotados mediante las diferentes
herramientas de gestión de corpus.
Esta misma autora (Borja Albi, 2019, pp. 24-25) distingue cinco áreas
de aplicación de la Lingüística de Corpus dentro de los estudios en
Traducción. En primer lugar, encontramos trabajos —tales como los
realizados por Baker (1995), Olohan (2004), Corpas Pastor (2008) o Laviosa
(2010)— en los que la Lingüística de Corpus permite el estudio del
comportamiento de los textos traducidos y la identificación de posibles
normas de traducción. En segundo lugar, Borja Albi (2019) destaca las
investigaciones dedicadas al empleo, en la práctica profesional, de lo que
denomina disposable corpora
2
, con el fin de obtener información
terminológica, fraseológica o textual útil para la traducción. Esto ha sido
objeto de estudio para autores como Bowker (1998), Zanettin (2002),
Bernardini y Castagnoli (2008) o Gallego-Hernández (2015). En tercer lugar,
autores como Czulo y Hansen-Schirra (2017) han utilizado recursos y datos
basados en el análisis de corpus lingüísticos para diferentes tareas
relacionadas con el procesamiento del lenguaje natural, como la generación
de memorias de traducción o el desarrollo de motores de traducción, entre
otras. En cuarto lugar, Borja Albi (2019) destaca los trabajos de autores como
Aston, Bernardini y Stewart (2004) o Sinclair (2004), pioneros en la
compilación y el análisis de language learner corpora (o corpus de
aprendices), es decir, aquellos integrados por textos producidos por los
propios estudiantes de lenguas extranjeras; este tipo de corpus podrían ser
útiles como material para la enseñanza de idiomas. La última aplicación de
los corpus lingüísticos que propone Borja Albi (2019) es el empleo de corpus
como recurso en el aula de traducción. Este tema ha sido objeto de estudio
en los trabajos realizados por autores como Zanettin (1998), Aston (1999),
2
Se trata de un corpus formado por textos que se encuentran disponibles en la red y que surge
de la «necesidad perentoria de acceder a documentación específica sobre un tema concreto a
la mayor brevedad posible», como subraya Corpas Pastor (2001, pp. 164-165). Otros autores
proponen nombres diversos para esta misma tipología de corpus; a saber, special purpose
corpus (Pearson, 1998), customized corpus (Austermühl, 2001), do-it-yourself (DIY) corpora
(Zanettin, 2002), corpus ad-hoc (Aston, 1999; Corpas Pastor, 2001) o corpus virtual (Seghiri,
2006, 2011, 2017).