
254 Traducción de terminología en el lenguaje periodístico […]
Hikma 21 (1) (2022), 249 - 274
• no documentado, puesto que no está asociado a un archivo
DTD (Document Type Definition).
Así pues, por un lado, creamos dos documentos de Microsoft Word,
uno para los textos en español y otro para los textos en inglés, en los que
incluimos los textos de los que extrajimos los términos metafóricos. Cada
uno de los textos que introdujimos en estos documentos se identificó con
una etiqueta de apertura (< >) y otra de cierre (</ >) en las que indicamos el
medio del que recuperamos el texto, su fecha de publicación, la página en la
que se encuentra, la sección en la que se inserta y su(s) autoría(s). Por otro,
para el vaciado utilizamos una plantilla de la aplicación Microsoft Excel
proporcionada por las docentes en la incluimos una serie de datos,
necesarios para el análisis posterior de los resultados obtenidos, que
expondremos más adelante.
Para la elaboración de este corpus textual comparable bilingüe
seguimos dos procedimientos. En primer lugar, elaboramos el Corpus 1,
compuesto por textos económicos redactados en español y extraídos de los
viernes entre octubre y diciembre de 2019, ambos meses incluidos, del
periódico El País en su versión en línea. En un primer momento introdujimos
en el corpus textos pertenecientes al suplemento Madrid, pero finalmente
decidimos no añadirlos. Este primer corpus está compuesto por 161 textos y
80 073 palabras
3
. La selección y la identificación de los textos se realizaron
de forma manual e individual, leyendo cada uno de ellos para confirmar que
se ajustasen al tema establecido y prestando atención a su autoría. En
cuanto al Corpus 2, compuesto por textos redactados en inglés, el
procedimiento de selección de los textos fue diferente. Seleccionamos la
versión en línea del periódico The New York Times porque este permite
limitar la búsqueda por fechas concretas y por tema. El período estipulado
para la localización de los textos del Corpus 1 fue el establecido entre los
meses de enero de 2018 y diciembre de 2020, ambos incluidos. En este
caso no leímos todos los textos integrados en ese espacio temporal, sino
que buscamos por concepto según los términos obtenidos del vaciado del
Corpus 1, sobre el que profundizamos en el siguiente párrafo. Esta
búsqueda resultó en un corpus formado por 71 textos y 80 009 palabras.
Para marcar el límite de extensión del Corpus 2 nos ceñimos al número de
palabras del Corpus 1 para así mantener una suerte de equilibrio entre
ambos y que, de ese modo, sean comparables.
3
En esta cifra se incluyen las palabras que componen las marcas de identificación que
enmarcan cada texto. Este corpus y su metodología de elaboración se integra en el corpus de
prensa para la elaboración del DiCEM (Diccionario de la crisis económica mundial) que se
desarrolla en la Universidade de Vigo y en la Universidade de São Paulo bajo la dirección de
Iolanda Galanes y Ieda Alves (Galanes y Alves, 2015).