Reseñas 285
Hikma 19 (1) (2020), 285 - 291
SEGHIRI, Miriam (ed.). La lingüística de corpus aplicada al
desarrollo de la competencia tecnológica en los estudios de
traducción e interpretación y la enseñanza de segundas
lenguas. Berlín: Peter Lang, pp. 293. ISBN: 978-3-631-74122-
1.
Este volumen, editado por Miriam Seghiri y publicado por la editorial
Peter Lang, supone una novedosa contribución a los estudios de la
Lingüística de corpus, disciplina que en las últimas décadas ha revolucionado
la forma en la que tradicionalmente se realizaban las investigaciones sobre la
lengua. En la actualidad, el estudio y análisis de corpus, es decir, de
colecciones de textos reales, tanto escritos como orales, en formato
electrónico se aplica en numerosos ámbitos: enseñanza de lenguas
extranjeras, lexicografía, procesamiento del lenguaje natural, traducción
automática o asistida por ordenador, formación de traductores e intérpretes o
recursos para el ejercicio profesional de la traducción e interpretación, por
citar solo algunos de los más frecuentes.
La obra aquí reseñada se abre con el Prólogo de Pedro Mogorrón
Huerta, Catedrático en Traducción e Interpretación de la Universidad de
Alicante, en el que describe las virtudes de la obra y destaca «la variada
naturaleza de los textos que componen este volumen», además de cómo las
aportaciones incluidas consiguen mostrar «las numerosas posibilidades de
desarrollo traductológico y didáctico de la lingüística de corpus», disciplina
que califica como «una apuesta de futuro». Le sigue la Introducción, llevada
a cabo por la propia editora de la obra, en la que nos revela que el propósito
principal del trabajo es «entra[r] de lleno en el uso de las TAC [tecnologías
del aprendizaje y el conocimiento] basadas en corpus en el aula de
traducción, interpretación, así como de enseñanzas de segundas lenguas».
Así pues, el volumen queda dividido en dos grandes bloques: uno centrado
en el uso de corpus en las aulas de traducción especializada y de
interpretación, y otro, orientado a la enseñanza de segundas lenguas a través
de la lingüística de corpus. Cada uno de estos bloques contiene textos de
características muy diversas, lo cual demuestra una vez más las numerosas
aplicaciones que puede llegar tener la lingüística de corpus en estos ámbitos.
El primer bloque se abre con un capítulo de María-Teresa Ortego-
Antón y Purificación Fernández-Nistal, titulado «Estudio contrastivo de la
terminología de embutidos en inglés y en español con ParaConc y tlCorpus a
partir del corpus paralelo P-GEFEM y del comparable C-GEFEM». En este
caso, las autoras estudian con éxito el comportamiento morfosintáctico de
286 Míriam Pérez Carrasco
Hikma 19 (1) (2020), 285 - 291
léxico especializado y su fraseología en el ámbito de las industrias de los
embutidos, para el par lingüístico inglés-español, a través de dos extensos
corpus compilados a tal efecto, uno paralelo (P-GEFEM) y otro comparable
(C-GEFEM). Asimismo, apuntan que los resultados de este estudio pueden
ser aplicados tanto al desarrollo de una base de datos terminológica para
futuras aplicaciones de procesamiento de lenguaje natural como al aula de
traducción especializada. De hecho, y con base a los corpus compilados en
este estudio, las autoras han desarrollado y patentado recientemente una
herramienta de traducción multilingüe semiautomática con el fin de
internacionalizar el sector agroalimentario de su región (Castilla y León),
demostrando así la transferencia al ámbito empresarial de su investigación
basada en corpus sobre el ámbito de los embutidos.
El siguiente capítulo, «Traducción de consentimientos informados y
lingüística de corpus: una propuesta metodológica para el aprendizaje de la
traducción de textos médico-jurídicos», de M.ª del Mar Sánchez Ramos y
Raquel Lázaro Gutiérrez, se centra en el uso de corpus para la traducción de
consentimientos informados (inglés-español) en la formación de traductores
del ámbito sanitario. En concreto, el uso de Wordsmith 4.0 les permite
interrogar los corpus compilados y generar un listado de términos en inglés y
español de cada uno de los campos semánticos de este particular género
textual, que en su caso tiene a la apendicectomía como tema médico.
Además, el estudio incluye un completo análisis de los patrones de
combinación de los términos extraídos.
El siguiente capítulo, realizado por Lorena Arce Romeral y Míriam
Seghiri, y titulado «Diseño de plantillas de redacción y traducción al inglés
(variedades británica y estadounidense) de contratos de compraventa de
viviendas basadas en corpus», tiene como objetivo la compilación y
explotación de un corpus comparable y virtual de compraventa inmobiliaria
para la creación de plantillas de redacción y traducción semiautomática de
contratos de compraventa de viviendas. De este modo, tras describir
pormenorizadamente la legislación aplicable en Reino Unido (haciendo
especial hincapié en lo correspondiente a Inglaterra y Gales) y Estados
Unidos (en concreto, el estado de Luisiana), presentan los criterios de diseño
y compilación del corpus VENTACOR, con los cuales se garantiza su
representatividad tanto cualitativa como cuantitativa. Posteriormente, a través
del programa AntConc, las autoras identifican y extraen la macro y
microestructura de este género textual en las variedades británica y
estadounidense para luego realizar un estudio contrastivo de las mismas.
Finalmente, y a través de los resultados del análisis micro- y macroestructural
de dichos textos, implementan, en formato Excel, plantillas de redacción y
traducción de este tipo de documentos en inglés británico (orientado a
Reseñas 287
Hikma 19 (1) (2020), 285 - 291
Inglaterra y Gales) y en estadounidense (en particular para el estado de
Luisiana). Este novedoso recurso resulta de gran interés no solo para la
enseñanza de la traducción jurídica, sino para el mercado inmobiliario en su
conjunto, pues podrán utilizarlo no solo traductores profesionales sino
abogados, gestores inmobiliarios, notarios e, incluso, particulares que deseen
prescindir de intermediarios en el proceso de compra y venta de sus
viviendas, por citar solo algunos de sus posibles beneficiarios potenciales. En
esta línea, cabe destacar que Arce y Seghiri han sido galardonadas con el
Premio George Campbell del Aula María Zambrano de Estudios
Transatlánticos de la Universidad de Málaga (2019), en reconocimiento a la
herramienta de generación de plantillas de redacción y traducción de
contratos de compraventa de viviendas creada.
Por su parte, Carmen Bestué y Patricia Rodríguez-Inés, en
«Metodología de corpus en la enseñanza de la traducción de cuentas anuales
(inglés-español/catalán): un activo intangible», centran su estudio en un
encargo propuesto en la asignatura Traducción jurídica y financiera B-A del
Grado de Traducción e Interpretación de la Universitat Autònoma de
Barcelona. El texto que los alumnos debían trasladar de inglés a español y
catalán correspondía a un fragmento de las cuentas anuales de Sainsbury’s,
una popular cadena británica de supermercados. La primera parte del estudio
consiste en traducir mediante traducción automática (en este caso, a través
de Google Translate) el fragmento seleccionado y analizar los problemas
terminológicos y sintácticos que presenta la traducción generada por este
programa. Posteriormente, los discentes traducen con éxito el mismo texto a
través de un corpus ad hoc de textos originales en español y catalán y se
estudia su utilidad para evitar problemas y solventar errores de traducción.
A continuación, Cristina Toledo Báez, en «Sketch Engine en traducción
científico-técnica (francés-español): creación y explotación del corpus ad hoc
comparable GeneCorp», emplea la herramienta de corpus en línea Sketch
Engine para explotar un corpus ad hoc comparable bilingüe (francés-español)
sobre el ámbito de la genética. Este corpus ha sido compilado de forma
semiautomática a través de WebBootCat, integrado en Sketch Engine. En
concreto, la autora propone explotar este corpus en la asignatura de
Traducción científica y técnica de lengua B francés. Así pues, a lo largo del
artículo describe de manera clara y concisa diferentes funcionalidades de
Sketch Engine, tales como Wordlists (para extraer unidades terminológicas
monoléxicas y poliléxicas dentro del corpus); Word Sketch, para analizar los
patrones gramaticales, colocacionales y sintácticos de los lemas; y
Thesaurus, que permite crear tesauros distribucionales. En definitiva,
consigue demostrar cómo la combinación de los corpus ad hoc y
herramientas como Sketch Engine para explotarlos resulta muy eficaz para
288 Míriam Pérez Carrasco
Hikma 19 (1) (2020), 285 - 291
analizar el comportamiento léxico y gramatical de la terminología
especializada y obtener a su vez recursos terminológicos, fraseológicos y
temáticos fiables y de forma gratuita y rápida, facilitando así la labor
traductológica.
En «Creación de un glosario paralelo bilingüe (inglés-español) sobre
discapacidad para la interpretación en el contexto legal», Encarnación
Postigo Pinazo se centra en mostrar las ventajas que puede aportar la
lingüística de corpus, en concreto en el aula de interpretación. En esta
ocasión, son los propios estudiantes quienes, a partir de publicaciones
científicas y de documentación oficial de la Comisión Europa, compilan un
corpus sobre enfermedades raras. Asimismo, mediante el uso de ParaConc,
se extrae un completo glosario bilingüe inglés-español que sirve como apoyo
para afrontar una interpretación del ámbito legal relacionada a su vez con el
campo médico de la discapacidad física e intelectual. Con ello, la autora
demuestra que la compilación y la explotación de corpus lingüísticos no solo
puede suponer una herramienta de gran valor para la didáctica o el ejercicio
profesional de la traducción, sino también de la interpretación.
Tras ello, se llega al segundo bloque del volumen, compuesto por cinco
capítulos, los cuales permiten dar cuenta de las diferentes aplicaciones que
presentan los corpus para la didáctica de segundas lenguas, haciendo
hincapié en la enseñanza de fraseología y terminología. Abre este bloque
«Estrategias heurísticas con corpus para la enseñanza de la fraseología
orientada a la traducción», capítulo en el que Carlos Manuel Hidalgo Ternero
y Gloria Corpas Pastor muestran con éxito las posibilidades que los corpus
en red, tanto monolingües como bilingües, presentan a la hora de identificar
e interpretar las unidades fraseológicas. En concreto, basan su estudio en
dos corpus monolingües en español (CORPES XXI y esEuTenTen), un
corpus monolingüe en inglés (enTenTen) y dos paralelos multilingües
(Europarl y Linguee, subcorpus inglés-español). En su estudio, los autores
describen las diferentes actividades formativas llevadas a cabo en la
asignatura de Lengua y Cultura B aplicadas a la Traducción e Interpretación.
A través de esta propuesta didáctica, describen de forma pormenorizada al
lector a cómo se puede trabajar en el aula las virtudes de este tipo de corpus
para identificar e interpretar correctamente las unidades fraseológicas (en
especial aquellas que sean susceptibles de presentar múltiples lecturas).
En «Un estudio de caso basado en corpus sobre el uso de las
colocaciones verbales en estudiantes de inglés de nivel avanzado», Miriam
Buendía Castro compila corpus de aprendices, es decir, formados por los
textos producidos por los propios estudiantes (en este caso, se recogen
textos argumentativos redactados en lengua inglesa por alumnos de nivel
avanzado), para analizar, a través de TermoStat, las colocaciones
Reseñas 289
Hikma 19 (1) (2020), 285 - 291
(principalmente verbales) usadas por los discentes y así poder poner de
manifiesto la variedad de errores cometidos con este tipo de estructuras. A la
luz de los resultados del pormenorizado análisis que lleva a cabo la autora,
propone orientaciones para mejorar la enseñanza de las colocaciones y con
ello la competencia fraseológica de los estudiantes de nivel avanzado de
inglés como segunda lengua.
Por su parte, María Rosario Bautista Zambrana, en su capítulo «El uso
de corpus y TextStat para la enseñanza-aprendizaje de la negación y de la
fraseología en el aula de alemán como lengua extranjera», compila dos
corpus monolingües en alemán que posteriormente explotarán mediante
TextStat alumnos tanto del Grado en Estudios Ingleses como del Grado en
Turismo.. En concreto, hace uso de dos funciones de TextStat: Word forms
(para extraer las palabras más frecuentes de cada corpus y que sirva al
alumnado para familiarizarse con los textos) y Concordance (para que los
estudiantes busquen concordancias de los distintos términos y estudien su
comportamiento morfosintáctico y fraseológico). A través de distintas
propuestas pedagógicas, la autora se sirve de los corpus para trabajar en el
aula aspectos gramaticales como la negación en alemán así como contenidos
léxicos, fraseológicos y gramaticales relacionados con el tema
Wegbeschreibung (es decir, a partir de textos basados en la descripción de
rutas para llegar a diferentes sitios dentro de una ciudad).
Seguidamente, Cristina Castillo Rodríguez y Alexandra Santamaría
Urbieta, con su aportación «Extracción de patrones lingüísticos en inglés y en
italiano: un caso práctico con corpus etiquetado en el ámbito del turismo de
salud y belleza», ponen de manifiesto las ventajas del empleo de corpus
etiquetados para la extracción de patrones en la enseñanza de lenguas
extranjeras, en particular, del inglés y del italiano. Las autoras describen en
su estudio todo el proceso de compilación del corpus, haciendo especial
hincapié en el etiquetado de los textos que lo conforman. En concreto, se han
servido de tres programas para el etiquetado y la explotación de este corpus
sobre turismo de salud y belleza: EncodeAnt, TagAnt y AntConc. Para
mostrar el uso real que los alumnos pueden hacer de las herramientas de
análisis de corpus, muestran un ejemplo de búsqueda de patrón lingüístico
(adjetivo-nombre en el subcorpus en lengua inglesa y nombre+adjetivo en el
subcorpus en lengua italiana). Además, proponen otras pautas no solo para
seguir explotando terminológicamente este corpus (en concreto muestra
cómo buscar secuencias terminológicas más complejas), sino también para
detectar errores en el etiquetado de ciertas palabras del corpus.
Cierra el volumen Isabel Durán Muñoz, quien en el capítulo
«Evaluación de recursos-e con corpus desde una perspectiva terminológica»
analiza con sumo detalle los recursos en línea disponibles que permiten a los
290 Míriam Pérez Carrasco
Hikma 19 (1) (2020), 285 - 291
usuarios realizar consultas a corpus textuales. Asimismo, lleva a cabo una
evaluación de 14 de estas herramientas mediante una plantilla propia y
puntuable. Así pues, los recursos en línea con corpus que incluye en su
evaluación son los siguientes: Bab.la Dictionary, British National Corpus
(BNC), buscadores (por ejemplo, Google), Corpus of Contemporary American
English (COCA), Dictionary.com, Glosbe, Inteliterm, Linguee, MyMemory,
Reverso Context, Termitur, Your Dictionary, WebCorp y Wordincontext. A
través de la lectura de este capítulo, conoceremos hasta qué punto son aptas
para cubrir las necesidades de los traductores profesionales herramientas de
los siguientes tipos, a saber, corpus en línea de consulta, buscadores de
concordancias basados en corpus, memorias de traducción web y
combinaciones de corpus y diccionarios electrónicos.
En suma, este volumen, de carácter eminentemente aplicado, plasma
a la perfección la utilidad y relevancia que puede tener tanto para discentes y
docentes como para profesionales de la traducción y de la interpretación la
explotación de corpus especializados. Gracias a ellos, es posible realizar una
labor de documentación precisa, rápida y muy efectiva, pues se basa en datos
reales y permite observar cómo se comportan los términos en su contexto.
Asimismo, con respecto a sus aplicaciones en la enseñanza-aprendizaje de
lenguas extranjeras, la lingüística de corpus pone al alcance de discentes y
docentes un gran abanico de posibilidades, entre ellas consultar
concordancias o colocaciones léxicas, realizar listados para el estudio del
léxico en un campo concreto, analizar los errores más frecuentes en corpus
de aprendices o estudiar la fraseología. Finalmente, cabe destacar de la obra
aquí reseñada la gran diversidad tipológica y temática de aplicaciones que
contiene (desde la terminología de los embutidos, hasta temáticas jurídicas o
científico-técnicas); los diferentes tipos de corpus con los que los autores del
volumen han trabajado (corpus virtual comparable, corpus de aprendices,
corpus paralelos, corpus comparable etiquetado, tanto compilados por ellos
mismos como disponibles en red); la diversidad de lenguas en las que se han
aplicado los estudios (alemán, catalán, español, francés, inglés e italiano); y,
por último, los múltiples programas para la compilación, el etiquetado o la
explotación de corpus lingüísticos que se han empleado (AntConc, ParaConc,
SketchEngine, WebBootCat, TermoStat, tlCorpus, Wodsmith 4.0, TagAnt o
ReCor, entre otros).
En definitiva, este volumen muestra con éxito los últimos avanc
es y
enfoques en la lingüística de corpus, y sobre todo, ayuda a observar de un
modo eminentemente práctico las enormes ventajas y posibilidades que
supone trabajar con corpus lingüísticos tanto en el ámbito (profesional y
educativo) de la traducción e interpretación como en la enseñanza-
aprendizaje de segundas lenguas. Sin duda, estamos ante una obra
Reseñas 291
Hikma 19 (1) (2020), 285 - 291
exhaustiva, clara, actual y de gran atractivo para discentes, docentes,
investigadores y profesionales de la traducción e interpretación o del campo
de la enseñanza de lenguas extranjeras.
[MÍRIAM PÉREZ CARRASCO]