La capacidad de aprendizaje de la TA neuronal: un estudio longitudinal 125
Estudios Franco-Alemanes 14 (2022), 121-144
de Castilho/Moorkens/Gaspari/Calixto/Tinsley/Way (2017) concluye que la
TA neuronal obtuvo muy buenos resultados en la evaluación automática, sin
embargo, “the PBSMT system still produces better translation when assessed
both via automatic and human evaluation metrics“ (2017: 117). Casi
contrarios con los resultados del estudio de
Shterionow/Nagle/Casanellas/Superbo/O’Dowd (2018), quienes compararon
la evaluación automática y la evaluación humana de sistemas neuronales y
sistemas estadísticos PBMST y llegan a la siguiente conclusión: “While the
quality evaluation scores indicated that the PBSMT engines perform better, the human
reviewers show the opposite results, i.e., that NMT outperforms PBSMT. The human
reviewers, all native speakers of the evaluated language pairs, ranked the quality of the
NMT engines higher than that of PBSMT in all cases“. En la prueba de productividad
realizada por los investigadores se mostró que la mayoría de los traductores son más
productivos en la posedición de un texto realizado por un sistema de TA neuronal
comparado con la posedición de un texto de un sistema PBSMT y la traducción humana
(Shterionow/Nagle/Casanellas/Superbo/O’Dowd, 2018: 233). Este último
resultado contrasta, a su vez, con las conclusiones del estudio de López-
Pereira (2019) sobre la productividad de la TA neuronal frente a la
estadística, pues este revela que aunque los traductores participantes
opinaron a priori que la posedición de un texto proporcionado por un motor
de TA neuronal sería más productiva, se observó que a pesar de que la
distancia de edición es menor, los participantes tardaron más en poseditar el
texto propuesto por el motor neuronal.
Asimismo, se han realizado diferentes estudios que comparan la TA
neuronal con la traducción humana. Queremos destacar, en este contexto, el
estudio de Hassan et al. 2018, quienes afirman, para la traducción de noticias
del chino al inglés, que “our latest neural machine translation system has
reached a new state-of-the-art, and that the translation quality is at human
parity when compared to professional human translations“ (2018: 1) y la
réplica de Läubli/Castilho/Neubig/Sennrich/Shen/Toral (2020:653), quienes
muestran que „the finding of human-machine parity was owed to
weaknesses in the evaluation design“ y que “professional human
translations contained significantly fewer errors“.
Igualmente cabe mencionar que también se han llevado a cabo estudios
enfocados a aspectos lingüísticos concretos como el de Chung (2018) sobre
nombres propios y números y el de Mair/Schmidhofer (2019) sobre la
traducción de expresiones relacionadas con el género gramatical. No hemos