Aprovechamiento de corpus basados en géneros con el uso de la herramienta de investigación Notebook LM, impulsada por IA

Main Article Content

Belén Labrador
https://orcid.org/0000-0002-3341-1661

Abstract

Resumen: Las relaciones sintagmáticas siempre han sido el eje central de la lingüística de corpus, donde el elemento más importante es el cotexto (principalmente patrones colocacionales). Sin abandonar este enfoque, el advenimiento de la inteligencia artificial (IA) ha abierto nuevas posibilidades para explorar los corpus más allá de las funcionalidades de los navegadores y programas de concordancias, ya que las herramientas de investigación impulsadas por IA ofrecen una comprensión más profunda y holística de los corpus. Este artículo examina el potencial de Notebook LM, una aplicación de IA generativa. La hipótesis inicial es que la combinación de corpus e IA conduce a una comprensión más exhaustiva de géneros textuales y del lenguaje utilizado en ellos. Una ventaja de Notebook LM sobre grandes modelos de lenguaje como ChatGPT es que procesa solo los textos cargados, otorgando a los investigadores control preciso sobre las fuentes utilizadas. Como estudio de caso, se utilizó un corpus comparable de descripciones de quesos: 400 textos en español (121 461 palabras) y 600 en inglés (111 871 palabras). Se utilizó Notebook LM para resumir el corpus, obtener temas clave, como la importancia histórica y los métodos de producción y demostrar el poder de las instrucciones (prompts), más adecuadas para el análisis cualitativo. Al comparar las convenciones de escritura, las descripciones en inglés tienden a ser más concisas e informativas, mientras que los textos españoles utilizan un lenguaje más subjetivo y evocador, a menudo incorporando contexto cultural y un tono más entusiasta. Estos hallazgos pueden ser útiles en escritura en segundas lenguas y en traducción, al distinguir las características estilísticas de textos promocionales que resultan apropiadas en ambas lenguas. En conclusión, Notebook LM proporciona posibilidades complementarias que, combinadas con otras aplicaciones de análisis de corpus, constituyen una poderosa herramienta para el aprovechamiento de los corpus basados en géneros.

Downloads

Download data is not yet available.

Article Details

How to Cite
Labrador, B. (2026). Aprovechamiento de corpus basados en géneros con el uso de la herramienta de investigación Notebook LM, impulsada por IA. Alfinge. Revista De Filología, 37, pp. 51–75. https://doi.org/10.21071/arf.v37i.18449
Section
Monographs

References

AIJMER, Karin; ALTENBERG, Bengt; JOHANSSON, Mats (eds.), Languages in contrast. Papers from a symposium on text-based cross-linguistic studies. Lund 4-5 March, 1994. Lund: Lund University Press, 1996.

ALONSO-GUISANDE, Miguel Ángel; LÓPEZ FRAILE, Luis Antonio, “Herramientas de inteligencia artificial generativa aplicadas en la producción de podcasts”. In: Edu Review, 12, 2, 2024, pp. 19-32. Accessed at:

https://doi.org/10.62701/revedu.v12.5409 DOI: https://doi.org/10.62701/revedu.v12.5409

BIBER, Douglas; CONRAD, Susan; REPPEN, Randi, Corpus Linguistics: Investigating Language Structure and Use. Cambridge: Cambridge University Press, 1998. DOI: https://doi.org/10.1017/CBO9780511804489

CROSTHWAITE, Peter; BAISA, Vit, “Generative AI and the end of corpus-assisted data-driven learning? Not so fast!”. In: Applied Corpus Linguistics, 3, 3, 2023. Accessed at: https://doi.org/10.1016/j.acorp.2023.100066 DOI: https://doi.org/10.1016/j.acorp.2023.100066

CROSTHWAITE, Peter (ed.), Corpora for language learning: Bridging the Research-Practice Divide. London/ New York: Routledge, 2024. DOI: https://doi.org/10.4324/9781003413301

CURRY, Niall; BAKER, Paul; BROOKES, Gavin, “Generative AI for corpus approaches to discourse studies: A critical evaluation of ChatGPT”. In: Applied Corpus Linguistics, 4, 12024, 2024. Accessed at:

https://doi.org/10.1016/j.acorp.2023.100082 DOI: https://doi.org/10.1016/j.acorp.2023.100082

FILLMORE, Charles J., ““Corpus linguistics” or “Computer-aided armchair linguistics””. In: Svartvik, Jan (ed.), Directions in Corpus Linguistics: Proceedings of Nobel Symposium 82 Stockholm, 4-8 August 1991. Berlin/ New York: De Gruyter Mouton, 1992, pp. 35-60. Accessed at:

https://doi.org/10.1515/9783110867275.35 DOI: https://doi.org/10.1515/9783110867275.35

GADSDEN, Amy Dominique; GOEGAN, Lauren. Denise, “Informing Inclusive Practice in Post-Secondary Environments: Perspectives of Post-Secondary Instructors with Learning Disabilities”. In: The Canadian Journal for the Scholarship of Teaching and Learning, 14, 2, 2023. Accessed at:

https://doi.org/10.5206/cjsotlrcacea.2023.2.8020 DOI: https://doi.org/10.5206/cjsotlrcacea.2023.2.8020

HOEY, Michael, Lexical Priming: A New Theory of Words and Language. London/New York: Routledge, 2005.

JOHANSSON, STIG; OKSEFJELL, SIGNE (eds.), Corpora and cross-linguistic research. Theory, method and case studies. Amsterdam/ New York: Rodopi, 1998. DOI: https://doi.org/10.1163/9789004653665

LABRADOR, Belén; RAMÓN, Noelia, “Positive Evaluation in the Translation of Online Promotional Discourse in the Cheese Industry”. In: IEEE Transactions on Professional Communication, 67, 3, 2024, pp. 316-332. Accessed at:

https://doi.org/10.1109/TPC.2024.3417056 DOI: https://doi.org/10.1109/TPC.2024.3417056

——, “‘Perfectly Smooth, Creamy and Full Flavoured’: Online Cheese Descriptions”. In Procedia - Social and Behavioral Sciences, 198, 2015, pp. 226-232. Accessed at:

https://doi.org/10.1016/j.sbspro.2015.07.440 DOI: https://doi.org/10.1016/j.sbspro.2015.07.440

MORIÑA, Anabel; CARBALLO, Rafael; DOMÉNECH, Ana, “Transforming higher education: a systematic review of faculty training in UDL and its benefits”. In: Teaching in Higher Education, 2025, pp. 1-18. Accessed at:

https://doi.org/10.1080/13562517.2025.2465994 DOI: https://doi.org/10.1080/13562517.2025.2465994

MEHTA, Neil; AGRAWAL, Anoop; BENJAMIN, Jennifer; MEHTA, Seysha, MACNEILL, Heather; MASTERS, Ken, “Pedagogy and generative artificial intelligence: Applying the PICRAT model to Google NotebookLM”. In: Medical Teacher, 47, 5, 2024, pp. 788-790. Accessed at:

https://doi.org/10.1080/0142159X.2024.2418937 DOI: https://doi.org/10.1080/0142159X.2024.2418937

OKSEFJELL EBELING, Signe, “Corpus-based contrastive studies and AI-generated translations”. In: Languages in Contrast, 25, 2, 2025, pp. 289-315. Accessed at: https://doi.org/10.1075/lic.00051.ebe DOI: https://doi.org/10.1075/lic.00051.ebe

RAMÓN, Noelia; LABRADOR, Belén, “Describing cheese in English and Spanish: A corpus-based contrastive study”. In: 8th International Conference on Corpus Linguistics (CILC 2016). Málaga, 2-4 March 2016.

—— “Selling cheese online: key nouns in cheese descriptions”. In: Terminology, 2018, pp. 210-235. Accessed at:

https://doi.org/10.1075/term.00019.ram DOI: https://doi.org/10.1075/term.00019.ram

——, “Comparing the expression of quality assurance in English and Spanish online cheese descriptions” Presented in: 16th International Conference on Corpus Linguistics Meaning in Corpus: Tools, Methods and Approaches to 'Aboutness’. Salamanca, 15-17 May 2025.

SANZ-VALDIVIESO, Lucía; LÓPEZ-ARROYO, Belén, “Human vs. ChatGPT corpus annotation: Data augmentation using LLM fine-tuning”. In: Rabadán, Rosa; Ramón, Noelia (eds.), Cross-linguistic mediated communication. Hybrid text production English-Spanish. Berlin: Peter Lang, 2025.

SINCLAIR, John, Corpus, Concordance, Collocation. Oxford: Oxford University Press, 1991.

SVARVTIK, Jan (ed.), Directions in Corpus Linguistics. Proceedings of Nobel Symposium 82 Stockholm, 4-8 August 1991. Berlin/ New York: Mouton de Gruyter, 1992. DOI: https://doi.org/10.1515/9783110867275

TORRENT, Tiago; HOFFMANN, Thomas; LORENZI, Arthur; TURNER Mark, Copilots for Linguists: AI, Constructions, and Frames. Cambridge: Cambridge University Press, 2024. DOI: https://doi.org/10.1017/9781009439190