Aprovechamiento de corpus basados en géneros con el uso de la herramienta de investigación Notebook LM, impulsada por IA
Main Article Content
Abstract
Resumen: Las relaciones sintagmáticas siempre han sido el eje central de la lingüística de corpus, donde el elemento más importante es el cotexto (principalmente patrones colocacionales). Sin abandonar este enfoque, el advenimiento de la inteligencia artificial (IA) ha abierto nuevas posibilidades para explorar los corpus más allá de las funcionalidades de los navegadores y programas de concordancias, ya que las herramientas de investigación impulsadas por IA ofrecen una comprensión más profunda y holística de los corpus. Este artículo examina el potencial de Notebook LM, una aplicación de IA generativa. La hipótesis inicial es que la combinación de corpus e IA conduce a una comprensión más exhaustiva de géneros textuales y del lenguaje utilizado en ellos. Una ventaja de Notebook LM sobre grandes modelos de lenguaje como ChatGPT es que procesa solo los textos cargados, otorgando a los investigadores control preciso sobre las fuentes utilizadas. Como estudio de caso, se utilizó un corpus comparable de descripciones de quesos: 400 textos en español (121 461 palabras) y 600 en inglés (111 871 palabras). Se utilizó Notebook LM para resumir el corpus, obtener temas clave, como la importancia histórica y los métodos de producción y demostrar el poder de las instrucciones (prompts), más adecuadas para el análisis cualitativo. Al comparar las convenciones de escritura, las descripciones en inglés tienden a ser más concisas e informativas, mientras que los textos españoles utilizan un lenguaje más subjetivo y evocador, a menudo incorporando contexto cultural y un tono más entusiasta. Estos hallazgos pueden ser útiles en escritura en segundas lenguas y en traducción, al distinguir las características estilísticas de textos promocionales que resultan apropiadas en ambas lenguas. En conclusión, Notebook LM proporciona posibilidades complementarias que, combinadas con otras aplicaciones de análisis de corpus, constituyen una poderosa herramienta para el aprovechamiento de los corpus basados en géneros.
Downloads
Article Details

This work is licensed under a Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License.
Política propuesta para revistas que ofrecen acceso abierto. Aquellos autores/as que tengan publicaciones con esta revista, aceptan los términos siguientes:
- Los autores/as conservarán sus derechos de autor y garantizarán a la revista el derecho de primera publicación de su obra, el cuál estará simultáneamente sujeto a la Licencia de reconocimiento de Creative Commons que permite a terceros compartir la obra siempre que se indique su autor y su primera publicación esta revista.
- Los autores/as podrán adoptar otros acuerdos de licencia no exclusiva de distribución de la versión de la obra publicada (p. ej.: depositarla en un archivo telemático institucional o publicarla en un volumen monográfico) siempre que se indique la publicación inicial en esta revista.
- Se permite y recomienda a los autores/as difundir su obra a través de Internet (p. ej.: en archivos telemáticos institucionales o en su página web) antes y durante el proceso de envío, lo cual puede producir intercambios interesantes y aumentar las citas de la obra publicada. (Véase El efecto del acceso abierto).
References
AIJMER, Karin; ALTENBERG, Bengt; JOHANSSON, Mats (eds.), Languages in contrast. Papers from a symposium on text-based cross-linguistic studies. Lund 4-5 March, 1994. Lund: Lund University Press, 1996.
ALONSO-GUISANDE, Miguel Ángel; LÓPEZ FRAILE, Luis Antonio, “Herramientas de inteligencia artificial generativa aplicadas en la producción de podcasts”. In: Edu Review, 12, 2, 2024, pp. 19-32. Accessed at:
https://doi.org/10.62701/revedu.v12.5409 DOI: https://doi.org/10.62701/revedu.v12.5409
BIBER, Douglas; CONRAD, Susan; REPPEN, Randi, Corpus Linguistics: Investigating Language Structure and Use. Cambridge: Cambridge University Press, 1998. DOI: https://doi.org/10.1017/CBO9780511804489
CROSTHWAITE, Peter; BAISA, Vit, “Generative AI and the end of corpus-assisted data-driven learning? Not so fast!”. In: Applied Corpus Linguistics, 3, 3, 2023. Accessed at: https://doi.org/10.1016/j.acorp.2023.100066 DOI: https://doi.org/10.1016/j.acorp.2023.100066
CROSTHWAITE, Peter (ed.), Corpora for language learning: Bridging the Research-Practice Divide. London/ New York: Routledge, 2024. DOI: https://doi.org/10.4324/9781003413301
CURRY, Niall; BAKER, Paul; BROOKES, Gavin, “Generative AI for corpus approaches to discourse studies: A critical evaluation of ChatGPT”. In: Applied Corpus Linguistics, 4, 12024, 2024. Accessed at:
https://doi.org/10.1016/j.acorp.2023.100082 DOI: https://doi.org/10.1016/j.acorp.2023.100082
FILLMORE, Charles J., ““Corpus linguistics” or “Computer-aided armchair linguistics””. In: Svartvik, Jan (ed.), Directions in Corpus Linguistics: Proceedings of Nobel Symposium 82 Stockholm, 4-8 August 1991. Berlin/ New York: De Gruyter Mouton, 1992, pp. 35-60. Accessed at:
https://doi.org/10.1515/9783110867275.35 DOI: https://doi.org/10.1515/9783110867275.35
GADSDEN, Amy Dominique; GOEGAN, Lauren. Denise, “Informing Inclusive Practice in Post-Secondary Environments: Perspectives of Post-Secondary Instructors with Learning Disabilities”. In: The Canadian Journal for the Scholarship of Teaching and Learning, 14, 2, 2023. Accessed at:
https://doi.org/10.5206/cjsotlrcacea.2023.2.8020 DOI: https://doi.org/10.5206/cjsotlrcacea.2023.2.8020
HOEY, Michael, Lexical Priming: A New Theory of Words and Language. London/New York: Routledge, 2005.
JOHANSSON, STIG; OKSEFJELL, SIGNE (eds.), Corpora and cross-linguistic research. Theory, method and case studies. Amsterdam/ New York: Rodopi, 1998. DOI: https://doi.org/10.1163/9789004653665
LABRADOR, Belén; RAMÓN, Noelia, “Positive Evaluation in the Translation of Online Promotional Discourse in the Cheese Industry”. In: IEEE Transactions on Professional Communication, 67, 3, 2024, pp. 316-332. Accessed at:
https://doi.org/10.1109/TPC.2024.3417056 DOI: https://doi.org/10.1109/TPC.2024.3417056
——, “‘Perfectly Smooth, Creamy and Full Flavoured’: Online Cheese Descriptions”. In Procedia - Social and Behavioral Sciences, 198, 2015, pp. 226-232. Accessed at:
https://doi.org/10.1016/j.sbspro.2015.07.440 DOI: https://doi.org/10.1016/j.sbspro.2015.07.440
MORIÑA, Anabel; CARBALLO, Rafael; DOMÉNECH, Ana, “Transforming higher education: a systematic review of faculty training in UDL and its benefits”. In: Teaching in Higher Education, 2025, pp. 1-18. Accessed at:
https://doi.org/10.1080/13562517.2025.2465994 DOI: https://doi.org/10.1080/13562517.2025.2465994
MEHTA, Neil; AGRAWAL, Anoop; BENJAMIN, Jennifer; MEHTA, Seysha, MACNEILL, Heather; MASTERS, Ken, “Pedagogy and generative artificial intelligence: Applying the PICRAT model to Google NotebookLM”. In: Medical Teacher, 47, 5, 2024, pp. 788-790. Accessed at:
https://doi.org/10.1080/0142159X.2024.2418937 DOI: https://doi.org/10.1080/0142159X.2024.2418937
OKSEFJELL EBELING, Signe, “Corpus-based contrastive studies and AI-generated translations”. In: Languages in Contrast, 25, 2, 2025, pp. 289-315. Accessed at: https://doi.org/10.1075/lic.00051.ebe DOI: https://doi.org/10.1075/lic.00051.ebe
RAMÓN, Noelia; LABRADOR, Belén, “Describing cheese in English and Spanish: A corpus-based contrastive study”. In: 8th International Conference on Corpus Linguistics (CILC 2016). Málaga, 2-4 March 2016.
—— “Selling cheese online: key nouns in cheese descriptions”. In: Terminology, 2018, pp. 210-235. Accessed at:
https://doi.org/10.1075/term.00019.ram DOI: https://doi.org/10.1075/term.00019.ram
——, “Comparing the expression of quality assurance in English and Spanish online cheese descriptions” Presented in: 16th International Conference on Corpus Linguistics Meaning in Corpus: Tools, Methods and Approaches to 'Aboutness’. Salamanca, 15-17 May 2025.
SANZ-VALDIVIESO, Lucía; LÓPEZ-ARROYO, Belén, “Human vs. ChatGPT corpus annotation: Data augmentation using LLM fine-tuning”. In: Rabadán, Rosa; Ramón, Noelia (eds.), Cross-linguistic mediated communication. Hybrid text production English-Spanish. Berlin: Peter Lang, 2025.
SINCLAIR, John, Corpus, Concordance, Collocation. Oxford: Oxford University Press, 1991.
SVARVTIK, Jan (ed.), Directions in Corpus Linguistics. Proceedings of Nobel Symposium 82 Stockholm, 4-8 August 1991. Berlin/ New York: Mouton de Gruyter, 1992. DOI: https://doi.org/10.1515/9783110867275
TORRENT, Tiago; HOFFMANN, Thomas; LORENZI, Arthur; TURNER Mark, Copilots for Linguists: AI, Constructions, and Frames. Cambridge: Cambridge University Press, 2024. DOI: https://doi.org/10.1017/9781009439190