Compilation of the Corpus of International Treaties
Contenido principal del artículo
Resumen
This paper focuses on the description of the corpus «PEST-INTER» in five languages and the process of its compilation and incorporation. The aim is to give step-by-step instruction on the corpus compilation. The further purpose is to show up the practical solutions for the problems raising in different stages of the corpus compilation. Describing the decisions taken and the strategies followed I discuss the corpus planning going into depth on web crawling, character and corpus encoding, automatic alignment and editing of the compiled texts.
Descargas
Detalles del artículo
Política propuesta para las revistas que ofrecen acceso abierto
Los/as autores/as que publican en esta revista aceptan las siguientes condiciones:
1. Los/as autores/as conservan los derechos de autor y conceden a la revista el derecho de primera publicación con el trabajo licenciado simultáneamente bajo una Licencia de Atribución de Creative Commons, la cual permite a otras personas compartir el trabajo con un reconocimiento de la autoría del trabajo y la publicación inicial en esta revista.
2. Los/as autores/as pueden establecer acuerdos contractuales adicionales para la distribución no exclusiva de la versión publicada del trabajo en la revista (por ejemplo, enviarlo a un repositorio institucional), con un reconocimiento de su publicación inicial en esta revista.
3. Se permite y anima a los/as autores/as a publicar su trabajo previo a la versión final publicada en esta revista una vez aceptado (por ejemplo, en repositorios institucionales o en su sitio web), ya que puede dar lugar a intercambios productivos, así como a una citación más temprana y mayor del trabajo publicado (Véase El efecto del acceso abierto).