La RAE actualiza el Corpus del Español con más de 4,5 millones de transcripciones de radio, televisión o YouTube
MADRID, 15 Feb. (EUROPA PRESS) - La Real Academia Española , en colaboración con la Asociación de Academias de la Lengua Española (ASALE), ha actualizado el Corpus del Español del Siglo XXI (CORPES XXI), que incluye la incorporación de más de 4,5 millones de transcripciones de textos orales (programas de radio y televisión, entrevistas en medios de comunicación, YouTube). En total, la más reciente versión de la herramienta, la 0.93, cuenta con más de 316.000 documentos, que suman algo más de 333 millones de formas ortográficas, procedentes de textos escritos y de transcripciones de textos orales. Con respecto a la versión anterior, publicada en mayo de 2020, supone un incremento de más de 21 millones de formas. Algunos archivos ofrecen el sonido alineado correspondiente a la transcripción; en otros es posible la descarga del archivo de audio,además de la visualización del vídeo, de acuerdo con la procedencia del texto fuente. Por lo que respecta al bloque de ficción