¿Cuál es la palabra en español que más se repite?
Este dato se puede conocer gracias al CREA, el Corpus de Referencia del Español Actual
El Corpus de Referencia del Español Actual (CREA) es otra herramienta de análisis de la lengua española, algo parecido, metafóricamente, al submarino aquel que descubrió el Titanic y se adentró en su interior en las profundidades del mar, lo cual se podía ver en la película de James Cameron sobre el naufragio más famoso de la historia. Según la RAE «es un conjunto de textos de diversa procedencia, almacenados en soporte informático, del que es posible extraer información para estudiar las palabras, sus significados y sus contextos».
El CREA es ese submarino del español, un trasatlántico que navega en la superficie a pleno rendimiento botado en 1996, capaz de encontrar otro tipo de curiosidades como la que nos ocupa en este momento. Este Corpus contiene ciento sesenta millones de formas, entre textos escritos y orales, desde 1975 hasta 2004, procedentes de todos los países que hablan español, de los que se sirve la RAE para conocer datos como por ejemplo la palabra más usada en nuestra lengua.
Esta es la preposición «de». Solo en este mismo texto, hasta este tercer párrafo, se ha utilizado 11 veces, si contamos con la contracción «del» («de el»). «La», «que», «el», «en», «y», «a», «los» o «se», son las palabras que siguen a «de» de todo el español entre las que más se repiten. En estas líneas «la», segunda clasificada, se ha repetido 8 veces y «que», en tercer puesto, 5, como una pequeña demostración a escala de los datos revelados por el enorme banco del CREA.
«Textos escritos, seleccionados tanto de libros como de periódicos y revistas», dice la RAE, que «abarcan más de cien materias distintas. La lengua hablada está representada por transcripciones de documentos sonoros, obtenidos, en su mayor parte, de la radio y la televisión». La última versión de CREA es de diciembre de 2023, donde es posible la búsqueda por formas, lemas y categorías gramaticales.