
José Luis Ábalos, durante su declaración ante el Supremo
Toda la verdad de la chapucera transcripción de la declaración de Ábalos de la que culpan a la IA
Desde hace más de 20 años se puede pasar voz a texto sin complicaciones, el problema es cuando la inteligencia artificial no se usa para ayudar a mejorar
La declaración del exministro José Luis Ábalos en el Tribunal Supremo ha tenido un trasfondo del que apenas se ha hablado en los medios. La transcripción de sus respuestas se han convertido en una chapuza histórica de la que dan cuenta el Diario de Tarragona y el Diario de Navarra.
Las copias escritas de sus palabras contienen párrafos incomprensibles de los que se acusa a la inteligencia artificial (IA) por demostrar un «uso descontrolado y sin supervisión», según apuntan estos medios. Frases como «Realmente es que en Madrid no fuera de Madrid» o «Yo ahora mismo no recuerdo, porque en esa fecha ya a ministra sí pero con independencia de esto usted no recuerde que es compresible que no pueda recordar las fechas» o «ocasionalmente pues un chalé del tiempo que no estábamos, pero fue ocasionado, se fijó si eso 2 con eso he completado mis ingresos no tenía ningún otro ingreso», han despertado las críticas a un supuesto uso de herramientas de IA.
Todo esto es muy extraño porque, como se puede ver en el vídeo publicado por El Debate, tanto las preguntas como las respuestas de Ábalos eran totalmente claras y entendibles.
La IA no transcribe
Atribuir esto a la inteligencia artificial es un error. Es posible, que una aplicación como Whisper (OpenAI) haya estado detrás de estos textos, entonces sí que se podría culpar a la IA, pero, conociendo las costumbres de la Justicia española, tan artesanal siempre, parece complicado que se haya puesto en manos de algo tan sofisticado.
Pasar voz a texto se remonta a finales de los años 90 con un programa llamado IBM Voice. Un micrófono enchufado a un ordenador pasaba a un documento lo que el usuario pronunciaba –despacio– para asombro de todos en aquellos tiempos.
Pasar voz a texto se remonta a finales de los años 90 con un programa llamado IBM Voice
El salto tecnológico ha sido veloz en estos 20 años y ya Microsoft permite activar el micrófono del altavoz del ordenador o del móvil o tableta y dictar a una hoja de Word con una precisión asombrosa. No se queda atrás cualquier dispositivo móvil que permite escribir mediante la palabra WhatsApp o mensajes de texto. Aquí no hay inteligencia artificial que mejore o empeore el contenido.
Plataformas
El audio de la declaración de Ábalos en .mp3 se pudo subir a cualquiera de las decenas de plataformas que se dedican a esto con mayor o menor acierto. Google tiene GBoard o Google Docs, Microsoft, Speech to Text, Otter, Reconocimiento de Voz de Windows o Happy Scribe, una de las últimas en llegar que incorpora la IA, pero con matices.
Con toda la tecnología que se ha desarrollado en las últimas décadas para transcribir texto, no merece la pena que la IA entre a mejorar algo que se hace bien, pero sí puede aportar otras muchas ventajas. En el caso de las herramientas de transcripción con IA, esta mejora lo que permite es analizar a fondo el texto obtenido para que usuario pueda gestionarlo de una manera mucho más eficaz. Preguntar sobre el punto de vista del entrevistado sobre algo concreto, las veces que se ha referido a un tema específico, los titulares más impactantes, un resumen en 300 palabras o el enfoque si se quiere convertir la entrevista en un artículo científico con entrecomillados son algunas de las facilidades de la IA.
La propia IA podría haber ayudado a matizar todos estos errores e inconexiones
Es más, en el caso de la declaración de Ábalos, la propia IA podría haber ayudado a corregir todos estos errores e inconexiones, pero no se le puede culpar de ellos. En realidad, lo más probable es que su timbre, el tono de voz, la pronunciación, las interrupciones, ruidos y un sinfín de detalles mínimos han podido confundir a la máquina que ha acabado por entregar un texto inconexo en partes que no se ha revisado.
Las posibilidades de la IA en 2025 no son las de hacer las tareas que ya se venían haciendo hasta ahora, se trata de mejorar, de ayudar, de simplificar el trabajo y de convertir estas largas declaraciones en informes mucho más detallados y enriquecidos que simplifiquen el trabajo del personal de Justicia y de los propios periodistas.