
DeepSeek OpenAI
Inteligencia Artificial
¿Qué datos recopila sobre ti DeepSeek? ¿Y ChatGPT?
Italia ha bloqueado a la Inteligencia Artificial china por la falta de información sobre qué datos personales recoge
El pasado 11 de enero aterrizó en App Store el asistente de Inteligencia Artificial (IA) generativa DeepSeek, una herramienta al más puro estilo de ChatGPT que, además de responder preguntas con un formato conversacional, puede navegar por la web para ofrecer respuestas actualizadas, resumir documentos de texto de manera rápida y utilizar el razonamiento para resolver problemas complejos.
DeepSeek ha utilizado 14,8 billones de fragmentos de texto variados y de alta calidad para entrenar su modelo de inteligencia artificial. Este entrenamiento, según ha asegurado la empresa, se ha llevado a cabo en varias etapas, combinando supervisión humana y aprendizaje automático.
Cada fragmento de texto ha sido procesado durante 3,7 días usando 2.048 tarjetas gráficas Nvidia H800. En total, esto suma 2,788 millones de horas de procesamiento con GPU y un coste de 5,576 millones de dólares.
A pesar de esta inversión, el costo es significativamente menor en comparación con otros modelos de IA, como es el caso de GPT-4, cuyo entrenamiento costó 78 millones de dólares, o Gemini Ultra de Google, que alcanzó los 191 millones de dólares, según el informe Artificial Intelligence Index Report 2024.La aplicación ha sido un éxito y ha superado incluso a la de la firma estadounidense OpenAI, la cual ha afirmado tener pruebas de que DeepSeek utilizó su modelo de inteligencia artificial para entrenar a su propio chatbot, de ahí el bajo coste.
Ciberseguridad e inteligencia artificial
Este mismo viernes, 31 de enero, el Congreso de Estados Unidos ha prohibido a sus empleados el uso de DeepSeek al asegurar que el Congreso ha tenido dificultades para sortear los desafíos administrativos y de seguridad que plantea el rápido avance de la tecnología de la IA.
«En este momento, DeepSeek está siendo revisado por el CAO (Oficina administrativa del Congreso) y actualmente no está autorizado para su uso oficial en la Cámara», dijo el Director Administrativo de la Cámara de Representantes en una advertencia a sus empleados a la que ha tenido acceso el medio estadounidense Axios.
También Italia el pasado jueves tomó un camino similar. El Garante para la Protección de los Datos Personales de Italia ordenó el jueves el bloqueo «de forma urgente y efecto inmediato» de la aplicación china de inteligencia artificial al no haber recibido la información pedida sobre qué tipo de información se utiliza para entrenar a la herramienta y la respuesta ha sido «insuficiente».
«El Garante, considerando el posible alto riesgo para los datos de millones de personas en Italia, pidió a las dos empresas y a sus filiales que confirmaran qué datos personales se recogen, de qué fuentes, con qué fines, cuál es la base jurídica del tratamiento y si se almacenan en servidores ubicados en China», explicaron en una nota.
¿Qué datos recopila DeepSeek de los usuarios?
Según las condiciones de uso de DeepSeek, tus datos pueden ser utilizados de las siguientes formas principales:
- DeepSeek utiliza la información que ingresas («Entradas») para generar resultados («Salidas»), como texto, tablas o código. Aunque tú conservas los derechos sobre tus entradas y los resultados generados, DeepSeek puede procesar estos datos para mejorar los servicios y tecnologías subyacentes (por ejemplo, ajustar modelos de inteligencia artificial).
- Datos del perfil. Al crear una cuenta, se recopila información como nombre de usuario, dirección de correo electrónico, número de teléfono y contraseña.
- Comunicación directa. Información que envías al contactar al soporte, como pruebas de identidad, comentarios o consultas.
- Datos técnicos. Información sobre el dispositivo y la conexión de red, como modelo del dispositivo, sistema operativo, dirección IP, patrones de escritura y lenguaje del sistema. También se recopilan informes de fallos y registros de rendimiento.
- Información de uso. Datos sobre cómo utilizas el servicio, incluyendo las funciones que empleas y las acciones que realizas.
- Cookies y tecnologías similares. Se emplean para recopilar información automáticamente, medir y analizar el uso del servicio, y mejorar la experiencia del usuario.
- Servicios de terceros. Si te registras o inicias sesión a través de servicios como Apple o Google, se puede recopilar información de estos, como tokens de acceso.
- Almacenamiento y cumplimiento legal. Pueden conservar ciertos datos, incluso después de que elimines tu cuenta, si así lo requieren leyes o regulaciones. Tus datos podrían ser revisados si existen sospechas de infracciones legales o violaciones a los términos de uso.
- Optimización de sus sistemas. Bajo medidas de cifrado y anonimización, DeepSeek podría usar tus datos para desarrollar, operar y mejorar los servicios y tecnologías relacionados.
- Protección y monitoreo. DeepSeek se reserva el derecho de monitorear entradas y salidas para garantizar el cumplimiento de las leyes y las políticas internas, así como para prevenir abusos, fraudes o actividades ilegales.
- Derechos sobre la propiedad intelectual. DeepSeek retiene los derechos de propiedad intelectual sobre su tecnología, modelos y sistemas, pero no sobre tus Entradas o las Salidas generadas para ti.
- Compartir o exportar datos. Según la política, tus datos no pueden ser utilizados en jurisdicciones prohibidas por leyes de control de exportaciones o sanciones.
¿Qué datos recopila ChatGPT de los usuarios?
Por su arte, OpenAI, según su política de privacidad, recopila los siguientes datos de los usuarios:
- Datos proporcionados por el usuario. El contenido de las conversaciones, información de la cuenta si el usuario se ha registrado, como nombre, correo electrónico y detalles de pago si se utiliza la versión de pago.
- Datos técnicos y de uso. Como la dirección IP y la ubicación aproximada, el tipo de dispositivo, el navegador e información sobre cómo el usuario interactúa con el servicio (duración de la sesión, frecuencia de uso, etc.).
- Cookies y tecnologías de seguimiento. OpenAI usa cookies para mejorar la experiencia del usuario y analizar el rendimiento del sistema.
OpenAI especifica que comparte los datos con terceros en ciertos casos:
- Con proveedores de servicios, para alojamiento, análisis y mejoras de la plataforma.
- En casos en los que lo exija la ley.
- En caso de fusión o venta los datos podrían ser transferidos.
Para controlar sus datos los usuarios pueden optar por:
- Eliminar conversaciones.
- Desactivar el entrenamiento del modelo.
- Solicitar la eliminación de datos contactando con OpenAI.