¿Qué es la IA Generativa?

 

Imagen decorativa generada por inteligencia artifical
Imagen generada por IA

Cuando hablamos de Inteligencia Artificial nos estamos refiriendo a sistemas que intentan simular algún aspecto de la inteligencia humana como la toma de decisiones, el razonamiento o el aprendizaje.

Las IAs son capaces de generar contenido a partir de nuestras peticiones gracias a un proceso de aprendizaje automático basado en los datos que van recopilando. En este caso nos referimos a las IA Generativas. Este tipo de sistemas aprenden a partir de grandes conjuntos de datos y existe la posibilidad de volver a entrenar y afinar el modelo con nuevas interacciones.

Dentro de las IA Generativas tenemos los Large Language Models (LLM) que son capaces de procesar texto en lenguaje natural  para producir respuestas a partir del entrenamiento llevado a cabo con la gran cantidad de datos procesados. 

Estos modelos son los que se utilizan en el ejemplo más popular actualmente de estos sistemas: ChatGPT. Es un agente conversacional que usa lenguaje natural para interactuar con la IA Generativa que es capaz de procesar el texto de la pregunta y generar una respuesta basada en los patrones encontrados en su entrenamiento. En este modelo es básico el uso de los datos que va recopilando, por ejemplo, de las preguntas de los propios usuarios y que le permiten mejorar sus respuestas.

En este punto es importante diferenciar entre IA Generativa sin privacidad de datos, que utiliza los datos que se introducen como fuente para el propio entrenamiento e IA Generativa con privacidad de datos que protege los datos del uso de terceros y no son utilizados como entradas en los procesos de aprendizaje.

Dentro de las IA Generativas de acceso público y siguiendo el ejemplo de los modelos generadores de lenguaje podemos mencionar ChatGPT desarrollado por OpenAI actualmente en su cuarta versión, Copilot de Microsoft, Gemini desarrollado por Google o Llama creado por Meta.

Como alternativa a los anteriores, actualmente, la Universidad de Granada proporciona a PDI y PTGAS la oportunidad de utilizar la versión protegida del chat Copilot accediendo con la cuenta institucional de Microsoft (@ms.ugr.es) o con un perfil en su navegador Edge. La principal ventaja de esta IA Generativa es que las preguntas y datos que utilicemos para interactuar con el modelo no serán reutilizados posteriormente para reentrenar el modelo, evitando problemas de fuga y protección de datos. Próximamente, se contempla que también esté disponible para el alumnado.

Algunas consideraciones

Las oportunidades que nos brinda el uso de las herramientas de IA Generativa nos animan a experimentar su utilización en diversas facetas del quehacer de todos los miembros de la comunidad universitaria, sin embargo, es necesario promover un uso responsable de esas herramientas y tener en cuenta algunos aspectos importantes como los siguientes:

  1. Privacidad y protección de datos. La información que se introduce en las IA Generativas de tipo pública (por ejemplo chatGPT) se utiliza para el entrenamiento y aprendizaje del modelo, pasan a ser datos públicos de los que perdemos el control de su uso.

  2. Problemas de sesgo. Al aprender de la información que procesa sin distinciones éticas de ningún tipo, las IA Generativas pueden reproducir distorsiones o desviaciones que se encuentren en el procesamiento de esos datos. Esto provoca que la información que se genere pueda estar sesgada y sea necesario un procesamiento crítico por parte del usuario. Así, podría, por ejemplo, reproducir estereotipos no deseados o caer en una falta de diversidad.

  3. Integridad académica y propiedad intelectual. Una de las principales preocupaciones con el uso de estas herramientas es el aumento en el riesgo de plagio que puede darse. Las herramientas antiplagio no son capaces de detectar los documentos producidos con IA Generativa ya que aunque se basen en información que puede ser pública es un contenido nuevo. Promover un uso ético de la IA y cambiar metodologías docentes y de evaluación pueden ser la respuesta a esta problemática. Además, es posible que estas IA Generativa reproduzca secuencias usadas en su entrenamiento de modo que su salida podría vulnerar el copyright.

  4. Falta de transparencia. Los modelos utilizados se desarrollan con muchas variables que no son accesibles para el usuario y que, por tanto, las hacen imposibles de comprender. Todavía no podemos entender los tipos de razonamiento que pueden llevar a dar una respuesta sobre otra.

  5. Veracidad. En ocasiones, las respuestas generadas por la herramienta son completamente fabricadas, las llamadas “alucinaciones” de la IA Generativa. Esto hace todavía más importante el procesamiento crítico de las respuestas generadas con IA Generativa debiendo revisar y validar siempre cualquier texto obtenido.