Publicado 19/06/2023 16:18

Portaltic.-Snap tiene un modelo de generación de imágenes de alta calidad a partir de texto que funciona en el móvil y con rapidez

Modelo de difusión SnapFusion
Modelo de difusión SnapFusion - SNAP

   MADRID, 19 Jun. (Portaltic/EP) -

Snap ha presentado un modelo de inteligencia artificial (IA) que genera imágenes a partir de una descripción en texto y lo hace desde el teléfono móvil, en alta calidad y en menos dos segundos.

   Los modelos de difusión que permiten generar imágenes a partir de una descripción en texto son un tipo de modelo de IA generativa que agregan ruido a los datos de entrenamiento para posteriormente invertir el proceso y eliminar el ruido en un proceso de aprendizaje. Este proceso es el que le permite aprender a generar imágenes nuevas.

   El equipo de Snap Research ha desarrollado SnapFusion, un modelo de difusión que genera una imagen a partir de una descripción en texto. Y lo hace, además, desde el propio teléfono móvil, como explican desde Snap en un comunicado.

   Este hecho es precisamente lo que la firma tecnológica destaca de SnapFusion, puesto que los modelos de difusión son grandes y complejos, y requieren de potencia computacional para aprender a eliminar el ruido, en un proceso en el que no son precisamente rápidos.

   Los investigadores han optado por una aproximación genérica, en la que introducen una arquitectura de red eficiente, que permite "identificar la redundancia del modelo original y reducir el cálculo del decodificador de imágenes mediante destilación de datos".

   También han mejorado la destilación escalonada "explorando estrategias de capacitación e introduciendo la regularización sin clasificador orientación", explican en el texto de la investigación.

   Como resultado, han desarrollado un modelo de ocho pasos en la eliminación del ruido que obtiene iguales o mejores resultados que la versión 1.5 de Stable Diffusion (Stability AI), que consta de 50 pasos, en 1,84 segundos.

   Esta aproximación permite que SnapFusion genere imágenes de alta calidad y de forma rápida cuando se ejecuta directamente desde el 'smarphone', al menos en un iPhone 14 Pro, que es dispositivo con el que se han realizado las pruebas.

   La intención de los investigadores es seguir mejorando el rendimiento de este modelo en 'smartphones' con menor potencia que iPhone 14 Pro, manteniendo la velocidad de generación de contenido.