Se ha lanzado una nueva red neuronal Stable Diffusion. Genera imágenes de acuerdo a la descripción.
Miscelánea / / August 23, 2022
Puede crear imágenes directamente en el navegador. Cuanto más compleja sea la consulta, mejor será el resultado.
Los desarrolladores de la nueva red neuronal Stable Diffusion han publicado el proyecto en el dominio público. Ahora cualquiera puede probar el servicio para convertir consultas de texto en imágenes.
La forma más fácil de probar la difusión estable es abrazando la cara, pero hay largas colas en el sitio: una solicitud se procesa en unos 5 minutos. A través de la plataforma estudio de ensueño todo funciona mucho más rápido, pero necesitas una cuenta (puedes iniciar sesión a través de tu cuenta de Google o Discord).
Además, en DreamStudio, cada usuario recibe una cantidad limitada de créditos que se pueden gastar en la generación. Cuantas más imágenes y mayor sea la resolución, más cara será cada iteración. Para restaurar imágenes generadas anteriormente, también debe gastar créditos, por lo que no podrá divertirse durante tanto tiempo.
El proyecto también fue publicado. en GitHub. Por ahora requiere de una computadora con tarjeta gráfica NVIDIA y 6.9 GB de VRAM, en el futuro se planea agregar soporte para chips de video AMD, incluyendo el Apple M1/M2.
¿Qué tan bien funciona todo? Depende del usuario. Cuanto más complejas y precisas sean las consultas, más posibilidades de obtener buenos resultados. Por ejemplo, aquí están los resultados para la frase "Daenerys Targaryen en un vestido de novia con un dragón al estilo de Alphonse Mucha":
Este es el mago Yoda en Cyberpunk City.
Este es el terror de Harry Potter. Te asusta, pero no como debería.
En otras palabras, no puede obligar a una red neuronal a pensar en su lugar: para obtener un resultado claro, debe pensar en lo que quiere obtener como resultado.
Stable Diffusion le permite personalizar la precisión de coincidencia de la consulta, la cantidad de pasos y otros parámetros. La resolución máxima posible es de 1024 × 1024 píxeles, se pueden mostrar hasta 9 imágenes simultáneamente. La red neuronal no sabe cómo aumentar la resolución, para ello tendrás que apoyarte en servicios de terceros.
Si prueba el servicio, ¡comparta los resultados en los comentarios!
Leer también🧐
- La red neuronal mostró a los héroes de "Harry Potter" en el mundo del cyberpunk
- Google introdujo la red neuronal Imagen. Genera imágenes de acuerdo a la descripción.
- La red neuronal dibujó carteles de películas de culto. Elegí los 15 más geniales