Cómo utilizar la red neuronal DALL-E 2
Miscelánea / / July 26, 2023
Entendemos cuáles son los pros y los contras del sistema y qué indicar en las solicitudes.
Qué es DALL‑E
DALL‑E es una red neuronal de OpenAI que genera imágenes basadas en consultas de texto y también puede crear variaciones de imágenes basadas en ejemplos sugeridos por el usuario.
La herramienta está diseñada en base al modelo. GPT‑3, quien además fue entrenado para crear gráficamente personas, animales, así como una gran cantidad de otros objetos. Además, el servicio puede combinar conceptos no relacionados para formar nuevas ideas.
La primera versión de DALL‑E se lanzó en 2021 y, un año después, los desarrolladores introdujeron una versión mejorada de DALL‑E 2, que admite una mayor calidad de imagen y opciones avanzadas para convertir imágenes prefabricadas fotos.
El sistema define consultas en cientos de idiomas, incluido el ruso. Pero el idioma principal para los comandos efectivos es el inglés. Primero, la red neuronal reconoce el texto ingresado por el usuario y genera un boceto simple a partir de él, luego lo convierte a la versión final de una resolución pequeña y luego lo amplía, agregando detalles.
Qué puede hacer la red neuronal DALL‑E 2
Como se mencionó anteriormente, el modelo de OpenAI no solo puede generar imágenes bajo demanda, sino también crear proyectos mezclando diferentes conceptos. La red neuronal conecta dos marcos y forma otro a partir de ellos.
Con la función Outpainting, puede dibujar fondo Imágenes. Es interesante complementar pinturas o fotografías terminadas, desarrollando nuevas historias sobre ellas. También es posible cambiar la composición, editar las sombras y la textura de la imagen, agregar y eliminar objetos en el marco.
Una de las características de DALL‑E 2 es trabajar con archivos descargados. Con una interfaz minimalista fácil de usar, es fácil agregar elementos a las fotos, generar paisajes fantásticos o aumentar el detalle de las imágenes.
¿Cuáles son las desventajas de DALL‑E 2?
Por el momento, DALL‑E 2 no es un instrumento perfecto. Para obtener buenos resultados, debe experimentar, probar diferentes consultas y modificar los parámetros. La red neuronal produce periódicamente fotogramas divertidos o incluso aterradores con objetos distorsionados y una disposición incorrecta de los elementos.
El sistema se confunde especialmente a menudo si le da largas peticiones y dar demasiados detalles específicos. No define muy bien los términos profesionales y también se confunde al usar negaciones o exclusiones en lugar de indicaciones directas de lo que debería estar en el marco.
Cómo usar DALL‑E 2
Puede comenzar a usar el sistema en el sitio web de OpenAI en sección DALL E 2presionando el botón Try DALL‑E 2. Si aún no tiene una cuenta en el sitio, puede obtenerla a través de su dirección de correo electrónico o perfiles existentes de Google o Microsoft.
Si está intentando conectarse desde Rusia, necesitará una VPN y un número virtual para registrarse en una cuenta. Puede leer más sobre cómo crear una cuenta en el sitio web de OpenAI en material sobre ChatGPT.
Una vez que haya iniciado sesión, debería tener 35 créditos gratuitos de generación de imágenes durante un mes. Cada próximo mes, se dan 15 intentos. Puede recargar el saldo en su cuenta personal usando el botón Comprar créditos. Tendrá que pagar un mínimo de $15 por 115 solicitudes. Desafortunadamente, los usuarios de Rusia no pueden reponer el saldo directamente ahora.
Hay varias opciones para resolver el problema: pedirle a un amigo con el acceso adecuado al sistema de pago que pague la factura o proporcione una cuenta por un tiempo, busque y compre un perfil de OpenAI listo para usar a través de plataformas comerciales en línea o use otros servicios en Base DALL‑E.
La alternativa más conveniente Generador de imágenes de Microsoft. Esta herramienta se ejecuta en algoritmos DALL-E 2 y ofrece casi los mismos resultados de forma gratuita. Pero no tiene modo. edición de imágenes, completando el marco y otras características útiles. El análogo se puede usar solo para generar imágenes y luego corregir el resultado con otros programas. Necesitará una cuenta de Microsoft y una VPN para usarla.
Es mejor hacer una solicitud de generación tanto en el sitio web de DALL‑E 2 como en el generador de imágenes en inglés, pero en ruso el sistema también da buenos resultados. El botón Sorprenderme, que se encuentra junto a la línea de entrada, emitirá automáticamente una solicitud inusual para probar la red neuronal.
Para obtener un resultado de calidad, utilice consultas que describan claramente el marco deseado, pero sin detalles innecesarios. Introduzca el tipo de imagen en la línea de entrada. Puede ser un retrato, una imagen de acuarela, un boceto a lápiz y similares.
Especifique también la opción de iluminación en el marco y el estilo. Por ejemplo, una exhibición realista, como en un cómic, o un estilo específico de un artista famoso. Es deseable complementar esto con un nivel aproximado de brillo.
Al final de la línea, puede agregar el contexto de lo que está sucediendo. Por ejemplo, que el marco contenga no solo el vehículo lunar, sino también el momento en que se mueve contra el fondo de la Tierra. O un escenario donde las liebres de peluche luchan contra los extraterrestres.
La solicitud no tiene que incluir todos los elementos, el resultado puede ser interesante, pero la tasa de éxito será notablemente menor. Ayudar a construir un equipo exitoso herramientas especializadas, como la Promptomanía.
Leer también🖼️🤖💬
- Cómo usar ChatGPT en Telegram y obtener respuestas rápidamente a cualquier pregunta sin un navegador
- Más de 100 servicios basados en redes neuronales para una variedad de tareas
- 7 herramientas de redes neuronales para mejorar la calidad del video
- 6 servicios basados en redes neuronales para mejorar la calidad del sonido
- 10 complementos útiles para ChatGPT