Technologie - 🤖

527 readers

25 users here now

Ici concerne le champs de domaine large de la technologie : actualités sur l'informatique, partage de programme informatique et de code, montrer vos projets Arduino, ect.

Mégafil ici

founded 1 year ago

MODERATORS

Une app libre et open-source pour générer des images via une IA type Midjourney ou Dall-E. (github.com)

submitted 10 months ago by Camus@jlai.lu to c/technologie@jlai.lu

3 comments fedilink hide all child comments

top 3 comments

sorted by: hot top controversial new old

[–] JulienFalgas@lemmy.world 2 points 10 months ago

Merci pour la découverte !

J'utilisais Invoke AI, très touffu et mes derniers essais se sont révélés trèèès longs.

J'ai testé Fooocus et c'est vraiment performant. En tous cas avec une Geforce 3060 avec 12Gb de VRAM dans un boitier eGPU. Les Lora et autres checkpoints sont très simples à installer à chaud, pas besoin de relancer le bouzin.

[–] pokexpert30@lemmy.pussthecat.org 2 points 10 months ago (1 children)

Tiens c'est intéressant l'idée de propulser un gptv2 pour ingénierer une réplique dans stable diffusion. A essayer.

[–] Sphks@lemmy.dbzer0.com 1 points 10 months ago

J'imagine que l'intégralité des générateurs d'images vont passer par cette étape.
Sur Stable Diffusion, l'analyse de texte est à zéro. Si on lui donne un prompt compliqué du type : "un homme en vert qui tient un chien, et un homme en bleu qui saute", il ne tient compte d'aucune relation, subordonnée, virgule. Ça traite ceci : "homme vert tenir chien homme bleu sauter" et on peut très bien se retrouver avec un seul homme à tête bleue avec un chien vert qui saute à côté".

Dall-e 3 qui vient de sortir est exceptionnellement bon. Je ne sais pas comment ça marche sous le capot, mais il arrive à analyser la sémantique de manière très fine. Avec le prompt précédent, on a exactement un homme en vert qui tient le chien. Pour moi, il y a un LLM en premier...