Ai som hjälper till att fixa bilder

2025-04-18, 11:41 #1

Avstängd

Reg: Jan 2025

Inlägg: 1 064

Jag ska göra ett mobil spel. Och jag kan inte rita alla karaktärer för hand.

Om jag ber en vanlig AI göra en karaktär så går det bra! Men säger jag att han ska ta samma karaktär och vinkla huvudet så blir det helt fel.

Sen också en AI som kan göra bilden transparant? Eller att man väljer ut saker i bilden som ska vara transparant.

https://www.youtube.com/watch?v=GOFlKWI5GFs&list=PL5_f1Hy5l_azCtTYY46J4q7e IMNJnPRII&index=6

Ta tex detta spelet. Det börjar med att han står i profil och visar sitt ansikte. När steg får han en lavett och har huvudet åt höger med ett handavtryck i ansiktet.

Nästa bild är likadan bild fast åt andra hållet.

Jag har försökt väldigt många AI nu men ingen får det att funka.

Resultat blir såhär https://postimg.cc/8f4dqs8V Profil
https://postimg.cc/XBLhQVQr Efter en smäll.

Alltså inte en samma karaktär. Och jag har försökt 100 tals gånger och skriva på alla olika sätt. Det funkar inte. Eller MÅSTE jag göra allt för hand?

__________________
Senast redigerad av Monerokungen 2025-04-18 kl. 11:43.

Citera

2025-04-18, 14:33 #2

Medlem

Reg: Feb 2022

Inlägg: 557

Det kommer att vara i stort set omöjligt att göra bara med prompter. Du måste använda ett system där du kan ha en ursprungsbild med tillsammans med prompten, som dessutom är gjort för att hantera det på rätt sätt.

Kanske ChatGPT 4o klarar av det efter dom senaste uppdateringarna, men personligen hade jag kört det lokalt genom att köra Flux i Forge via Pinokio, så har man ett riktigt kraftfullt verktyg man har kontroll över, och kan enkelt lägga till LORAs, för mer kontroll, som man vill. Antingen färdiga från tex CivitAI eller som man skapat själv, med tex Fluxgym.

Gjorde ett snabb test med ChatGPT som blev rätt ok, men man har mer kontroll i Flux, speciellt med rätt LORA:
https://postimg.cc/9wqKN2j7
https://postimg.cc/VdQVL38K
https://postimg.cc/8jSZVMR3

__________________
Senast redigerad av SchrodingersPizza 2025-04-18 kl. 15:26.

Citera

2025-04-19, 14:24 #3

Medlem

Reg: Dec 2024

Inlägg: 363

Citat:

Ursprungligen postat av SchrodingersPizza

Det kommer att vara i stort set omöjligt att göra bara med prompter. Du måste använda ett system där du kan ha en ursprungsbild med tillsammans med prompten, som dessutom är gjort för att hantera det på rätt sätt.

Kanske ChatGPT 4o klarar av det efter dom senaste uppdateringarna, men personligen hade jag kört det lokalt genom att köra Flux i Forge via Pinokio, så har man ett riktigt kraftfullt verktyg man har kontroll över, och kan enkelt lägga till LORAs, för mer kontroll, som man vill. Antingen färdiga från tex CivitAI eller som man skapat själv, med tex Fluxgym.

Gjorde ett snabb test med ChatGPT som blev rätt ok, men man har mer kontroll i Flux, speciellt med rätt LORA:
https://postimg.cc/9wqKN2j7
https://postimg.cc/VdQVL38K
https://postimg.cc/8jSZVMR3

Vad är Pinokio egentligen? Är det som en sorts central för allt man har installerat och som man sen startar och kör allt genom?

Jag har Facefusion installerat på datorn som jag kör lokalt för tillfället. Om jag installerar Pinokio så ser jag på videos att jag kan starta Facefusion via pinokio, men är det allt?

Citera

2025-04-19, 14:29 #4

Medlem

Reg: Apr 2008

Inlägg: 15 396

Citat:

Ursprungligen postat av Monerokungen

Jag ska göra ett mobil spel. Och jag kan inte rita alla karaktärer för hand.

Om jag ber en vanlig AI göra en karaktär så går det bra! Men säger jag att han ska ta samma karaktär och vinkla huvudet så blir det helt fel.

Sen också en AI som kan göra bilden transparant? Eller att man väljer ut saker i bilden som ska vara transparant.

https://www.youtube.com/watch?v=GOFlKWI5GFs&list=PL5_f1Hy5l_azCtTYY46J4q7e IMNJnPRII&index=6

Ta tex detta spelet. Det börjar med att han står i profil och visar sitt ansikte. När steg får han en lavett och har huvudet åt höger med ett handavtryck i ansiktet.

Nästa bild är likadan bild fast åt andra hållet.

Jag har försökt väldigt många AI nu men ingen får det att funka.

Resultat blir såhär https://postimg.cc/8f4dqs8V Profil
https://postimg.cc/XBLhQVQr Efter en smäll.

Alltså inte en samma karaktär. Och jag har försökt 100 tals gånger och skriva på alla olika sätt. Det funkar inte. Eller MÅSTE jag göra allt för hand?

Photoshop eller Affiny Photo. Du kommer aldrig klara dig med endast Ai, du kommer alltid behöva finlira bilderna.

Citera

2025-04-19, 14:53 #5

Medlem

Reg: Aug 2011

Inlägg: 2 049

Citat:

Ursprungligen postat av SchrodingersPizza

Det kommer att vara i stort set omöjligt att göra bara med prompter. Du måste använda ett system där du kan ha en ursprungsbild med tillsammans med prompten, som dessutom är gjort för att hantera det på rätt sätt.

Kanske ChatGPT 4o klarar av det efter dom senaste uppdateringarna, men personligen hade jag kört det lokalt genom att köra Flux i Forge via Pinokio, så har man ett riktigt kraftfullt verktyg man har kontroll över, och kan enkelt lägga till LORAs, för mer kontroll, som man vill. Antingen färdiga från tex CivitAI eller som man skapat själv, med tex Fluxgym.

Gjorde ett snabb test med ChatGPT som blev rätt ok, men man har mer kontroll i Flux, speciellt med rätt LORA:
https://postimg.cc/9wqKN2j7
https://postimg.cc/VdQVL38K
https://postimg.cc/8jSZVMR3

Jag är också ute efter att betinga modellen med bilder, typ lära den nya koncept á la textual inversion. ChatGPT:s nya bildgenerering klarar det galant, men finns inget REST API än. Har du förslag på tutorials för verktygen du rekommenderar?

Citera

2025-04-19, 14:55 #6

Medlem

Reg: Feb 2022

Inlägg: 557

Citat:

Ursprungligen postat av CombatPig

Vad är Pinokio egentligen? Är det som en sorts central för allt man har installerat och som man sen startar och kör allt genom?

Jag har Facefusion installerat på datorn som jag kör lokalt för tillfället. Om jag installerar Pinokio så ser jag på videos att jag kan starta Facefusion via pinokio, men är det allt?

Pinokio är ett enkelt sätt att installera olika typer av serverapplikationer, som även håller dom i separata miljöer. Facefusion är bara en av många applikationer som finns tillgängliga i Pinokio, och det kommer fler hela tiden.

https://pinokio.computer/

Har mest kört Flux i Forge genom Pinokio, men även installerat en massa andra, tex WAN 2.1, DiffRhythm, Fooocus, MMAudio, Finegrain Image Enhancer mfl. Och just nu sitter jag och testar FramePack för video generering.

Citera

2025-04-19, 14:58 #7

Medlem

Reg: Feb 2022

Inlägg: 557

Citat:

Ursprungligen postat av trickydick

Photoshop eller Affiny Photo. Du kommer aldrig klara dig med endast Ai, du kommer alltid behöva finlira bilderna.

Man kan visst lösa det med bara AI, det handlar om att använda rätt verktyg på rätt sätt. Men ska man ha det riktigt bra så tar det rätt mycket tid att få igång systemet, och man får lägga ner en hel del arbete på att skapa LORAs för sina modeller.

Citera

2025-04-19, 14:58 #8

Medlem

Reg: Feb 2022

Inlägg: 557

Citat:

Ursprungligen postat av kaerakel

Jag är också ute efter att betinga modellen med bilder, typ lära den nya koncept á la textual inversion. ChatGPT:s nya bildgenerering klarar det galant, men finns inget REST API än. Har du förslag på tutorials för verktygen du rekommenderar?

Finns hur mycket som helst. Sök runt lite. Finns tex massor med videos på YouTube om hur olika saker fungerar.

Citera

2025-04-19, 15:37 #9

Medlem

Reg: Aug 2011

Inlägg: 2 049

Citat:

Ursprungligen postat av SchrodingersPizza

Finns hur mycket som helst. Sök runt lite. Finns tex massor med videos på YouTube om hur olika saker fungerar.

Att det finns hur mycket som helst är en del av problemet. 9 av 10 AI-verktyg jag provat är hönsgödsel

förslag mottages varmt.

Citera

2025-04-19, 15:47 #10

Medlem

Reg: Feb 2022

Inlägg: 557

Citat:

Ursprungligen postat av kaerakel

Att det finns hur mycket som helst är en del av problemet. 9 av 10 AI-verktyg jag provat är hönsgödsel

förslag mottages varmt.

Om du har tillräckligt med datorkraft lokalt, så förklara i detalj vad du vill göra, så ska jag försöka peka dig i rätt riktning.

Om du behöver köra det online, så har jag i stort sett bara koll på OpenAIs system. Jag föredrar att köra mina AI lokalt, men kräver en del, beroende på vad man vill göra.

Citera

2025-04-19, 16:30 #11

Avslutad

Kör du mac så skulle du kunna använda Sogni med ControlNet för att kunna rita själv. Den körs lokalt på din egen hårdvara om du har en lite nyare dator eller iphone/ipad med apple soc.

De verkar också ha nån browserbaserad variant men det är inget jag testat personligen, det riktiga programmet fungerar dock utmärkt.

https://www.sogni.ai/

-foul

Citera

2025-04-19, 16:42 #12

Medlem

Reg: Aug 2011

Inlägg: 2 049

Citat:

Ursprungligen postat av SchrodingersPizza

Om du har tillräckligt med datorkraft lokalt, så förklara i detalj vad du vill göra, så ska jag försöka peka dig i rätt riktning.

Om du behöver köra det online, så har jag i stort sett bara koll på OpenAIs system. Jag föredrar att köra mina AI lokalt, men kräver en del, beroende på vad man vill göra.

Ute efter att ladda upp minst två bilder, tänk en scen och en karaktär, och få karaktären i scenen. I ChatGPT fungerar det med upp till ~3-4 karaktärer + en scen. Har ändå rätt bra koll på AI-spacet, men hur dom lyckats med det där vettefan. Finns det något motsvarande Open Source eller tjänst?

Citera

Ai som hjälper till att fixa bilder

Skapa ett konto eller logga in för att kommentera

Skapa ett konto

Logga in