2025-04-18, 11:41
  #1
Avstängd
Monerokungens avatar
Jag ska göra ett mobil spel. Och jag kan inte rita alla karaktärer för hand.

Om jag ber en vanlig AI göra en karaktär så går det bra! Men säger jag att han ska ta samma karaktär och vinkla huvudet så blir det helt fel.

Sen också en AI som kan göra bilden transparant? Eller att man väljer ut saker i bilden som ska vara transparant.

https://www.youtube.com/watch?v=GOFlKWI5GFs&list=PL5_f1Hy5l_azCtTYY46J4q7e IMNJnPRII&index=6


Ta tex detta spelet. Det börjar med att han står i profil och visar sitt ansikte. När steg får han en lavett och har huvudet åt höger med ett handavtryck i ansiktet.

Nästa bild är likadan bild fast åt andra hållet.

Jag har försökt väldigt många AI nu men ingen får det att funka.

Resultat blir såhär https://postimg.cc/8f4dqs8V Profil
https://postimg.cc/XBLhQVQr Efter en smäll.

Alltså inte en samma karaktär. Och jag har försökt 100 tals gånger och skriva på alla olika sätt. Det funkar inte. Eller MÅSTE jag göra allt för hand?
__________________
Senast redigerad av Monerokungen 2025-04-18 kl. 11:43.
Citera
2025-04-18, 14:33
  #2
Medlem
SchrodingersPizzas avatar
Det kommer att vara i stort set omöjligt att göra bara med prompter. Du måste använda ett system där du kan ha en ursprungsbild med tillsammans med prompten, som dessutom är gjort för att hantera det på rätt sätt.

Kanske ChatGPT 4o klarar av det efter dom senaste uppdateringarna, men personligen hade jag kört det lokalt genom att köra Flux i Forge via Pinokio, så har man ett riktigt kraftfullt verktyg man har kontroll över, och kan enkelt lägga till LORAs, för mer kontroll, som man vill. Antingen färdiga från tex CivitAI eller som man skapat själv, med tex Fluxgym.

Gjorde ett snabb test med ChatGPT som blev rätt ok, men man har mer kontroll i Flux, speciellt med rätt LORA:
https://postimg.cc/9wqKN2j7
https://postimg.cc/VdQVL38K
https://postimg.cc/8jSZVMR3
__________________
Senast redigerad av SchrodingersPizza 2025-04-18 kl. 15:26.
Citera
2025-04-19, 14:24
  #3
Medlem
CombatPigs avatar
Citat:
Ursprungligen postat av SchrodingersPizza
Det kommer att vara i stort set omöjligt att göra bara med prompter. Du måste använda ett system där du kan ha en ursprungsbild med tillsammans med prompten, som dessutom är gjort för att hantera det på rätt sätt.

Kanske ChatGPT 4o klarar av det efter dom senaste uppdateringarna, men personligen hade jag kört det lokalt genom att köra Flux i Forge via Pinokio, så har man ett riktigt kraftfullt verktyg man har kontroll över, och kan enkelt lägga till LORAs, för mer kontroll, som man vill. Antingen färdiga från tex CivitAI eller som man skapat själv, med tex Fluxgym.

Gjorde ett snabb test med ChatGPT som blev rätt ok, men man har mer kontroll i Flux, speciellt med rätt LORA:
https://postimg.cc/9wqKN2j7
https://postimg.cc/VdQVL38K
https://postimg.cc/8jSZVMR3
Vad är Pinokio egentligen? Är det som en sorts central för allt man har installerat och som man sen startar och kör allt genom?

Jag har Facefusion installerat på datorn som jag kör lokalt för tillfället. Om jag installerar Pinokio så ser jag på videos att jag kan starta Facefusion via pinokio, men är det allt?
Citera
2025-04-19, 14:29
  #4
Medlem
trickydicks avatar
Citat:
Ursprungligen postat av Monerokungen
Jag ska göra ett mobil spel. Och jag kan inte rita alla karaktärer för hand.

Om jag ber en vanlig AI göra en karaktär så går det bra! Men säger jag att han ska ta samma karaktär och vinkla huvudet så blir det helt fel.

Sen också en AI som kan göra bilden transparant? Eller att man väljer ut saker i bilden som ska vara transparant.

https://www.youtube.com/watch?v=GOFlKWI5GFs&list=PL5_f1Hy5l_azCtTYY46J4q7e IMNJnPRII&index=6


Ta tex detta spelet. Det börjar med att han står i profil och visar sitt ansikte. När steg får han en lavett och har huvudet åt höger med ett handavtryck i ansiktet.

Nästa bild är likadan bild fast åt andra hållet.

Jag har försökt väldigt många AI nu men ingen får det att funka.

Resultat blir såhär https://postimg.cc/8f4dqs8V Profil
https://postimg.cc/XBLhQVQr Efter en smäll.

Alltså inte en samma karaktär. Och jag har försökt 100 tals gånger och skriva på alla olika sätt. Det funkar inte. Eller MÅSTE jag göra allt för hand?

Photoshop eller Affiny Photo. Du kommer aldrig klara dig med endast Ai, du kommer alltid behöva finlira bilderna.
Citera
2025-04-19, 14:53
  #5
Medlem
kaerakels avatar
Citat:
Ursprungligen postat av SchrodingersPizza
Det kommer att vara i stort set omöjligt att göra bara med prompter. Du måste använda ett system där du kan ha en ursprungsbild med tillsammans med prompten, som dessutom är gjort för att hantera det på rätt sätt.

Kanske ChatGPT 4o klarar av det efter dom senaste uppdateringarna, men personligen hade jag kört det lokalt genom att köra Flux i Forge via Pinokio, så har man ett riktigt kraftfullt verktyg man har kontroll över, och kan enkelt lägga till LORAs, för mer kontroll, som man vill. Antingen färdiga från tex CivitAI eller som man skapat själv, med tex Fluxgym.

Gjorde ett snabb test med ChatGPT som blev rätt ok, men man har mer kontroll i Flux, speciellt med rätt LORA:
https://postimg.cc/9wqKN2j7
https://postimg.cc/VdQVL38K
https://postimg.cc/8jSZVMR3


Jag är också ute efter att betinga modellen med bilder, typ lära den nya koncept á la textual inversion. ChatGPT:s nya bildgenerering klarar det galant, men finns inget REST API än. Har du förslag på tutorials för verktygen du rekommenderar?
Citera
2025-04-19, 14:55
  #6
Medlem
SchrodingersPizzas avatar
Citat:
Ursprungligen postat av CombatPig
Vad är Pinokio egentligen? Är det som en sorts central för allt man har installerat och som man sen startar och kör allt genom?

Jag har Facefusion installerat på datorn som jag kör lokalt för tillfället. Om jag installerar Pinokio så ser jag på videos att jag kan starta Facefusion via pinokio, men är det allt?

Pinokio är ett enkelt sätt att installera olika typer av serverapplikationer, som även håller dom i separata miljöer. Facefusion är bara en av många applikationer som finns tillgängliga i Pinokio, och det kommer fler hela tiden.

https://pinokio.computer/

Har mest kört Flux i Forge genom Pinokio, men även installerat en massa andra, tex WAN 2.1, DiffRhythm, Fooocus, MMAudio, Finegrain Image Enhancer mfl. Och just nu sitter jag och testar FramePack för video generering.
Citera
2025-04-19, 14:58
  #7
Medlem
SchrodingersPizzas avatar
Citat:
Ursprungligen postat av trickydick
Photoshop eller Affiny Photo. Du kommer aldrig klara dig med endast Ai, du kommer alltid behöva finlira bilderna.

Man kan visst lösa det med bara AI, det handlar om att använda rätt verktyg på rätt sätt. Men ska man ha det riktigt bra så tar det rätt mycket tid att få igång systemet, och man får lägga ner en hel del arbete på att skapa LORAs för sina modeller.
Citera
2025-04-19, 14:58
  #8
Medlem
SchrodingersPizzas avatar
Citat:
Ursprungligen postat av kaerakel
Jag är också ute efter att betinga modellen med bilder, typ lära den nya koncept á la textual inversion. ChatGPT:s nya bildgenerering klarar det galant, men finns inget REST API än. Har du förslag på tutorials för verktygen du rekommenderar?

Finns hur mycket som helst. Sök runt lite. Finns tex massor med videos på YouTube om hur olika saker fungerar.
Citera
2025-04-19, 15:37
  #9
Medlem
kaerakels avatar
Citat:
Ursprungligen postat av SchrodingersPizza
Finns hur mycket som helst. Sök runt lite. Finns tex massor med videos på YouTube om hur olika saker fungerar.

Att det finns hur mycket som helst är en del av problemet. 9 av 10 AI-verktyg jag provat är hönsgödsel förslag mottages varmt.
Citera
2025-04-19, 15:47
  #10
Medlem
SchrodingersPizzas avatar
Citat:
Ursprungligen postat av kaerakel
Att det finns hur mycket som helst är en del av problemet. 9 av 10 AI-verktyg jag provat är hönsgödsel förslag mottages varmt.

Om du har tillräckligt med datorkraft lokalt, så förklara i detalj vad du vill göra, så ska jag försöka peka dig i rätt riktning.

Om du behöver köra det online, så har jag i stort sett bara koll på OpenAIs system. Jag föredrar att köra mina AI lokalt, men kräver en del, beroende på vad man vill göra.
Citera
2025-04-19, 16:30
  #11
Avslutad
Kör du mac så skulle du kunna använda Sogni med ControlNet för att kunna rita själv. Den körs lokalt på din egen hårdvara om du har en lite nyare dator eller iphone/ipad med apple soc.

De verkar också ha nån browserbaserad variant men det är inget jag testat personligen, det riktiga programmet fungerar dock utmärkt.

https://www.sogni.ai/

-foul
Citera
2025-04-19, 16:42
  #12
Medlem
kaerakels avatar
Citat:
Ursprungligen postat av SchrodingersPizza
Om du har tillräckligt med datorkraft lokalt, så förklara i detalj vad du vill göra, så ska jag försöka peka dig i rätt riktning.

Om du behöver köra det online, så har jag i stort sett bara koll på OpenAIs system. Jag föredrar att köra mina AI lokalt, men kräver en del, beroende på vad man vill göra.

Ute efter att ladda upp minst två bilder, tänk en scen och en karaktär, och få karaktären i scenen. I ChatGPT fungerar det med upp till ~3-4 karaktärer + en scen. Har ändå rätt bra koll på AI-spacet, men hur dom lyckats med det där vettefan. Finns det något motsvarande Open Source eller tjänst?
Citera
  • 1
  • 2

Skapa ett konto eller logga in för att kommentera

Du måste vara medlem för att kunna kommentera

Skapa ett konto

Det är enkelt att registrera ett nytt konto

Bli medlem

Logga in

Har du redan ett konto? Logga in här

Logga in