2025-11-18, 11:58
  #1
Medlem
Fick ide om en app som borde finnas, men som inte gör det så testade att vibekoda den, dvs jag skriver inte en rad kod själv, utan låter AI gör allt arbete åt mig. Och det fungerade faktiskt ganska hyggligt. AI tog mig från idé till färdigt projekt, så låt mig förklara vad min ide var och vad som nu fungerar:

Ide
En app som lyssnar av vad som sägs i ett rum, ett samtal eller i ett möte samt läser inkommande mejl och mejltrådar. Sorterar ut all information och lägger in den i en eller flera av följande:
Kalender
Att-göra-lista
Mötesanteckningar
Minnesanteckningar

Det som skiljer appen från en vanlig röstassistent är att den förstår sammanhanget bättre. Jag behöver inte säga "Lägg in ett möte i kalendern på fredag klockan 13 med Johan och Pelle om resan och fråga om de bokat biljetter", utan även meningar som "Fan! Har vi bokat biljetter!? Måste snacka med Johan och Pelle senast på fredag!". Då kollar AIn efter lediga tider på fredag och lägger in ett event i kalendern med all info. Då den även har minne kan den hämta tidigare info och ge mig feedback i en info-ruta av typen: Du var osäker på om Pelle och Johan hade bokat biljetter, men det har de skrivit till dig att de gjort i mejlet den 19 oktober. Du kan läsa mejlet här. Vill du radera mötet med dem på fredag?". I en annan informationruta visas vad som jag borde göra idag utifrån hur kalender och todo-listans ser ut.

Den använder OpenAI Whisper för att hantera transkibering och gpt-oss-20b som AI för tolka transkiberingen, sortera informationen och lägga in den på rätt ställe. Qwen3-VL-4B-Thinking används för att tolka bilder och om jag laddar upp en dokument konverteras det automatiskt till ett format som Qwen kan tolka. Skitbra när man sitter på ett möte med en dagordning, då blir innehåller så mycket bättre när man bifogar den. Ibland blir det dock fel, och då rättar en agent (också gpt-oss-20b) till det och i 99 procent av fallen funkar det.

Det enda problemet är ju egentligen att appen är seg. När jag suttit ett 1-timmes-möte och den ska transkibera och tolka all information kan det ta 20-40 minuter innan den är färdig.

Det jag tänkte vi kan diskutera är ju om VibeCoding börjar bli tillräckligt bra för att faktiskt vara användbart?
Citera
2025-11-18, 12:29
  #2
Medlem
kalkryggars avatar
Rent generellt: Nej det är det inte och kommer inte vara på länge.

Då talar jag om allt som man vill skapa. Simpelt trams finns det redan färdiga kodbaser att ladda ner och köra. Du behöver inte koda det alls. Vissa saker behöver du pilla med att ta en kodbas och sätta ihop det med en annan kodbas etc.

Men att göra vettiga saker och få det att bli som du eller en kund verkligen vill ha det kommer inte att vara möjligt på många år för de som inte kan programmera alls.
Citera
2025-11-18, 12:54
  #3
Medlem
Citat:
Ursprungligen postat av LegendenX
En app som lyssnar av vad som sägs i ett rum, ett samtal eller i ett möte samt läser inkommande mejl och mejltrådar. Sorterar ut all information och lägger in den i en eller flera av följande:

Konkurrens är bra för varianter av den lösningen används lite överallt. Exempelvis tror jag många privata vårdgivare idag sätter på micken när patient frågas ut, AI lyssnar då på patienten och efter besöket genererar AI en sammanfattning om vad som sagts.

Lösningar för att sortera verbal information liksom text tror jag det ganska snart dräller av
Citera
2025-11-18, 12:55
  #4
Medlem
Citat:
Ursprungligen postat av kalkryggar
Rent generellt: Nej det är det inte och kommer inte vara på länge.

Då talar jag om allt som man vill skapa. Simpelt trams finns det redan färdiga kodbaser att ladda ner och köra. Du behöver inte koda det alls. Vissa saker behöver du pilla med att ta en kodbas och sätta ihop det med en annan kodbas etc.

Men att göra vettiga saker och få det att bli som du eller en kund verkligen vill ha det kommer inte att vara möjligt på många år för de som inte kan programmera alls.

Jo men uppenbart går det att skapa en app som för några år sedan hade varit extremt komplex att utveckla, men som nu helt går att koda och skräddarsy efter egna behov och preferenser tack vare AI. Kan mycket väl vara så att ännu större full-stack appar kommer vara utmanade för AI några år till pga context-window/begränsat minne, men nästan varje månad görs ju små framsteg. Gemini 3 kan släppas närmsta timmarna eller dagarna. Får väl se vad den kan bidra med, men samtidigt blir den "bäst" när den släpps, och nästa månad kommer något annat som intar topp-listan.
Citera
2025-11-18, 13:14
  #5
Medlem
Citat:
Ursprungligen postat av -dev
Konkurrens är bra för varianter av den lösningen används lite överallt. Exempelvis tror jag många privata vårdgivare idag sätter på micken när patient frågas ut, AI lyssnar då på patienten och efter besöket genererar AI en sammanfattning om vad som sagts.

Lösningar för att sortera verbal information liksom text tror jag det ganska snart dräller av

Ja det är ju just det som jag tycker är lite konstigt att det inte redan finns mer av. Det är ju ganska gott om olika assistenter/appar som kan sammanfatta texter och samtal, men att sedan sortera denna information och se till att allt hamnar på rätt ställe verkar inte vara något som finns vad jag har kunna hitta, vilket är konstigt.
Citera
2025-11-18, 13:19
  #6
Medlem
Finns säkert 1000st redan, allt du gjort är en AI wrapper till chatgpt
Citera
2025-11-18, 13:31
  #7
Medlem
Citat:
Ursprungligen postat av HeltVild
Finns säkert 1000st redan, allt du gjort är en AI wrapper till chatgpt

Nej det gör det faktiskt inte, men om du kan hitta 3 exempel på projekt som gör på samma eller liknande sätt får du gärna skicka länkarna.
Citera
2025-11-18, 13:33
  #8
Medlem
Citat:
Ursprungligen postat av kalkryggar
Rent generellt: Nej det är det inte och kommer inte vara på länge.

Då talar jag om allt som man vill skapa. Simpelt trams finns det redan färdiga kodbaser att ladda ner och köra. Du behöver inte koda det alls. Vissa saker behöver du pilla med att ta en kodbas och sätta ihop det med en annan kodbas etc.

Men att göra vettiga saker och få det att bli som du eller en kund verkligen vill ha det kommer inte att vara möjligt på många år för de som inte kan programmera alls.

Kan du ge exempel på vad den har gjort dåligt, som inte är simpelt trams?

Tvärtom tycker jag AI-genering av kod är särskilt bra på mer algoritmiska saker. Därför att den är tränad på avancerade uppgifter i programmeringstävlingar och läroböcker. T.ex. använde jag den för att göra ett par applikationer som konverterade från ett specifikt filformat till ett antal json-filer enligt en massa regler och jobbade mot en RDF-databas. Men jag måste veta exakt vad jag vill ha. Genom att steg för steg speca allt fler regler, och ge allt fler exempel på önskad in- och utdata, så fixade den det till slut. Resultatet innefattar bl.a. massor av regexp-uttryck, vilket även om jag tycker att jag behärskar det så tar det mycket längre tid för mig än AI:n att skapa uttrycken, och jag gör ofta misstag. Det är en god vana att be den att alltid lägga in kommenterar som summera vad regexp-uttryck gör, och annan svårtolkad kod, vilket minskar risken att jag gör misstag när jag är inne och petar i koden själv.

Den är också bra på att generera ett helt nytt användargränssnitt från scratch. Men den är dålig på att stuva om i ett befintligt gui. Det kan bli en soppa. Och överhuvudtaget är den dålig på att göra ändringar i stora kodbaser som kräver att den ändrar i många klasser/funktioner/filer.

Vibe coding betyder egentligen att man jobbar ostrukturerat och oplanerat. Det är ett dumt namn. Även vid AI-generering behöver man planera arbetet, systematiskt beskriva vad man vill ha, ge konkreta exempel på in- och utdata, testa och verifiera allt.

Om jag ber den refaktorisera koden så att kodupprepning minskas så delar den upp den i funktioner och klasser så att strukturen känns mer proffsig. Kodningsstilen följer etablerad praxis medan min egen kod (jag är inte proffs) känns mer hemmagjord. Jag har bett den beskriva den kodningsstil som används i ett exempelprogram och följa den stilen. T.ex. principer för namngivning, och vilka bibliotek den bör använda.

Problemet är att vid refaktorisering gjorde den så många förändringar att jag inte kunde bevaka allt den ändrade på. Och tog ibland bort funktionalitet som redan var implementerad, och ibland dröjde det innan jag upptäckte det. Livsfarligt. Men det finns en lösning. Vissa AI-verktyg, t.ex. Claude Code, verkar vara bra på att automatiskt generera unit testing om man ber den, t.ex. utifrån mina regler och exempel på in- och utdata, eller utifrån en tidigare version av kodbasen. Därmed får koden en högre kvalitet och raderad funktionalitet kan upptäckas och oftast åtgärdas av verktyget självt!

Dock har AI inte effektiviserat arbetet mycket för proffs. En AI-assisterad utvecklare är lika effektiv som 1,25 icke AI-assisterade utvecklare enligt en studie nu i juni. Jag tror att problemet är att många får allt sämre förståelse för sin egen kod. Om den då gör ett fel som den inte själv lyckas fixa kan det ta extra lång tid att manuellt åtgärda det.
__________________
Senast redigerad av guru1966 2025-11-18 kl. 14:06.
Citera
2025-11-18, 13:46
  #9
Medlem
Citat:
Ursprungligen postat av -dev
Exempelvis tror jag många privata vårdgivare idag sätter på micken när patient frågas ut, AI lyssnar då på patienten och efter besöket genererar AI en sammanfattning om vad som sagts.

Var har du sett detta?
Citera
2025-11-18, 13:52
  #10
Medlem
neomunaas avatar
Du menar google home och amazon alexa? Iom du kör en lokal lösning så antar jag du menar att folk ska köra detta med egen hårdvara från ett homelab? Har du redan kunskapen hur du sätter upp ett homelab så vet du säkert hur man återskapar ditt koncept. Ditt koncept är varken nytt, unikt eller säljbart förrens du gjort det till en saas med logistik, säkerhet, inference och allt det klart redan.

"Exempelvis tror jag många privata vårdgivare idag sätter på micken när patient frågas ut, AI lyssnar då på patienten och efter besöket genererar AI en sammanfattning om vad som sagts."

Finns redan som produkt med hårdvara o allting klart. Sök på "note taking AI" eller liknande. Tror heller det inte är bra med exempel som ditt när en hallucinerande LLM AI måste hållas som juridiskt ansvarig person när det blir fel och fara för patienten.

https://www.plaud.ai/
__________________
Senast redigerad av neomunaa 2025-11-18 kl. 14:02.
Citera
2025-11-18, 14:14
  #11
Medlem
Citat:
Ursprungligen postat av neomunaa
Du menar google home och amazon alexa? Iom du kör en lokal lösning så antar jag du menar att folk ska köra detta med egen hårdvara från ett homelab? Har du redan kunskapen hur du sätter upp ett homelab så vet du säkert hur man återskapar ditt koncept. Ditt koncept är varken nytt, unikt eller säljbart förrens du gjort det till en saas med logistik, säkerhet, inference och allt det klart redan.

"Exempelvis tror jag många privata vårdgivare idag sätter på micken när patient frågas ut, AI lyssnar då på patienten och efter besöket genererar AI en sammanfattning om vad som sagts."

Finns redan som produkt med hårdvara o allting klart. Sök på "note taking AI" eller liknande. Tror heller det inte är bra med exempel som ditt när en hallucinerande LLM AI måste hållas som juridiskt ansvarig person när det blir fel och fara för patienten.

https://www.plaud.ai/

Det finns dock en stor skillnad mellan min app och röstassistenter som Google Home, Alexa och liknande, och det är att förstå kontexten. Det är klart det går att be de flesta assistenter om att skicka ett mejl, eller svara på ett sms, men du måste oftast uttryckligen be dem om att utföra en specifik uppgift. Exempelvis "Boka in ett möte i kalendern datum X" osv. Min app är tänkt att faktiskt förstå kontexten och hantera ens planering autonomt vilket den skter ganska fint.

Jag kan sitta på ett möte en timme, spela in mötet, bifoga dagordningen för kontext, och min app upprättar minnesanteckningar för varje punkt, om något tas upp under mötet förs det inte i att-göra-listan eller kalendern utan att jag behöver säga till den. Just denna typ av sömlös autonomi har jag aldrig tidigare sätt prov på i någon röstassisten även om det högst sannolikt kommer finnas mycket snart.

Då är ju samtidigt problemet att du måste överlämna all information till kommersiella företag, vilket jag inte är så sugen på. Med den här lösningen lämnar aldrig informationen datorn.


Kollade även in Plaud som du länkade till, men det enda den verkar göra är att spela in ljud som den sedan transkiberar och summerar, samtidigt som den saknar hela den autonoma biten med att sortera information till rätt plats vilket enligt mig är styrkan i min app.
__________________
Senast redigerad av LegendenX 2025-11-18 kl. 14:33.
Citera
2025-11-18, 14:33
  #12
Medlem
Klassiskt vibe kodare.

Övertro på sig själv och AI:t. Ingen förståelse för att ett riktigt projekt är mer än en halvt fungerande front end. En prototyp är inte en färdig produkt vare sig den är gjord av AI eller en människa. Också klassiskt att tro "asså vem som helt kan bygga en app nuförtiden man bara frågar AI" och sedan tror att man på riktigt byggt en fungerande lanserbar app bara för någonting dyker upp på skärmen.

Du har förmodligen byggt något riktigt skit som ingen vill ha eller vidareutveckla. Lär dig något på riktigt istället vare sig det är snickeri eller programmering. Det här blir inte en karriär för dig. Lägg tiden på något vettigt istället.
Citera
  • 1
  • 2

Skapa ett konto eller logga in för att kommentera

Du måste vara medlem för att kunna kommentera

Skapa ett konto

Det är enkelt att registrera ett nytt konto

Bli medlem

Logga in

Har du redan ett konto? Logga in här

Logga in