Fick ide om en app som borde finnas, men som inte gör det så testade att vibekoda den, dvs jag skriver inte en rad kod själv, utan låter AI gör allt arbete åt mig. Och det fungerade faktiskt ganska hyggligt. AI tog mig från idé till färdigt projekt, så låt mig förklara vad min ide var och vad som nu fungerar:
Ide
En app som lyssnar av vad som sägs i ett rum, ett samtal eller i ett möte samt läser inkommande mejl och mejltrådar. Sorterar ut all information och lägger in den i en eller flera av följande:
Kalender
Att-göra-lista
Mötesanteckningar
Minnesanteckningar
Det som skiljer appen från en vanlig röstassistent är att den förstår sammanhanget bättre. Jag behöver inte säga "Lägg in ett möte i kalendern på fredag klockan 13 med Johan och Pelle om resan och fråga om de bokat biljetter", utan även meningar som "Fan! Har vi bokat biljetter!? Måste snacka med Johan och Pelle senast på fredag!". Då kollar AIn efter lediga tider på fredag och lägger in ett event i kalendern med all info. Då den även har minne kan den hämta tidigare info och ge mig feedback i en info-ruta av typen: Du var osäker på om Pelle och Johan hade bokat biljetter, men det har de skrivit till dig att de gjort i mejlet den 19 oktober. Du kan läsa mejlet här. Vill du radera mötet med dem på fredag?". I en annan informationruta visas vad som jag borde göra idag utifrån hur kalender och todo-listans ser ut.
Den använder OpenAI Whisper för att hantera transkibering och gpt-oss-20b som AI för tolka transkiberingen, sortera informationen och lägga in den på rätt ställe. Qwen3-VL-4B-Thinking används för att tolka bilder och om jag laddar upp en dokument konverteras det automatiskt till ett format som Qwen kan tolka. Skitbra när man sitter på ett möte med en dagordning, då blir innehåller så mycket bättre när man bifogar den. Ibland blir det dock fel, och då rättar en agent (också gpt-oss-20b) till det och i 99 procent av fallen funkar det.
Det enda problemet är ju egentligen att appen är seg. När jag suttit ett 1-timmes-möte och den ska transkibera och tolka all information kan det ta 20-40 minuter innan den är färdig.
Det jag tänkte vi kan diskutera är ju om VibeCoding börjar bli tillräckligt bra för att faktiskt vara användbart?
Ide
En app som lyssnar av vad som sägs i ett rum, ett samtal eller i ett möte samt läser inkommande mejl och mejltrådar. Sorterar ut all information och lägger in den i en eller flera av följande:
Kalender
Att-göra-lista
Mötesanteckningar
Minnesanteckningar
Det som skiljer appen från en vanlig röstassistent är att den förstår sammanhanget bättre. Jag behöver inte säga "Lägg in ett möte i kalendern på fredag klockan 13 med Johan och Pelle om resan och fråga om de bokat biljetter", utan även meningar som "Fan! Har vi bokat biljetter!? Måste snacka med Johan och Pelle senast på fredag!". Då kollar AIn efter lediga tider på fredag och lägger in ett event i kalendern med all info. Då den även har minne kan den hämta tidigare info och ge mig feedback i en info-ruta av typen: Du var osäker på om Pelle och Johan hade bokat biljetter, men det har de skrivit till dig att de gjort i mejlet den 19 oktober. Du kan läsa mejlet här. Vill du radera mötet med dem på fredag?". I en annan informationruta visas vad som jag borde göra idag utifrån hur kalender och todo-listans ser ut.
Den använder OpenAI Whisper för att hantera transkibering och gpt-oss-20b som AI för tolka transkiberingen, sortera informationen och lägga in den på rätt ställe. Qwen3-VL-4B-Thinking används för att tolka bilder och om jag laddar upp en dokument konverteras det automatiskt till ett format som Qwen kan tolka. Skitbra när man sitter på ett möte med en dagordning, då blir innehåller så mycket bättre när man bifogar den. Ibland blir det dock fel, och då rättar en agent (också gpt-oss-20b) till det och i 99 procent av fallen funkar det.
Det enda problemet är ju egentligen att appen är seg. När jag suttit ett 1-timmes-möte och den ska transkibera och tolka all information kan det ta 20-40 minuter innan den är färdig.
Det jag tänkte vi kan diskutera är ju om VibeCoding börjar bli tillräckligt bra för att faktiskt vara användbart?