2026-05-18, 19:09
  #1
Medlem
Ett projekt/verktyg som gör hela Palmemordsutredningens digitala arkiv av förhör och utredningsmaterial sökbart mad hjälp av valfri AI (Claude, ChatGPT, Deepseek, eller lokal LLM). Arkivet innehåller ~3700 pdf:er från palmemordsarkivet och ~7100 filer från wpu.nu vilket blir ~47 000 sidor.

Perfekt om man vill söka i och ställa frågor mot materialet utan att behöva läsa in sig på allt.

Projektet är open source och finns här: https://github.com/paddan/palmemordsarkivet
Citera
2026-05-20, 03:11
  #2
Medlem
WetCigarettes avatar
Säkert jättebra men fullkomligt obegripligt för någon som inte håller på med datorer mycket hur man ska få det att fungera.

Ett exempel:
Citat:
Efter nedladdning, ocr-scanning så finns det ett web-gränssnitt som man kan ställa frågor om Palme-mordet i.

RAG (standard)

En fast pipeline: frågan embedas och matchas mot vektorindexet, de bästa utdragen rerankas, och de 6 mest relevanta skickas som kontext till AI som formulerar svaret med källhänvisningar. Snabbt och förutsägbart — passar enkla faktafrågor där ett söksteg räcker.
Vad är ocr-skanning, RAG, fast pipeline, en embedad fråga, ett vektorindex, att skicka som kontext?

Du behöver inte svara men som du ser blir det lätt obegripligt. Eller så ser du inte det för du är så van med dessa termer. Men vanligt folk fattar inte. Hade rekommenderat att göra en superenkel step by step, gärna med tillhörande bilder, på hur man använder det här. Om målet är att ”vanliga dödliga” ska kunna använda verktyget dvs.

Återigen säkert ett jättebra verktyg. Menar inte att klanka ner på arbetet du lagt.
Citera
2026-05-20, 13:27
  #3
Medlem
Vem har sagt att det är för vanligt folk
Citera
2026-05-20, 13:32
  #4
Medlem
Citat:
Ursprungligen postat av Zirquin
Ett projekt/verktyg som gör hela Palmemordsutredningens digitala arkiv av förhör och utredningsmaterial sökbart mad hjälp av valfri AI (Claude, ChatGPT, Deepseek, eller lokal LLM). Arkivet innehåller ~3700 pdf:er från palmemordsarkivet och ~7100 filer från wpu.nu vilket blir ~47 000 sidor.

Perfekt om man vill söka i och ställa frågor mot materialet utan att behöva läsa in sig på allt.

Projektet är open source och finns här: https://github.com/paddan/palmemordsarkivet

När du skriver ~7100 filer från wpu.nu, avser du då pdf+word+bild-filer etc?
Citera
2026-05-20, 13:48
  #5
Medlem
Har inte detaljgranskat vad jag får ner, men det är mycket dubletter i wpu.nu som kommer från palmemorsarkivet. Dubbletterna rensas bort vid processning av filerna.
Citera
2026-05-20, 14:17
  #6
Medlem
Citat:
Ursprungligen postat av Zirquin
Har inte detaljgranskat vad jag får ner, men det är mycket dubletter i wpu.nu som kommer från palmemorsarkivet. Dubbletterna rensas bort vid processning av filerna.

När en pdf laddas upp till wpu skapas en OCR-kopia som är redigerbar.

Min tanke är att du får s a s "dubbelt där".
Citera
2026-05-20, 15:54
  #7
Medlem
Om pdf:erna som laddas ner och processas redan innehåller ett text-lager så används det så länge som texten har bra kvalitet, om inte så ocr-skannas sidorna med dålig kvalitet om.
Citera
2026-05-20, 16:12
  #8
Medlem
Citat:
Ursprungligen postat av Zirquin
Om pdf:erna som laddas ner och processas redan innehåller ett text-lager så används det så länge som texten har bra kvalitet, om inte så ocr-skannas sidorna med dålig kvalitet om.

Tack, då förstår jag det. Mao, en kvalitativ förbättring.

Om ett uppslag har två "pdf"-maskningsvarianter, där unionen av omaskerad text ger mer information, hur hanterar processen det.

Edit: Jag uppskattar ditt initiativ. Själv har jag använt ChatGPT för att sammanfatta avgränsade komplexa skeenden avseende mänskliga beteenden som de framgår i uppslagen och med input från vad ChatGPT "hittar på nätet.

Din "metod" verkar vara heltäckande avseende Palmemordsarkivet & WPU vilket vidgar underlaget för analys av relevanta frågeställningar.
__________________
Senast redigerad av Utredaren 2026-05-20 kl. 16:35.
Citera
2026-05-20, 18:51
  #9
Medlem
MOPspanarens avatar
Citat:
Ursprungligen postat av Zirquin
Ett projekt/verktyg som gör hela Palmemordsutredningens digitala arkiv av förhör och utredningsmaterial sökbart mad hjälp av valfri AI (Claude, ChatGPT, Deepseek, eller lokal LLM). Arkivet innehåller ~3700 pdf:er från palmemordsarkivet och ~7100 filer från wpu.nu vilket blir ~47 000 sidor.

Perfekt om man vill söka i och ställa frågor mot materialet utan att behöva läsa in sig på allt.

Projektet är open source och finns här: https://github.com/paddan/palmemordsarkivet

Stiligt och innovativt!
Lite liknande "AINA" från dokumentären Palmemordets dolda spår kan jag tänka mig.
Citera
2026-05-21, 17:36
  #10
Medlem
MOPspanarens avatar
För den de som inte är så tekniskt kunniga kanske Googles NotebookLM kan vara ett alternativ.
- Ladda upp dokument (OCR:ade och sökbara PDF:er)
- Ställ frågor till AI
- - Be den sammanställa o.s.v.
Citera
2026-05-27, 23:14
  #11
Medlem
Flyttar repot till https://codeberg.org/paddan/palmemordsarkivet
Citera

Skapa ett konto eller logga in för att kommentera

Du måste vara medlem för att kunna kommentera

Skapa ett konto

Det är enkelt att registrera ett nytt konto

Bli medlem

Logga in

Har du redan ett konto? Logga in här

Logga in