Palmemordsarkivet och wpu.nu - sökbart via AI

2026-05-18, 19:09 #1

Medlem

Reg: Maj 2026

Inlägg: 5

Ett projekt/verktyg som gör hela Palmemordsutredningens digitala arkiv av förhör och utredningsmaterial sökbart mad hjälp av valfri AI (Claude, ChatGPT, Deepseek, eller lokal LLM). Arkivet innehåller ~3700 pdf:er från palmemordsarkivet och ~7100 filer från wpu.nu vilket blir ~47 000 sidor.

Perfekt om man vill söka i och ställa frågor mot materialet utan att behöva läsa in sig på allt.

Projektet är open source och finns här: https://github.com/paddan/palmemordsarkivet

Citera

2026-05-20, 03:11 #2

Medlem

Reg: Nov 2022

Inlägg: 644

Säkert jättebra men fullkomligt obegripligt för någon som inte håller på med datorer mycket hur man ska få det att fungera.

Ett exempel:

Citat:

Efter nedladdning, ocr-scanning så finns det ett web-gränssnitt som man kan ställa frågor om Palme-mordet i.

RAG (standard)

En fast pipeline: frågan embedas och matchas mot vektorindexet, de bästa utdragen rerankas, och de 6 mest relevanta skickas som kontext till AI som formulerar svaret med källhänvisningar. Snabbt och förutsägbart — passar enkla faktafrågor där ett söksteg räcker.

Vad är ocr-skanning, RAG, fast pipeline, en embedad fråga, ett vektorindex, att skicka som kontext?

Du behöver inte svara men som du ser blir det lätt obegripligt. Eller så ser du inte det för du är så van med dessa termer. Men vanligt folk fattar inte. Hade rekommenderat att göra en superenkel step by step, gärna med tillhörande bilder, på hur man använder det här. Om målet är att ”vanliga dödliga” ska kunna använda verktyget dvs.

Återigen säkert ett jättebra verktyg. Menar inte att klanka ner på arbetet du lagt.

Citera

2026-05-20, 13:27 #3

Medlem

Reg: Maj 2026

Inlägg: 5

Vem har sagt att det är för vanligt folk

Citera

2026-05-20, 13:32 #4

Medlem

Reg: Jan 2008

Inlägg: 7 125

Citat:

Ursprungligen postat av Zirquin

Ett projekt/verktyg som gör hela Palmemordsutredningens digitala arkiv av förhör och utredningsmaterial sökbart mad hjälp av valfri AI (Claude, ChatGPT, Deepseek, eller lokal LLM). Arkivet innehåller ~3700 pdf:er från palmemordsarkivet och ~7100 filer från wpu.nu vilket blir ~47 000 sidor.

Perfekt om man vill söka i och ställa frågor mot materialet utan att behöva läsa in sig på allt.

Projektet är open source och finns här: https://github.com/paddan/palmemordsarkivet

När du skriver ~7100 filer från wpu.nu, avser du då pdf+word+bild-filer etc?

Citera

2026-05-20, 13:48 #5

Medlem

Reg: Maj 2026

Inlägg: 5

Har inte detaljgranskat vad jag får ner, men det är mycket dubletter i wpu.nu som kommer från palmemorsarkivet. Dubbletterna rensas bort vid processning av filerna.

Citera

2026-05-20, 14:17 #6

Medlem

Reg: Jan 2008

Inlägg: 7 125

Citat:

Ursprungligen postat av Zirquin

Har inte detaljgranskat vad jag får ner, men det är mycket dubletter i wpu.nu som kommer från palmemorsarkivet. Dubbletterna rensas bort vid processning av filerna.

När en pdf laddas upp till wpu skapas en OCR-kopia som är redigerbar.

Min tanke är att du får s a s "dubbelt där".

Citera

2026-05-20, 15:54 #7

Medlem

Reg: Maj 2026

Inlägg: 5

Om pdf:erna som laddas ner och processas redan innehåller ett text-lager så används det så länge som texten har bra kvalitet, om inte så ocr-skannas sidorna med dålig kvalitet om.

Citera

2026-05-20, 16:12 #8

Medlem

Reg: Jan 2008

Inlägg: 7 125

Citat:

Ursprungligen postat av Zirquin

Om pdf:erna som laddas ner och processas redan innehåller ett text-lager så används det så länge som texten har bra kvalitet, om inte så ocr-skannas sidorna med dålig kvalitet om.

Tack, då förstår jag det. Mao, en kvalitativ förbättring.

Om ett uppslag har två "pdf"-maskningsvarianter, där unionen av omaskerad text ger mer information, hur hanterar processen det.

Edit: Jag uppskattar ditt initiativ. Själv har jag använt ChatGPT för att sammanfatta avgränsade komplexa skeenden avseende mänskliga beteenden som de framgår i uppslagen och med input från vad ChatGPT "hittar på nätet.

Din "metod" verkar vara heltäckande avseende Palmemordsarkivet & WPU vilket vidgar underlaget för analys av relevanta frågeställningar.

__________________
Senast redigerad av Utredaren 2026-05-20 kl. 16:35.

Citera

2026-05-20, 18:51 #9

Medlem

Reg: Sep 2016

Inlägg: 7 109

Citat:

Ursprungligen postat av Zirquin

Ett projekt/verktyg som gör hela Palmemordsutredningens digitala arkiv av förhör och utredningsmaterial sökbart mad hjälp av valfri AI (Claude, ChatGPT, Deepseek, eller lokal LLM). Arkivet innehåller ~3700 pdf:er från palmemordsarkivet och ~7100 filer från wpu.nu vilket blir ~47 000 sidor.

Perfekt om man vill söka i och ställa frågor mot materialet utan att behöva läsa in sig på allt.

Projektet är open source och finns här: https://github.com/paddan/palmemordsarkivet

Stiligt och innovativt!
Lite liknande "AINA" från dokumentären Palmemordets dolda spår kan jag tänka mig.

Citera

2026-05-21, 17:36 #10

Medlem

Reg: Sep 2016

Inlägg: 7 109

För den de som inte är så tekniskt kunniga kanske Googles NotebookLM kan vara ett alternativ.
- Ladda upp dokument (OCR:ade och sökbara PDF:er)
- Ställ frågor till AI
- - Be den sammanställa o.s.v.

Citera

2026-05-27, 23:14 #11

Medlem

Reg: Maj 2026

Inlägg: 5

Flyttar repot till https://codeberg.org/paddan/palmemordsarkivet

Citera

Palmemordsarkivet och wpu.nu - sökbart via AI

Skapa ett konto eller logga in för att kommentera

Skapa ett konto

Logga in