Inom referenshantering fungerar det så, artiklar i PDF-format där metadata extraheras. Men för att det skall fungera så måste:
1. PDFerna vara i textformat, inte bilder, scannar man papperskopior så måste de köras genom OCR
2. Dokumenten måste vara strukturerade på något sätt, så att de liknar varandra, från artiklar är det lätt att plocka författare titel etc