Citat:
Ursprungligen postat av Luftfrikadelle
Laddade ner WinWget och så sparar man hemsidorna men hur gör jag för att extrahera bilderna som finns i filen? Filen har ingen ändelse.
WTF programmet verkar bara hämta .html och måste återladda hem allt material på sidan :sad44:
Kan inte hjälpa till med WinWget, har aldrig använt det. För wget däremot, finns det en hel del
färdiga exempel på webben och chansen är stor att hitta ett som passar in på det du vill göra. Det här borde annars vara ett fungerande sätt att ladda hem alla bilder från
http://blogg.passagen.se/ezmaralda/ inklusive eventuella undermappar, och det kanske t.o.m. kan fungera som nån slags jävla guide:
Från
Logging and Input File Options:
--no-verbose - Stäng av den enorma mängden onödiga meddelanden och rapportera bara om nedladdade filer och eventuella fel.
Från
Download Options:
-w 3 - Vänta 3 sekunder mellan varje filhämtning, för att vara snäll mot servern och undvika att bli bannad...
--random-wait - ...och slumpa den tiden lite varje gång, så att det inte märks att vi är ett program och inte en människa.
Från
Directory Options:
--no-directories - Samla alla filer i en och samma mapp; skapa inte en undermapp för t.ex.
http://blogg.passagen.se/ezmaralda/rokelse/. Om det leder till att filnamn krockar, döps filerna med .1, .2 osv i slutet av namnet.
Från
HTTP Options:
-U "" - Skicka ingen identifierings-information till webbservern, eftersom vissa spärrar wget. Alternativt, identifiera dig som någon av de vanliga webbläsarna, t.ex.
-U "Mozilla/5.0 (Windows NT 5.1; rv:15.0) Gecko/20100101 Firefox/15.0".
Från
Recursive Retrieval Options:
-r - Följ alla slags HTML- och CSS-länkar som finns på sidan (
http://blogg.passagen.se/ezmaralda/), följ alla länkar som finns i de dokumenten, osv... Det här är huvudswitchen för rekursiv nedladdning.
-l inf - Följ ett oändligt antal länkar om det behövs, istället för bara 5 nivåer som är standard.
Från
Recursive Accept/Reject Options:
-A bmp,gif,jpeg,jpg,png - Spara bara filer med de här ändelserna. Det är case sensitive, så *.BMP eller *.Jpg sparas inte.
-A "*.[Bb][Mm][Pp],*.[Gg][Ii][Ff],*.[Jj][Pp][Ee][Gg],*.[Jj][Pp][Gg],*.[Pp][Nn][Gg]" eller något liknande kanske fungerar för det.
--no-parent - Spara bara bilder under mappen ezmaralda, inte t.ex.
http://blogg.passagen.se/nyheter.gif eller något under
http://blogg.passagen.se/e-type/.
Sammanfatting, i kommandotolken:
Kod:
C:\Documents and Settings\Användarnamn\Skrivbord>cd C:\
C:\>mkdir ezmaralda-bilder
C:\>cd ezmaralda-bilder
C:\ezmaralda-bilder>wget --no-verbose -w 3 --random-wait --no-directories -U "" -r -l inf -A bmp,gif,jpeg,jpg,png --no-parent http://blogg.passagen.se/ezmaralda/
Resultatet (efter några minuter, jag avbröt innan det var klart):
http://troligen.se/ezmaralda.jpg
Med reservation för fel.