Citat:
Ursprungligen postat av
distans
Java har nämnts lite i förbifarten..
Den som rekommenderar Java vet förmodligen inte vad den talar om.
Javascript och Java är inte samma sak. Två helt olika språk som inte har ett dugg med varandra att göra.
Citat:
Det handlar ju inte bara om att "köra sidor" utan att hämta och spara relevant information så enkelt som möjligt. JS behöver inte nödvändigtvis vara bäst på det senare.
Jo, javascript är bäst för detta.
Utan javascript så förlorar du data. Javascript är det enda språket som kan ta del av 100% av datan.
Det spelar ingen roll om det finns andra språk som kan spara data så enkelt som möjligt eftersom de inte klarar uppgiften att hämta datan till fullo.
Citat:
Kollar du på Github så är Python betydligt populärare än JS att använda för detta. Kanske inte bara Flashback som tänker galet med andra ord!
Då är det dåliga scrapers som endast kan parsa HTML. Finns säkert jättemånga dåliga scrapers, men det förändrar inte det faktum att de resulterar i en informationsförlust.
Hade jag fått välja vilket språk jag ville så skulle jag sagt Haskell eftersom parsingmöjligheterna är fantastiska och språket är i det närmsta perfektion, eller Python om man är amatör (annars det språk man känner sig bekväm i). Men detta är ingen smakfråga. Vill man scrapa på webben så är det javascript som gäller, inget annat.
Dessutom så är Javascript och Python ungefär precis lika enkla (enligt mig).
TS:
Kör Javascript i Node. Sedan så använder du Googles egna "puppeteer".
Du kör nu en riktig webbläsare (Chrome) som kan hantera 100% av samma data som din webbläsare kan göra (för att det
är en webbläsare). Bättre scraping än verktyget webben är utvecklad för kan du omöjligen få.