Citat:
Ursprungligen postat av
Enterprise
Nja, det beror på vad du vill åt. Till skillnad från Platsbanken (som bara vill sprida sina annonser) så har inte Allabolag något att tjäna på att dela med sig "deras" data, utan att de annonser som de har sålt visas. De förlorar alltså på ett curl-anrop och har därför anpassat sig därefter. Jag har själv gjort en VBA-applikation för Word där man kunde hämta exakt företagsnamn från ett org.nr. Detta gjordes genom curl-anrop från VBA. Men, jag gjorde det mot Google istället för mot Allabolag, på grund av nämnda skäl. Söksträngen på Google var typ: [orgnr] allabolag.
VBA-skriptet fick då ett sökresultat hos Google där det kunde få ut företagsnamnet, direkt från Googles indexering. Allabolag var alltså none the wiser. Mer detaljerad information blir nog svårare dock.
Det lät extremt användbart. Dock sket det sig då jag inte har organisationsnumret för dessa, och märkligt nog fanns det inte i företagsregistret heller.
Insåg nu att jag kunde ha nallat telefonnumren också för bolagalistan i fråga, men det glömde jag. Rackarns.
Jaja, det är ju ingen egentlig brådska med saken.
Tror jag testar hamra järnet med en IP och tar så många jag hinner, och blir den ens bannad så sänker jag tempot markant och jobbar med det jag har medans resten tuggar färdigt.
Kan man ha flera seleniuminstanser igång samtidigt förresten?
Tänkte ifall jag kan låta mitt eniroscript tugga på samtidigt som alla bolag.
Det länkades en API tidigare till eniro, men där vart jag blockad efter bara ett fåtal anrop (typ 40 stycken kanske) med rätt så långt mellanrum. Därför kör jag selenium, då det inte är så otippat där om en IP söker hundratals nummer om dagen.