Kod:
import requests
from bs4 import BeautifulSoup
url = "https://www.flashback.org/t2857191"
request = requests.get(url)
source = request.text
soup = BeautifulSoup(source, "html.parser")
post_div = soup.find("div", class_="post")
post_message = post_div.find("div", class_="post_message")
post_message = post_message.get_text()
print(post_message)
Jag försöker använda den där koden för att hämta det första inlägget från en tråd här på forumet och sedan printa ut inlägget i terminalen jag kör scriptet från.
Inlägget visas, men vissa av tecknen har blivit ersatta av fyrkanter med text/siffror inuti.
Vet någon varför det här händer? Varför visas inte vissa av tecknen?
Det verkar vara double quote och något em/en tecken som inte visas. Testat med både Python 2.7 och 3.5, ingen skillnad.