本来我还在想, e 站直接把图片地址放在 html 里,连解析 JS 都省了,最多二十分钟搞定。现在想想,还是太年轻。
因为发生了一些很奇怪的事情。
-
墙内浏览器访问正常, Python 获取会报
connection reset by peer。我猜多半是墙的锅, ss 不方便断点调试我就挂了个 VPN ,果然错误没有了。很奇怪为什么浏览器不会reset。 -
本来很快就写好了,挂
proxychains测试的时候发现更诡异的事情,似乎 e 站会根据 IP 的不同返回不同的网页结构,比如这样
和这样的
,不知道是什么原理。如果网页结构都会变的话,我也不知道怎么写 beautifulsoup解析了……
咳,代码挂在 这里,能帮忙看一下那就最好了。