推荐学习书目
Learn Python the Hard Way
Python Sites
PyPI - Python Package Index
http://diveintopython.org/toc/index.html
Pocoo
值得关注的项目
PyPy
Celery
Jinja2
Read the Docs
gevent
pyenv
virtualenv
Stackless Python
Beautiful Soup
结巴中文分词
Green Unicorn
Sentry
Shovel
Pyflakes
pytest
Python 编程
pep8 Checker
Styles
PEP 8
Google Python Style Guide
Code Style from The Hitchhiker's Guide
okface
V2EX  ›  Python

pyspider 有什么坑吗

  •  
  •   okface · Jun 29, 2018 · 3045 views
    This topic created in 2901 days ago, the information mentioned may be changed or developed.
    在 v2 看到好多次说不建议使用 pyspider 的,但是目前公司主要用的就是这个,因为他的可视化界面。
    所以,pyspider 到底都有哪些坑?有个印象好避免。
    Supplement 1  ·  Jun 29, 2018
    最近遇到的比较多的一个问题是,比如依次读取一个 100 万行的文件,作为 get 请求的一个 url 参数,但是读到 30 多万就停了。这一百万是去重后的一百万。
    5 replies    2020-06-26 08:08:16 +08:00
    hahastudio
        1
    hahastudio  
       Jun 29, 2018
    sethverlo
        2
    sethverlo  
       Jun 29, 2018
    Google 关键词「 pyspider site:v2ex.com
    X-Force
        3
    X-Force  
       Jun 30, 2018
    P2P0Zj31DA4X5ap4
        4
    P2P0Zj31DA4X5ap4  
       Jul 1, 2018
    100 万行你要用数据库了吧,默认哪个 lite 的支持不了。
    dfwr3
        5
    dfwr3  
       Jun 26, 2020
    我也遇到过,在抓取网页时,a 链接明明有 30 条,但他只能抓到 2 条。换一个列表页又正常了,感觉是 html 中的特殊隐藏字符的原因,现在也没解决。
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   4103 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 34ms · UTC 00:55 · PVG 08:55 · LAX 17:55 · JFK 20:55
    ♥ Do have faith in what you're doing.