fghfjujiber
V2EX  ›  问与答

PHP 爬虫 VS JAVA 爬虫 in 效率

  •  
  •   fghfjujiber · Jul 19, 2015 · 4753 views
    This topic created in 3978 days ago, the information mentioned may be changed or developed.

    单页面抓取毋庸置疑差不多,但涉及大量URL需要访问的时候:JAVA的爬虫框架轻松实现多线程;PHP有框架能够这样吗?不行的话我就得自己写multi_curl....

    10 replies    2015-07-19 21:40:50 +08:00
    laoyuan
        1
    laoyuan  
       Jul 19, 2015
    看过一篇百度团队的文档,PHP 的真 multi curl
    chengzhoukun
        2
    chengzhoukun  
       Jul 19, 2015 via Android
    Python和go很好吧,用协程库
    shierji
        3
    shierji  
       Jul 19, 2015
    表示最近要爬google。。。。还要刻意限制速度的说。
    wkdhf233
        4
    wkdhf233  
       Jul 19, 2015
    多开几个socket,先把所有请求发完再去处理返回
    msg7086
        5
    msg7086  
       Jul 19, 2015
    php轻松实现多进程。
    haiyang416
        6
    haiyang416  
       Jul 19, 2015 via Android
    Rolling cURL。
    zts1993
        7
    zts1993  
       Jul 19, 2015 via iPhone
    python更好。
    mahone3297
        8
    mahone3297  
       Jul 19, 2015
    php可以多进程
    也可以多线程 http://php.net/manual/en/intro.pthreads.php
    orvice
        9
    orvice  
       Jul 19, 2015
    多线程还是go写吧。。。
    Comdex
        10
    Comdex  
       Jul 19, 2015
    golang很妥当
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   1004 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 47ms · UTC 22:29 · PVG 06:29 · LAX 15:29 · JFK 18:29
    ♥ Do have faith in what you're doing.