• 请不要在回答技术问题时复制粘贴 AI 生成的内容
kastrcn
V2EX  ›  程序员

请问这是什么爬虫规则

  •  
  •   kastrcn · Aug 14, 2019 · 2876 views
    This topic created in 2489 days ago, the information mentioned may be changed or developed.

    "class.xing_vb5.0@text"

    "class.xing_vb6.0@text|class.xing_vb7.0@text"

    "[email protected]@src"

    kastrcn
        1
    kastrcn  
    OP
       Aug 14, 2019
    第一句话 是找到类为 xing_vb5 的第一个元素的内容

    求教这个爬虫规则什么是给什么框架的用的?
    DefineJ
        2
    DefineJ  
       Aug 14, 2019
    你这问的表示没看懂,我写了一个 php 爬虫用的 QueryList,规则
    $rules = array(
    '规则名' => array('jQuery 选择器','要采集的属性'[,"标签过滤列表"][,"回调函数"]),
    '规则名 2' => array('jQuery 选择器','要采集的属性'[,"标签过滤列表"][,"回调函数"]),
    ..........
    );
    还有其他很多,xpath 之类的
    tikazyq
        3
    tikazyq  
       Aug 14, 2019
    可以加作者 tikazyq1 拉爬虫管理平台微信群,很多大佬,帮你解决疑难杂症

    Crawlab Github: https://github.com/tikazyq/crawlab
    kastrcn
        4
    kastrcn  
    OP
       Aug 14, 2019
    @DefineJ 我感觉这个是一个类似 xpath 的那种爬虫框架的规则 网上找了一圈没发现是什么爬虫的框架框架 看看有没有见过识广的大佬见过 是什么爬虫框架
    kastrcn
        5
    kastrcn  
    OP
       Aug 14, 2019
    @tikazyq 已 star
    SoulMelody
        6
    SoulMelody  
       Aug 14, 2019
    这个好像安卓阅读 app 用的规则 https://github.com/gedoor/MyBookshelf
    kastrcn
        7
    kastrcn  
    OP
       Aug 14, 2019
    @SoulMelody 非常感谢
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   5636 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 42ms · UTC 01:35 · PVG 09:35 · LAX 18:35 · JFK 21:35
    ♥ Do have faith in what you're doing.