• 请不要在回答技术问题时复制粘贴 AI 生成的内容
leihongjiang
V2EX  ›  程序员

有没有开源爬虫能提取到标题跟页面的 url 实现入库

  •  
  •   leihongjiang · Jul 8, 2020 · 2848 views
    This topic created in 2161 days ago, the information mentioned may be changed or developed.

    可以自己写规则 每天要浏览大量的页面 确实太累了啊。 希望可以找到一款工具可以聚合浏览。 因为每天都需要浏览好多个网站的最新文章 所以希望能找个工具代替一下 也希望能够通过自己搜索关键字 来展现爬取到的内容。 不需要爬取内容,只需要 url 跟标题就可以了,然后根据自己的需求浏览

    9 replies    2020-07-08 13:47:45 +08:00
    tangtaorong
        1
    tangtaorong  
       Jul 8, 2020
    其实你要的就是 gg 或者百度
    nightwitch
        2
    nightwitch  
       Jul 8, 2020
    开源的框架不太清楚,商业的实现我知道一个,八爪鱼,鼠标点点点设立规则就行。
    iamverylovely
        3
    iamverylovely  
       Jul 8, 2020
    你蛮懒耶。
    renmu123
        4
    renmu123  
       Jul 8, 2020
    你需要 rss
    leihongjiang
        5
    leihongjiang  
    OP
       Jul 8, 2020 via iPhone
    @renmu123 找了很久都没有
    leihongjiang
        6
    leihongjiang  
    OP
       Jul 8, 2020 via iPhone
    @iamverylovely 不是懒 是工作量太大了啊
    leihongjiang
        7
    leihongjiang  
    OP
       Jul 8, 2020 via iPhone
    @renmu123 有些站点没有 rss 啊
    iamverylovely
        8
    iamverylovely  
       Jul 8, 2020
    @leihongjiang 看你的描述,感觉自己写出来不难啊
    lemonEssence
        9
    lemonEssence  
       Jul 8, 2020
    Web Scraper
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   888 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 47ms · UTC 22:10 · PVG 06:10 · LAX 15:10 · JFK 18:10
    ♥ Do have faith in what you're doing.