evenIfAlsoGo
V2EX  ›  Node.js

casperjs 不能操作导入的数据?

  •  
  •   evenIfAlsoGo · Mar 26, 2018 · 4522 views
    This topic created in 2994 days ago, the information mentioned may be changed or developed.

    我用 fs 读取一个 json,里面存的网址数据,一直没找到操作 json 的途径。 官网找到一个 each() 方法,可以读取数组,但是数组放在外部通过 fs 读取就又用不了了! 是这个工具本事就不适合导入数据,还是我 fs 没用好?

    19 replies    2018-03-28 22:03:37 +08:00
    evenIfAlsoGo
        1
    evenIfAlsoGo  
    OP
       Mar 26, 2018
    忘记加“请问”了,不好意思:

    请问是这个工具本事就不适合导入数据,还是我 fs 没用好?
    murmur
        2
    murmur  
       Mar 26, 2018
    casperjs 也是 phantom 吧 直接注入个外部 js 就可以了 不要写成 json 格式 json 数据直接给到一个全局变量上就可以
    evenIfAlsoGo
        3
    evenIfAlsoGo  
    OP
       Mar 26, 2018 via Android
    @murmur 对的,casper 是基于 phantom 的。我去试试~!
    murmur
        4
    murmur  
       Mar 26, 2018
    忘了问你的作用域了 如果是 page 里需要注入 js 如果是在外面 不是有个 node 环境么
    evenIfAlsoGo
        5
    evenIfAlsoGo  
    OP
       Mar 26, 2018 via Android
    @murmur 我是想将数据作为参数赋值给 capser 的方法。我试过写一个页面,把数据绑定到 dom 节点,开启本地服务器,再用 casper 访问这个网页,但是没有成功,获取不到数据。
    POPOEVER
        6
    POPOEVER  
       Mar 26, 2018
    我都是直接读啊,难道你不行吗?

    ```javascript
    fs.readFile('json/sources.json', 'utf8', (err, data) => {
    if (err) throw err
    SOURCES = JSON.parse(data)
    })
    ```
    POPOEVER
        7
    POPOEVER  
       Mar 26, 2018
    咦,不是吃 MD 吗

    ```
    fs.readFile('json/sources.json', 'utf8', (err, data) => {
    if (err) throw err
    SOURCES = JSON.parse(data)
    })
    ```
    evenIfAlsoGo
        8
    evenIfAlsoGo  
    OP
       Mar 26, 2018 via Android
    @murmur 我用 node xx.js 不可以运行,因为这方面不太熟,不知道该怎么在这个库外面运行 node 环境。。 我还写一个 js,然后想用 js 来解析 json,再调用写了 casper 的 js...这些问题不知道该查什么资料学习...
    evenIfAlsoGo
        9
    evenIfAlsoGo  
    OP
       Mar 26, 2018 via Android
    @POPOEVER 没事没事 能看明白~我用的是
    fs.read(filePath),会不会是我 fs 方法没调用对。。
    POPOEVER
        10
    POPOEVER  
       Mar 27, 2018
    嗯,fs.read(fd) 里面不是传路径的,fd 是文件的描述符, 要先通过 fs.open 设置,而且 fs.read() 主要是用来灵活滴读取文件数据,要读取整个文件直接用 fs.readFile(),如果需要同步版本 fs.readFileSync()。

    P.S: 文档是好帮手
    evenIfAlsoGo
        11
    evenIfAlsoGo  
    OP
       Mar 27, 2018 via Android
    @POPOEVER 会提示 Unexpected token > 可能这个库真的不支持。。 忘记 fs 模块文档了...只查库文档...谢谢~
    evenIfAlsoGo
        12
    evenIfAlsoGo  
    OP
       Mar 27, 2018 via Android
    @POPOEVER @murmur 感谢,问题已经解决。我更换了库:使用谷歌官方的封装库 puppeteer,不但 json 问题迎刃而解,而且在开启本地服务器后,也能获取数据了!
    POPOEVER
        13
    POPOEVER  
       Mar 27, 2018
    @evenIfAlsoGo 你的 fs 是 require('fs') 的吗?还是你 require 的第三方库? fs 是 node 默认的库,应该不会有你说的那种报错吧。你要用到 puppeteer 是要跑单元测试还是其他特殊操作,比如截屏?因为他毕竟要跑一个浏览器实例起来,个人觉得在服务器端跑一个 headless Chrome 如果只为了读页面文档结构的话还不如 axio 把页面 data chunk 拿回来直接 cheerio.js 分析文档树了,我自己写爬虫就是这么干的
    evenIfAlsoGo
        14
    evenIfAlsoGo  
    OP
       Mar 28, 2018 via Android
    @POPOEVER 用的是默认的 fs 库。我只是读取一个 dom 节获取 exe 下载链接。用 puppetter 的时候我还引入一个第三方库 download,因为用 goto(下载链接) 每次下载完成都会提示是否保存,需要写额外的代码,就直接找了一个下载文件的库。按照你说的,只读取一个链接确实有点大材小用了...这是我第一次爬虫哈哈
    POPOEVER
        15
    POPOEVER  
       Mar 28, 2018
    @evenIfAlsoGo 哦,我简单查了一下,好像说是在 Windows 生成的 json 文件的 BOM 头标记导致的那个报错,这样改一下就可以了

    data = JSON.parse(data.toString('utf8').replace(/^\uFEFF/, ''));

    或者直接用 BOMStrip: https://www.npmjs.com/package/bomstrip

    抓下载链接用单元测试工具有点过了。。。
    evenIfAlsoGo
        16
    evenIfAlsoGo  
    OP
       Mar 28, 2018 via Android
    @POPOEVER cheerio 不能抓动态生成的渲染的网页...要渲染好像只能用无头浏览器。非常感谢~我去试试。
    POPOEVER
        17
    POPOEVER  
       Mar 28, 2018
    @evenIfAlsoGo php 这些后端渲染的页面还是可以的,带异步数据的 H5 页面的话肯定不行的,cheerio 不是浏览器,它只是个文档树遍历工具,从 jQ 内核剥离出来的,不能执行 js
    evenIfAlsoGo
        18
    evenIfAlsoGo  
    OP
       Mar 28, 2018 via Android
    @POPOEVER 明白了~赞!
    POPOEVER
        19
    POPOEVER  
       Mar 28, 2018
    @evenIfAlsoGo 不客气,一起学习
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   2764 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 32ms · UTC 11:37 · PVG 19:37 · LAX 04:37 · JFK 07:37
    ♥ Do have faith in what you're doing.