1
abelyao Dec 10, 2014
抵制一切爬站采集的行为!
我愿意在 v2ex 发帖交流,但我不愿意我发表的内容,被复制到一个我不知道的网站去! |
2
Livid MOD OP PRO |
3
tinyhill Dec 10, 2014
被爬了说明有价值,只能这么安慰自己。
|
5
kurtrossel Dec 10, 2014
爬到数据也不会珍惜的,真能发掘出更大价值也算,各种滥用
|
7
abelyao Dec 10, 2014
@Livid 真蛋疼,这些站就该倒闭光了才好。
之前在自己的网站 或 cnblogs 写过几篇热门博客,也都 “被发表” 到一些大论坛大网站去,有些好点的在角落里留个署名,大多数什么来源都没标注。 |
8
kmvan Dec 10, 2014 via Android
這并发略吊…
话说Karma是…? |
9
jiang42 Dec 10, 2014
就是说之前v2ex不稳定是爬虫的原因?
|
11
herozzm Dec 10, 2014
这个爬虫不合格啊,这个密集采集,都会被管理员K的
|
12
Showfom PRO 这爬虫太明显了吧。。。。
|
13
learnshare Dec 10, 2014
垃圾站:我们不生产内容,我们只是内容的搬运工。
互联网的内容不应该复制来复制去,有必要的话,一个链接过来就好了。<a> 不是互联网的核心? |
14
raincious Dec 10, 2014
|
15
lincanbin Dec 10, 2014
这写爬虫都不知道换个baiduspider的header
|
16
xieguobihaha Dec 10, 2014
good job
|
17
abelyao Dec 10, 2014
|
18
matrix67 Dec 10, 2014 via Android
不过贵站那个收藏回复值应该开放出来
|
21
matrix67 Dec 10, 2014 via Android
|
24
matrix67 Dec 10, 2014 via Android
不是 ╯﹏╰ 哎,不用这个小号了。
|
26
lifechan Dec 10, 2014
国内环境如此,比技术比创意,都是在比剽窃,不脚踏实地早晚掉到深沟。
|
27
v2014 Dec 10, 2014
@Livid http://v2ex.com/my/nodes/sorted ,打印traceback了
|
31
ericls Dec 11, 2014 via Android
有一天我发现我的博客全部发到了百度文库 还分好了类 排好了版
|
32
karma Dec 11, 2014
咋感觉....躺枪_(:з」∠)_....
|