接了个小项目, 做一系列网站的流量统计, 流量比较大(相对单一网站), 全部加起来每天千万 PV 差不多, 那么整个系统的构架大概应该是什么样呢?
或者哪位同学用过或者了解过有关的开源项目吗?
PS: 由于某些特殊原因, 无法使用目前市面上的公用统计服务.
或者哪位同学用过或者了解过有关的开源项目吗?
PS: 由于某些特殊原因, 无法使用目前市面上的公用统计服务.
1
zrj766 Mar 8, 2016 via Android piwik
|
3
jugelizi Mar 8, 2016 自己做广告平台吗
piwik 还是不错的 随便改过一点 你还需要 Hadoop |
4
deben OP @jugelizi 请问, 千万 PV, 就需要 Hadoop 了吗? 我的想法比较简单, 用 Nginx 分发到几个服务器能解决问题吗? 另外, 这个级别的数据存储用 MySQL 就不行了吧, 需要上 noSQL 的数据库了吧?
|
5
lecher Mar 8, 2016 via Android 日千万 PV ,第一个问题在写入量上面,但是算下来就是峰值一秒顶多就是一千的日志, MySQL 绝对可以扛得住,至于接收日志的 Web 处理如果单台的性能不行,分几台服务器可以扛得住。用 NoSQL 撑写入量在数据管理上更容易做分布式。
其次是分析计算,这个重计算的事情,看业务有多复杂了,如果计算模型很复杂用 spark 、 Hadoop 这类的计算框架来节省开发成本也不错。如果不是很复杂就是简单的统计汇总可以不用那么重型的计算框架,自己写。 |