V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  freefreesea  ›  全部回复第 3 页 / 共 4 页
回复总数  69
1  2  3  4  
2025 年 12 月 23 日
回复了 freefreesea 创建的主题 分享创造 刚做了个全网突发热点功能
@snow0 算法有待优化
2025 年 12 月 23 日
回复了 freefreesea 创建的主题 分享创造 刚做了个全网突发热点功能
@saviorjiang 哈哈,excel 里是有彩蛋的
2025 年 12 月 23 日
回复了 freefreesea 创建的主题 分享创造 刚做了个全网突发热点功能
@72 慢慢优化吧
2025 年 12 月 23 日
回复了 freefreesea 创建的主题 分享创造 刚做了个全网突发热点功能
@mertas 热的历史追踪吗
2025 年 12 月 23 日
回复了 freefreesea 创建的主题 分享创造 刚做了个全网突发热点功能
@metalvest 是,目前没有用大模型,单纯用的文本指纹判断的,准确度还是有比较大的问题
2025 年 12 月 22 日
回复了 freefreesea 创建的主题 分享创造 刚做了个全网突发热点功能
@yaoppp 新闻标题前面的趋势线 icon 是可以点击的,功能是历史热点追踪,后面带火的,是对应平台自己的热度值。所以还是不太一样的应该
2025 年 12 月 22 日
回复了 freefreesea 创建的主题 分享创造 刚做了个全网突发热点功能
@yaoppp 热点基本是每分钟刷新一次,所以时间显示需要精确到秒级
2025 年 12 月 22 日
回复了 freefreesea 创建的主题 分享创造 刚做了个全网突发热点功能
@topang 只要主站没问题,excel 应该就没问题,因为是同一套数据。
我刚看了一下,进去 excel 的时候,里面默认展示的分类是你在网站主页的分类。

如果主页你是在 [突发热点] / [收藏] 这两个页面的话,进去 excel 里面就会显示没数据,因为这两个数据是独立的,并且突发热点的数据形式在 excel 里面是没法展示的。

如果你是从非上面两个页面进去 excel ,那数据应该是都是展示正常的。
2025 年 12 月 22 日
回复了 freefreesea 创建的主题 分享创造 刚做了个全网突发热点功能
@sunnysab 你数据量不大的情况下,比如一天就几万条数据,喂给 ai 最多也就是几十万个字符。这个 ai 处理起来就很轻松了,只要你的数据里包含时间这个属性,他基本就理的明明白白的。
2025 年 12 月 22 日
回复了 freefreesea 创建的主题 分享创造 刚做了个全网突发热点功能
@sunnysab 其实有个困难点。
就是文本指纹聚类,也就是如何判断某些标题属于同一个。我目前是自己给标题算的 simhash 然后通过汉明距离去判断的,当然这样存在误判的可能性。最好的方案是交给 ai 去判断,但是数据源太多了,我每天会产生 1500 万+条热点数据,假设每个标题十个字符(极其保守),那么就是一次要喂给 AI 1.5 亿个字符。而这还仅仅是一天的数据量,那如果是一个月,就是 50 亿个字符了,实际几百上千亿字符。

问题就在这,一是大部分 ai 支持不了这么大的吞吐,而是就算支持,这个费用也是普通人远远无法承担的,再就是处理返回的时间会非常非常久。这是最大的问题,通俗点就是如何找相同热点。
2025 年 12 月 22 日
回复了 freefreesea 创建的主题 分享创造 刚做了个全网突发热点功能
@yu65112233ga1ac 是有点不太相关哈,哈哈哈。不过是因为,个人觉得现在很多技术领域的东西对普通人很不友好,所以能通过自己去做一点对普通大众的日常生活有落地用处的东西,是长久以来的夙愿。甜甜的,美美的,科技不该冰冷
2025 年 12 月 22 日
回复了 freefreesea 创建的主题 分享创造 刚做了个全网突发热点功能
@cryptovae 简报的话,点击旁边的非简报区域就关闭了
2025 年 12 月 18 日
回复了 freefreesea 创建的主题 互联网 问下佬们在 LinuxDo 这个网站体验怎么样
@Wcowin 可以可以,看了下确实不错
2025 年 12 月 16 日
回复了 freefreesea 创建的主题 分享创造 我的热榜站 100%全面开源啦,欢迎佬们体验
@hellodigua 可以呀,随便弄,项目既然开源,那么你看下他标注的协议,GPL3 就是随意使用。如果一个人的项目开源了,你参考他的去做东西,他给你逼逼赖赖的话,那这种人就永远是地沟里的老鼠
@RangerWolf 你再试下其他两个看看
@ronyin 他们都是闭源的,收费项目一大堆,咱这做公益站的,人家肯定不会和咱交流
@NewYear 是的,咱俩心路历程一样啊,我也是弄 L 站的,过不了验证,然后 smzdm 也是,偶尔可以访问成功,再就是要么出 403 ,要么出腾讯验证码,还会出别的!难啊兄弟
@queue 全网几乎 80%的热榜站都有什么值得买的榜单,而且已经很多年。那么这种情况下,你觉得是 [什么值得买] 的技术团队一直发现不了这件事,还是说本身这件事就是允许的
@queue 所以呢,我看全网很多地方都有什么值得买的榜单,说明他是可取的,只是我的方案不对,我来咨询下正确方案有什么问题呢,这位朋友
@Pipecraft 了解了,佬,感谢🙏
1  2  3  4  
关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   994 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 18ms · UTC 22:08 · PVG 06:08 · LAX 14:08 · JFK 17:08
♥ Do have faith in what you're doing.