V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  maolon  ›  全部回复第 1 页 / 共 11 页
回复总数  209
1  2  3  4  5  6  7  8  9  10 ... 11  
基本同意
细粒度的 ddd 带来的主要是 context control 的好处,
生成工具我认为他们依然能提供生成 ground truth 的能力,交互化和添加 context 控制功能也是一种方向,
自动化测试现在 e2e 方向的能力依然有限(受限于多模态和 context 长度限制)但是未来肯定会变得非常可用,
我觉得“语义知识库”是个很好的概念,现在基于文档的 SDD 应该是很早期的语义库的版本,应该会过渡到基于语义知识库的版本控制,协同编辑,和开发,以及围绕这个的一系列工程化的经验和方法。应该很快就是文档即代码的时代了。
以及随着 人-AI 的合作进一步加深,目前的管理体系肯定会随着变化,现在的人和人的交流拟定方案再到人翻译给 ai ,等待 ai 执行,评估结果再交由人类审核,然后重新规划的模式并没有充分利用 ai 的能动性
9 天前
回复了 YanSeven 创建的主题 程序员 DeepSeek-V3.2 好像热度不高啊
因为他还叫 v3.2 ,而 3.2 exp (预览版)实际九月底就发了,另外他虽然宣传里 benchmaxxxx ,也不是每个 bench 都非常好
https://i.imgur.com/4rDZmLb.png
我现在跟我们 ui 合作就是让她直接出 gemini 的 prototype ,绕过 figma 那步,人还觉得比让她做 figma 更省时间
都不怎么样,用这些还不如直接用国产模型(自己接 api ),现在国产这些不是在搞活动 coding plan 20 块一个月?
11 天前
回复了 Saunak 创建的主题 程序员 gemini3 pro 对比 ChatGPT plus
@sunzhuo 那影响非常大了,免费版和付费版不是一个东西,付费版不强制 thinking 模式和强制 thinking 模式也不是一个东西
11 天前
回复了 Saunak 创建的主题 程序员 gemini3 pro 对比 ChatGPT plus
我可能跟你的感觉刚好相反,最近在写综述,gemini 给出的东西不论是是不是 deep research 模式都依然没法用,跟 5.1 pro 出来的结果差很远。
他可能在理解单篇文章方面做的更好,但是一旦你需要的是深入调查一个领域,gemini 给出的准度和信源都不行
13 天前
回复了 LittleYe233 创建的主题 程序员 感谢华为,又打钱 1 万,美滋滋
怪不得现在华为在拒绝同类应用上架,原来是这么玩坏的
确实是国产里 agent 能力做的最好的(目前),主要还是足够便宜,和最前沿的 opus 4.5, codex max 这些有距离,但是和次一档的上一代模型比如 sonnet 4.1 没有什么太大的距离

zai id: 25861764282185516
谷歌可以学生白嫖一年,最近给 c 端用的产品 app/网页版改进不少,特别是 canvas 非常实用,可以考虑试试
毛病就还是老毛病,gemini 模型指令遵循有问题而且懒,搜索随便搜两个就给结果,deep research 也是完全不跟着要求来做,这点还是 gpt 做得好所以现在我都是双持用
16 天前
回复了 edg 创建的主题 程序员 Java 端怎么弄大模型的长期记忆
长期记忆一般分为几种做法
1. 个人 profile ,这种提取信息结构化存 json ,一个用户有且只有一个,读的时候固定读取,用 rdb 就行了
2. 知识库/摘要信息,这种就是你现在用 es 在做的事,但是更常见的做法是存 vector db(然后走 rag 那一套),或者走 graph db 那一套(知识提取为三元组,具体看是哪种类型的知识),这两种市面上都有很多开源库的实现
3. 行为记忆/日程,也就是最近有什么 events/日程之类的,一般用于 recall 用户最近行为(而且需要准确 recall ),很多人会把这个功能合并到知识库里(但是这种一般是 time sensitive ,所以直接合并知识库其实不是特别好管理)

然后在此之上,就是记忆的读取/业务层,比如语义检索,关键字检索,retreive ,trim, summary function 之类的东西,这个看你们业务怎么做了,都是自由发挥

记忆读取出来都是拼接回当前的 context 内(你可以简单理解为 prompt ,但是我更愿意叫他 context ),然后调用模型 api
要不干脆改成 retro 相机或者 lowfi 风格算了?
这样也不用你费时费力再接一个高清化模型,风格化也挺酷的
最大问题难道不是散热么
你太空中散热只能靠真空热辐射, 你要搞多大的散热板才能撑得起你这个服务器?
21 天前
回复了 raw0xff 创建的主题 程序员 gemini3 做推广了?
蹭热点不是么,要说推广现在主流社交平台上 ai 相关都是 gemini3 刷屏,reddit 上也是狂呼 "前端已死""openai 已死", 这玩意儿是自带流量的
21 天前
回复了 BigChengzi 创建的主题 Claude Claude 真的好用吗?
你如果觉得国产模型已经很好用了,尤其是用 deepseek 都没问题,
那说明你现在的工作内容根本不需要用到 claude 也不需要 cli coding agent
21 天前
回复了 Kelly00 创建的主题 Google gemini3 真有那么神吗
3.0 preview 现在模型本身肯定有点问题,指令遵循在 9w tokens 之后就开始失效了,他会开始自由发挥,
大多数的评测和自己的测试都是短 context 测试,一个 case 一个 context 所以这种效应不明显,一旦进入大代码库的实际场景这种问题就会开始凸显,
这也可以解释为什么现在各种评测显示 gemini3 最好的就是前端场景,因为就算他自由发挥了你也看不出大的问题(而且大部分这种测试都是从头构建的前端)
22 天前
回复了 JieyueXing 创建的主题 程序员 如何看待 AI 工具的 "AGENTS.md" 文件
你看现在 openspec 和 speckit 对文档的定位就知道了,SDD 之后文档既代码,以前是为了多人协作开发追踪变动,审核,规范化代码,现在是追踪审核规范化文档,agents.md/claude.md/xxx.md 应该是所有规范化文档的入口
22 天前
回复了 qm 创建的主题 程序员 AI Agent 是不是新瓶装旧酒的一个概念
你这个理解是 workflow 而不是 agent ,建议看看 anthrophic 的 agent 定义 https://www.anthropic.com/engineering/building-effective-agents
22 天前
回复了 iflint 创建的主题 Google Gemini 3 Pro 这么牛吗
@wniming #25
gemini 3 pro 对标的是 gpt 5 thinking/high 模式,你直接用免费版的 gpt5 那肯定是满嘴跑火车了,我试了下,另外搜索我觉得还是 gpt 靠谱一些,gemini 才是一不留神满嘴跑火车的那个,下面是我把你问题贴给 5 thinking 里节选 vi 部分的回答:

• set -g status-keys vi
Uses vi-style editing in those prompts, with insert/command modes:
• In insert mode you type normally
• Esc → go to command/normal mode
• In command mode:
• h / l – left/right
• 0 / ^ – beginning of line
• $ – end of line
• w / b – next/previous word
• x – delete char under cursor
• dw / dd – delete word / delete line, etc.
看你是做项目还是做产品,项目简单,产品难,以及和楼上说的一样,你能做到一个持续盈利的独立开发产品就已经超过 99%的同类人了
白嫖 gemini pro + 白嫖 perplexity pro + 白嫖 cc + $20 gpt plus 自用 + $100 gpt pro 和朋友 shared codex ,cursor 自从他们那段时间瞎改付费 plan 就再也没碰过他们了
1  2  3  4  5  6  7  8  9  10 ... 11  
关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   5091 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 49ms · UTC 09:00 · PVG 17:00 · LAX 01:00 · JFK 04:00
♥ Do have faith in what you're doing.