w568w's recent timeline updates
w568w

w568w

V2EX member #415660, joined on 2019-05-26 08:16:51 +08:00
Today's activity rank 149
3 G 73 S 71 B
我的 GPT 5.5 怎么和你们的不一样?
  •  1   
    OpenAI  •  w568w  •  12h 47m ago  •  Lastly replied by w568w
    35
    Google 宣布 Android View 即日进入仅维护模式
  •  1   
    Android  •  w568w  •  1 day ago  •  Lastly replied by rcj6056
    3
    这种纯 AI 机器人发帖是否需要处理?
    反馈  •  w568w  •  May 18  •  Lastly replied by Livid
    2
    有什么无需登录即可联机的网页游戏?
    问与答  •  w568w  •  Apr 3  •  Lastly replied by iamwin
    1
    OSS 相比传统的文件系统有什么优势?
    问与答  •  w568w  •  Feb 18  •  Lastly replied by just1
    11
    上海联通,这种情况是被 gank 了吗
    宽带症候群  •  w568w  •  Mar 1  •  Lastly replied by w568w
    15
    Python 3.14 已发布
  •  1   
    Python  •  w568w  •  Oct 10, 2025  •  Lastly replied by w568w
    35
    w568w's recent replies
    12h 47m ago
    Replied to a topic by w568w OpenAI 我的 GPT 5.5 怎么和你们的不一样?
    @tengxun @gloeaerris 今天尝试了一下 Codex ,体验如下:

    1. 口癖略微好了一些,但依然存在。主要差异是模型不会输出大段文本了,所以不明显。

    2. 同 1 ,GPT 喜欢说废话的现象基本解决一半了,但还是存在。

    3. 没有改善。依旧对着我的项目乱改。例如我要求他帮我「仅编译并推送一个 Docker 镜像」,他莫名其妙在我 Dockerfile ENTRYPOINT 和一大堆环境变量,又把我前面的 COPY xxx ./ 改成了 COPY . ./,也没有给任何解释。



    我问他「为什么要这么改?」,他回答我:

    「 COPY . ./ 没有强必要。最初这样改是为了让 build context 下的 runtime entrypoint 和后续文件布局更直接可见,但根本没必要。这会让 Docker cache 更差,我会改回 COPY xxx ./。」

    然后就改回去了。吐了,没必要你改什么呢?

    4. 还没有具体测试,虽然执行长时间任务的能力有显著提升,但他在任务中把我项目里的脚本重写了一遍(当然是在我没有要求的情况下),而且重写是错的,后面自己又回滚回去了。所以我谨慎不看好。

    ==============

    总结:输出语气有改善,其他方面没看出和 OpenCode 有特别大的差别。
    18h 56m ago
    Replied to a topic by w568w OpenAI 我的 GPT 5.5 怎么和你们的不一样?
    @neteroster 我觉得更可能的是 OpenAI 偷偷给我账号的模型降智或切换了。但我找不到任何证据,试了几个网上的测试例子都通过了
    19h 7m ago
    Replied to a topic by w568w OpenAI 我的 GPT 5.5 怎么和你们的不一样?
    @neteroster > 5.5 是执行的神
    > 一份十分明确的 spec 给进去执行出来就还是会有明确漏项或者矛盾的地方,5.5 甚至 5.4 就完全不会有这种问题

    啊?我自己使用下来的体验是,GPT 才是漏项的那个,有时我要求他做 A+B ,他做完 A 就直接停下来了,还要殷勤地问我一句「要我继续做 B 吗」。反而是 Opus ,我记忆里没有遇到过你说的执行漏项问题

    > opus 世界知识现在似乎已经是御三家最差了,5.5 长尾世界知识已经有半步 Gemini 水平了

    这个我倒是没太多体验,最近主要做工程问题。Opus 和 GPT 都出现过知识上的问题(例如认为「现在 Python 3.12 及之后的版本都没发布」,未经允许擅自把我项目里所有 python 3.13 和之后的版本字符串全部改成 3.11 )

    之前也做过 AI 辅助研究方向的问题,但是不知道为何 GPT 总给我一种「注意力涣散」的感觉(高情商说就是「思维发散」),问 A 要答 ABCDE ,尝试了几次最后还是回到 Opus 了
    19h 13m ago
    Replied to a topic by w568w OpenAI 我的 GPT 5.5 怎么和你们的不一样?
    @kkadmin 我开的确实是 5x Pro ,和 20x 会差很多吗😂
    1 day ago
    Replied to a topic by w568w OpenAI 我的 GPT 5.5 怎么和你们的不一样?
    @tanrenye > 为什么会有必要用同一个 agent 对比

    因为不用就会有人说「是不是 codex/claude code 的问题?你为什么不用一样的 harness ?你这吐槽没意义」,两头不讨好~

    开玩笑,实际上的原因是我有两边的订阅,然后有一些自己的配置和 skills 之类的,opencode 允许我在同一个会话里面切换不同模型,比较方便。
    1 day ago
    Replied to a topic by w568w OpenAI 我的 GPT 5.5 怎么和你们的不一样?
    @lujiaosama 嗯嗯。GPT 5.5 肯定是比 Codex 5.3 或者 5.4 强的,尤其在反编译、绕过反爬虫和逆向软件这种安全任务上,明显比 Opus 4.6 强得多。

    但 GPT 5.5 这个工程实践能力在我这里确实不咋行,而且输出口癖的风格还是没扭转过来,有时任务做的差、代码写得烂,又得意洋洋地总结自己做得如何如何好,有种面对伪人实习生的感觉,很火大。
    1 day ago
    Replied to a topic by w568w OpenAI 我的 GPT 5.5 怎么和你们的不一样?
    @felixcode 我的体验正好和你相反:GPT 5.5 各种瞎 jb 改,不管上下文,甚至不管我前一句话的要求是什么,按自己喜好乱写; Opus 倒是总是瞻前顾后,每次 plan 时排出一堆 concerns 来

    另外我感觉 Opus 4.7 明显有大幅度降智,Opus 4.8 才勉强回归到了 4.6 的能力水平,所以我把 GPT 5.5 和 Opus 4.7 放在一起
    1 day ago
    Replied to a topic by w568w OpenAI 我的 GPT 5.5 怎么和你们的不一样?
    @xuhuanzy 「正常来说」是怎么来说?能不能分享下你的配置?
    1 day ago
    Replied to a topic by w568w OpenAI 我的 GPT 5.5 怎么和你们的不一样?
    @lujiaosama 你的意思是,OpenCode 在 Claude 上能发挥优势,但在 DeepSeek 、GPT 上都有极大劣势?我倒是也可以试试 Codex CLI 就是了

    @Perry 此话怎讲?
    1 day ago
    Replied to a topic by w568w OpenAI 我的 GPT 5.5 怎么和你们的不一样?
    @Ericcccccccc 主帖有写,是 OpenCode 。我不太方便把我的 Claude 订阅接入到 Codex ,所以两边都「客场作战」,用一模一样的 OpenCode 配置,来公平比较了。
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   922 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 24ms · UTC 22:19 · PVG 06:19 · LAX 15:19 · JFK 18:19
    ♥ Do have faith in what you're doing.