V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
• 请不要在回答技术问题时复制粘贴 AI 生成的内容
dreamwing
V2EX  ›  程序员

这周是春节前最后一周了, Deepseek V4 会突袭吗?

  •  
  •   dreamwing · 1 天前 · 6688 次点击

    今年春节 deepseek 的 deepseek 时刻会不会再次上演?

    75 条回复    2026-02-10 10:01:00 +08:00
    mightybruce
        1
    mightybruce  
       1 天前   ❤️ 6
    没有必要关注 deepseek, 在达沃斯论坛上,谷歌和 anthropic 都没有正眼看过这个, 它的成功可能轻易不会再来一次, 国内字节和大模型公司如智谱才被认为最有潜力。
    leegradyllljjjj
        2
    leegradyllljjjj  
       1 天前 via iPhone   ❤️ 1
    一鼓作气,再而衰,三而竭。
    StephenHe
        3
    StephenHe  
       1 天前   ❤️ 7
    春节发布,然后打工人在家加班,跟打工人有仇吗
    cloudyplain
        4
    cloudyplain  
       1 天前
    别搞了,咱们节后再发。
    cue
        5
    cue  
       1 天前
    买每日互动了吧这么着急
    VeteranCat
        6
    VeteranCat  
       1 天前
    不会。 而且未来体量小的组织是真的上不了 AI 这个餐桌了,现在的 AI 发展主要关注的是应用,豆包手机这种的,千问这种的, 或者是其他的多模态方面的应用。 上一次爆发已经是他们憋了很久的了,下一次爆发很难,估计要完整适配完 HW 的芯片之后的事情了,算子要重新整。
    MIUIOS
        7
    MIUIOS  
       1 天前
    这次过年老热闹了,GLM5 、minimax2.2 、ds4 都来了
    qxmqh
        8
    qxmqh  
       1 天前
    能吊打克劳德 4.6 吗。
    visper
        9
    visper  
       1 天前
    可以炒一波,去年这么成功,搞得现在很多农村人都认为 AI 就是 deepseek 就是梁文锋。
    qwwuyu
        10
    qwwuyu  
       1 天前
    本来一直坚持 deepseek,后来老是断,改元宝了
    rykinia
        11
    rykinia  
       1 天前
    炒股的话没必要太关注。
    产业趋势还是可以跟踪一下,他们用 hw 的卡折腾了很久,最终还是换回了 nv 的卡,可以看看进展如何。
    NoNewWorld
        12
    NoNewWorld  
       1 天前
    没必要了,现在就两家了,其他不用关注了,就 a 社和 openai ,其他都落后很久,gemini 倒是还可以用用,听听他拍马屁。。不过如果还是开源的话,那有意义,这个世界还是需要开源的,闭源的未来太可怕了。
    nealHuang
        13
    nealHuang  
       1 天前
    @rykinia ds 的发布不是可以利好一大批国内的 AI 板块企业吗
    ZeroDu
        14
    ZeroDu  
       1 天前
    文生视频、图,这块国内的那些都还不错的。ds 现在有点尴尬
    iorilu
        15
    iorilu  
       1 天前
    现在 ai 模型没啥秘密可言的

    主要看迭代, 用户量, 数据量

    你没有巨大的用户量, 没有巨大的实际使用数据, 不可能仅靠什么算法就能领先的
    siriussilen
        16
    siriussilen  
       1 天前   ❤️ 6
    @mightybruce 哈哈,智谱
    iorilu
        17
    iorilu  
       1 天前   ❤️ 2
    不过国产那几个肯定要感谢 deepseek

    在去年 deepseek r1 之前, 国产那几个基本没任何用, 可能 qwen 还稍微好点点

    总从 r1 出来后, 国产那几个居然慢慢行了, 遗憾的是, 居然没人感谢 deepseek
    xiangqiankan
        18
    xiangqiankan  
       1 天前   ❤️ 8
    评论区很多没入行 ai 的"懂王"对 deepseek 大放厥词,这么说吧,在国外眼里,deepseek 是中国第一名,顶级中国 ai 研究机构
    yh7gdiaYW
        19
    yh7gdiaYW  
       1 天前
    @NoNewWorld 太贵了,尤其是 opus ,不好羊毛正经商用伤不起。这次 kimi 2.5 基本达到了 sonnet 水平,使用量一下子炸了,如果 v4 能进一步达到 opus 的水平,该考虑未来的是 claude
    iorilu
        20
    iorilu  
       1 天前   ❤️ 2
    @xiangqiankan 这是肯定的, deeepseek r1 开源在全世界 AI 都是极为重要的一个事件

    无数模型基于这个都有巨大的提高
    Meursau1T
        21
    Meursau1T  
       1 天前
    别擅自期待太多,官方没说要发布,何必把人架在火上烤。这帖子又不是看不出来,很多人巴不得 Deepseek 消失呢。最好像当年 2.5 时代一样,低调做事,有成果再发,按自己的节奏来。
    doudou555
        22
    doudou555  
       1 天前
    我现在大量用豆包和通义,deepseek 现在唯一的优势就是便宜了
    tonyqinatcmu
        23
    tonyqinatcmu  
       1 天前
    确实国内外差距还是挺大的,希望国产能够支棱起来
    mogutouer
        24
    mogutouer  
       1 天前
    很多人都这样,表面上鄙视这个鄙视那个,实际做产品时又嫌三巨头 tokens 贵, $25/MTok ,随便接入问个问题 5000 tokens 就 8 毛人民币,我看你什么产品能把这个赚回来。
    defaw
        25
    defaw  
       1 天前
    梁文峰就是搞股票出身的,炒股的别想从梁文峰身上赚钱好吧,每次发新东西都是周六,防着你提前拿消息埋伏他呢
    uxstone
        26
    uxstone  
       1 天前   ❤️ 1
    国外,Anthropic 、Google 、OpenAI
    国内,Alibaba 、DeepSeek
    mightybruce
        27
    mightybruce  
       1 天前
    @siriussilen 智谱能上市就能保证资金链没那么容易断, 你认为大模型不需要关注商业, 智谱自己披露出来的招股书不去看看,不少公司不出来上市的资本都根本撑不了半年,况且智谱还获得沙特基金 4 亿美元重仓, 你自己认为?
    siriussilen
        28
    siriussilen  
       1 天前
    @mightybruce
    1. 模型的成功与否和能否上市关系不大。
    2. 商业上的成功不等于技术上的成功。
    SouthwestRiver
        29
    SouthwestRiver  
       1 天前
    我很是期待,但不抱什么希望,免得失望
    mightybruce
        30
    mightybruce  
       23 小时 59 分钟前
    https://x.com/caixin/status/2016392042293952523

    谷歌 deepmind 对手都承认字节是竞争者,看来某些人比 deepmind, anthropic 更懂 AI ,呵呵。
    CynicalRose
        31
    CynicalRose  
       23 小时 41 分钟前
    这几天使用 Qwen3-Max ,体感降智严重,目前随便问一个数学问题,已经不如 DeepSeek 了。
    gogo_tutu
        32
    gogo_tutu  
       23 小时 40 分钟前
    倒是可以关注下今年的彼尔德伯格会议将要讨论的主题
    lovelive1024
        33
    lovelive1024  
       23 小时 34 分钟前
    大概率会发吧,效果咋样就先不要太期待了
    jackyli1
        34
    jackyli1  
       23 小时 12 分钟前
    @qxmqh 问就是能
    zuosiruan
        35
    zuosiruan  
       22 小时 31 分钟前 via iPhone
    @mightybruce kimi2.5 不香吗
    catazshadow
        36
    catazshadow  
       21 小时 44 分钟前
    @xiangqiankan 你这句话是典型的 诉诸权威 逻辑谬误

    一边喷别人不对,但你自己引用的是洋人的观点
    Meursau1T
        37
    Meursau1T  
       21 小时 33 分钟前
    @catazshadow 假设这人回的是一楼,即:

    没有必要关注 deepseek, 在达沃斯论坛上,谷歌和 anthropic 都没有正眼看过这个

    这么一个论断,那么他用洋人的观点显然是在反驳前人的论点,何来诉诸权威?
    小明说老师从来都不喜欢小李,小方说老师明明说过喜欢小李,小方诉诸权威了吗?
    只有这个人说“我听说某某专家说了,谷歌很关注 deepseek”这才叫诉诸权威。
    Meursau1T
        38
    Meursau1T  
       21 小时 30 分钟前
    @catazshadow 补充一下,你的回复是典型的“误判谬误类型”,fallacy fallacy 。
    dreamwing
        39
    dreamwing  
    OP
       21 小时 29 分钟前
    @cue 被你发现了😂
    Wkj1998
        40
    Wkj1998  
       21 小时 10 分钟前 via Android
    @qxmqh 编码方面应该还是吊打不了
    NoNewWorld
        41
    NoNewWorld  
       21 小时 10 分钟前
    @yh7gdiaYW 贵不是我们考虑的问题,是公司考虑的问题,公司只要认为使用的产出的价值比人高,那么再贵也是值得的。
    catazshadow
        42
    catazshadow  
       20 小时 45 分钟前 via Android
    @Meursau1T 洋人的观点在中文语境里就是权威,有什么问题?
    Meursau1T
        43
    Meursau1T  
       20 小时 25 分钟前
    @catazshadow 显然,你的思维是“只要借洋人之口”就是说权威,然而现在争论的事实是洋人的态度,洋人到底是怎么说的。
    如果你觉得只要讨论这个就是在诉诸权威,那么这是一楼的人做的事情,批评后面的人显然有失偏颇。
    如果你觉得可以讨论洋人到底怎么看,那么后面的人说洋人的态度就只是在就事论事的反驳一楼而已。
    倘若说你 @的人真有什么逻辑错误,只是没有实际举例罢了,不过一楼的举例也是以偏盖全,用一个论坛的情况来涵盖所有讨论,没什么高下之分。
    看起来你喜欢做逻辑分析,归纳谬误,我建议你最好对所有人都做,别选择性忽略,也不要根据关键词做简单的正则匹配,看见个洋人就权威。
    pengp0676
        44
    pengp0676  
       20 小时 21 分钟前
    感觉会诶,又想到去年春节的盛况了
    fbu11
        45
    fbu11  
       20 小时 9 分钟前   ❤️ 2
    梁文峰的重点从来不是 deepseek ,他就不是靠这个赚钱的,发不发没那么重要的(除非上面给压力)。拿这个贴子来讲,一帮自认为懂技术的人脑子里只有 Claude 、Gemini 、ChatGPT 人家看不上国产的
    stinkytofux
        46
    stinkytofux  
       20 小时 4 分钟前
    @siriussilen #16 你还真别说, glm4.7 还真是我的口粮模型.
    sharpy
        47
    sharpy  
       20 小时 0 分钟前
    以本人使用 codex5.3 opus4.6 的经验来说
    国内的模型生态是越发地欣欣向荣了
    glm4.7 kimi2.5 用起来手感都还行
    catazshadow
        48
    catazshadow  
       19 小时 57 分钟前 via Android
    @Meursau1T 原来是爱国小将

    天朝 AI 宇宙第一,大爆炸也是天朝 AI 推理出来的,告辞
    mightybruce
        49
    mightybruce  
       19 小时 50 分钟前
    @zuosiruan kimi 这次的亮点是 agent swarm , 这个还是有吸引点的。你可以体验体验。
    Meursau1T
        50
    Meursau1T  
       19 小时 44 分钟前
    @catazshadow 刚刚不还在拿着手册学人讲逻辑,怎么突然就开始犯人身攻击谬误了,你的逻辑思维为何如此不堪一击,我的不爱国大将军
    mightybruce
        51
    mightybruce  
       19 小时 43 分钟前
    话说 openrouter 上的一个神秘模型 Pony Alpha 大家都在猜测中, 其输出格式方式很像 GLM 。
    zhonghao01
        52
    zhonghao01  
       19 小时 42 分钟前
    @mightybruce #1 我虽然现在用的智谱的模型。但是从股价来看甚至不如 minimax 。
    dreamwing
        53
    dreamwing  
    OP
       19 小时 37 分钟前
    @zhonghao01 智谱今天涨了快 40%...
    catazshadow
        54
    catazshadow  
       19 小时 35 分钟前 via Android   ❤️ 1
    @Meursau1T 走在路边被狗咬了,你打算跟狗讲道理吗?

    同理
    mightybruce
        55
    mightybruce  
       19 小时 34 分钟前
    @dreamwing 难道 pony alpha 模型被确认了。
    sharpy
        56
    sharpy  
       19 小时 31 分钟前
    模型演化到一定的程度,智能上国模和御三家,从可用性来说已经没有什么差距了。
    毕竟不是所有的任务都得用最强的模型,GLM4.7 已经足够我使用了。

    至于说,把所有的一切,都交给 AI 来决策,来推进,那是另一个层面的事情,当下,我还是不会放弃自己的脑子。
    Rickkkkkkk
        57
    Rickkkkkkk  
       19 小时 30 分钟前
    ds 自己流量没接住啊,我一直都是用元宝里的 ds
    dreamwing
        58
    dreamwing  
    OP
       19 小时 21 分钟前
    @mightybruce 好像是说是 GLM5 ,也有说是 Minimax M2 ,不过从今天智谱和 Minimax 的涨幅来看,感觉像是 GLM5😂
    vipfts
        59
    vipfts  
       19 小时 14 分钟前   ❤️ 1
    @fbu11 我不在意,我只想看 ds 捅国外的 ai 泡沫,跟棍勇的烧火棍捅批得一样爽
    kk58
        60
    kk58  
       18 小时 43 分钟前   ❤️ 1
    筛选:
    1.技术对等不是二流技术附庸;
    2.训练效率显著高于美国同行;
    3.私有数据闭环作为护城河

    只剩 DeepSeek 阿里 字节 腾讯
    ChaimeLonic
        61
    ChaimeLonic  
       17 小时 8 分钟前
    @Meursau1T #21 只是一波人擅自期待又擅自破防罢了,deepseek 没给承诺,每次发个模型微信群发个消息,官网上篇介绍就完事
    ChaimeLonic
        62
    ChaimeLonic  
       17 小时 6 分钟前
    @kk58 GLM minimax kimi 看起来还是 claude 的附庸
    BadAngel
        63
    BadAngel  
       13 小时 9 分钟前
    hvv 知道,会发的
    bwnjnOEI
        64
    bwnjnOEI  
       8 小时 27 分钟前 via iPhone
    国内就去年 ds 的 grpo 长脸了 rlhf 再也不需要 4 个模型了,之后都是源于做量化的底子在工程上的创新,今年的 mhc 还比较 demo 其他公司没有那么从 0 到 1 。 未来国内看好字节。国内还没有 alphago zero fold 这种诺奖级别的原创 这些你看他的论文很简单很清晰
    germain
        65
    germain  
       8 小时 18 分钟前   ❤️ 1
    Deepseek 依然是目前我团队使用的投入产出比最高的模型,没有之一,大大超过市面上其他的 AI
    Suger828
        66
    Suger828  
       8 小时 6 分钟前   ❤️ 1
    其实 ds 的影响力还是蛮大的,智谱和 kimi2.5 用的架构就是 DeepSeek 的
    tairan2006
        67
    tairan2006  
       3 小时 5 分钟前 via Android
    我支持 deepseek ,但是这玩意儿确实只是副产品
    qiaobeier
        68
    qiaobeier  
       1 小时 49 分钟前
    @ZeroDu 视频这块字节的 Seedance2 简直牛逼 plus ,以前我还能分得清什么是 ai 视频,现在这玩意生成的真的分不清楚了。
    wanttofly
        69
    wanttofly  
       1 小时 48 分钟前   ❤️ 1
    实在没看懂楼上一些人自己破防骂别人、崇洋媚外、讲话毫无逻辑的人在那沾沾自喜、自以为是是什么道理? deepseek 怎么看在大模型领域都不是路边一条,不说举足轻重至少不可忽视吧?
    BlackSas
        70
    BlackSas  
       1 小时 19 分钟前
    我们公司的欧洲的,跟总部开会人家都认为只有中国在 AI 上能跟上美国了。
    deepseek moment 也是很了不起的。
    正视差距可以,但也不要过分踩低。
    bianYuX
        71
    bianYuX  
       1 小时 18 分钟前
    @mightybruce 曾经我也认为智谱是中国最牛的大模型,但是我使用下来是他连代码完成度都没法保障,else 0 给我写成了 else ,这种错误实在太低级了
    PC9528
        72
    PC9528  
       1 小时 13 分钟前
    其实要分别是不是国内模型很简单的,问一下国内模型不能回答的问题,国外模型可以回答的问题就可以了,显然 pony alpha 是国内模型
    janda
        73
    janda  
       1 小时 10 分钟前   ❤️ 1
    人类不感谢 deepseek 、就像不感谢逻辑一样
    littlebaozi
        74
    littlebaozi  
       1 小时 7 分钟前
    我在想在算力有限的情况下能有这些个 AI ,要是能有顶级算力加持,那还不起飞
    viking602
        75
    viking602  
       1 小时 3 分钟前
    倒是 感觉 GLM 会在春节前突袭
    关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   4600 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 44ms · UTC 03:04 · PVG 11:04 · LAX 19:04 · JFK 22:04
    ♥ Do have faith in what you're doing.