V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
爱意满满的作品展示区。
Brightt
V2EX  ›  分享创造

撸了日本小电影提取字幕并翻译的工具

  •  1
     
  •   Brightt · 3 月 23 日 · 12457 次点击
    撸了个提取视频字幕并用大模型翻译的工具,专门针对日语优化,支持 Windows 和 macOS ( M 芯片): https://github.com/cddqssc/Caption-Trans

    如图,帮我的一个朋友翻译了一部番号为 ipx-726 的日语片,效果非常哇塞


    利用 whisperX 的词级时间戳针对日语进行优化,其他语言保持 whisperX 的基本水准,比 whisper 强。
    转录自动识别 GPU 加速
    推荐使用 gemini flash lite 系列模型,速度快价格便宜,还能翻译敏感词
    第 1 条附言  ·  3 月 23 日
    翻译是先让 AI 总结全文,然后再逐批让 ai 翻译,每批有上下文关联

    效果实测不错,有些模型还能翻译出非常下流的语句
    141 条回复    2026-04-04 14:33:57 +08:00
    1  2  
    frankkly
        1
    frankkly  
       3 月 23 日   ❤️ 4
    可以不可以开发一个 Chrome 插件,支持 MISSAV 在线实时翻译
    kimzn33251
        2
    kimzn33251  
       3 月 23 日
    挺有趣的
    Brightt
        3
    Brightt  
    OP
       3 月 23 日
    @frankkly 兄弟别看 missav 了,片源画质太差了
    wyattyhh
        4
    wyattyhh  
       3 月 23 日 via iPhone
    @Brightt 那么问题来了,哪个好
    Brightt
        5
    Brightt  
    OP
       3 月 23 日
    @wyattyhh 下载到本地看,在线的画质压缩的都严重
    xiangran0028
        6
    xiangran0028  
       3 月 23 日   ❤️ 1
    感谢 OP ,解决了我空闲学习日语的难题。
    burp2019
        7
    burp2019  
       3 月 23 日
    一大早,来学习姿势了,居然支持 GPU 加速
    shenhualv7
        8
    shenhualv7  
       3 月 23 日 via Android
    我看都是无字幕的呀,哪里有带字幕的片源
    icetea66
        9
    icetea66  
       3 月 23 日
    @Brightt #3 就那几分钟的事儿 画质无所谓
    Brightt
        10
    Brightt  
    OP
       3 月 23 日
    @shenhualv7 不用带字幕,工具可以帮你提取出来
    Brightt
        11
    Brightt  
    OP
       3 月 23 日   ❤️ 1
    @icetea66 高清的毛孔都能看见
    frankkly
        12
    frankkly  
       3 月 23 日   ❤️ 16
    @Brightt #5 曾经我有四五个移动硬盘,每个都是 4T 的,累了,现在只看在线的,再高清的也就是让我爽 5 分钟而已
    shen13176101
        13
    shen13176101  
       3 月 23 日
    666,从 ai 开始前我就一直想实现这个功能,当时一直没成功,今天终于见到这个功能了
    q2316367743
        14
    q2316367743  
       3 月 23 日
    这必须要点个赞,下载去试试去
    goodryb
        15
    goodryb  
       3 月 23 日
    支持本地模型吗,Google 总是会麻烦一点
    Brightt
        16
    Brightt  
    OP
       3 月 23 日
    @goodryb 支持的,只要兼容 openai 接口的都行
    goodryb
        17
    goodryb  
       3 月 23 日
    @goodryb 看到了,有 ollama 666
    sevenyangcc
        18
    sevenyangcc  
       3 月 23 日   ❤️ 12
    @Brightt #11 不如 720p 的朦胧美,4K 60 帧的只能把演员的缺点暴露得更明显。
    yuwancumian27149
        19
    yuwancumian27149  
       3 月 23 日
    市面上一大堆支持 emby 、jellyfin 、plex 的播放器,如果哪款播放器播放日本电影的时候能像油管或者 b 站一样支持显示实时字幕就好了......
    licoycn
        20
    licoycn  
       3 月 23 日
    🐮🍺
    aero99
        21
    aero99  
       3 月 23 日
    人才,正好缺少这个
    Atlas058
        22
    Atlas058  
       3 月 23 日
    @Brightt #11 还是朦胧美好,想象空间更大,太高清反而失去真实感
    saaak
        23
    saaak  
       3 月 23 日
    @wyattyhh jable 的画质感觉还行
    uxstone
        24
    uxstone  
       3 月 23 日
    之前看到过有个网站的进度条会显示哪个时间段用什么 doi 姿势
    saaak
        25
    saaak  
       3 月 23 日
    @uxstone p 站就有
    gy0624ww
        26
    gy0624ww  
       3 月 23 日
    如果有实时更换配音就好了,可以御姐音,萝莉音。
    FakerLeung
        27
    FakerLeung  
       3 月 23 日   ❤️ 1
    果然黄才是第一生产力
    NafIyIz
        28
    NafIyIz  
       3 月 23 日
    感觉还是太麻烦,楼上说的对,感觉来了还得忍着整这个,不如在线的直接翻译。
    GodSppp
        29
    GodSppp  
       3 月 23 日
    牛逼牛逼, 下班回去试试
    Sendya
        30
    Sendya  
       3 月 23 日
    果然搞涩涩才是第一生产力
    darksword21
        31
    darksword21  
    PRO
       3 月 23 日
    AI 就该这么用!
    sevenyangcc
        32
    sevenyangcc  
       3 月 23 日
    @Atlas058 #22 下过一次 VR ,我的天,差点 ED~~
    ala2008
        33
    ala2008  
       3 月 23 日
    下载到本地的一般都出了很久吧,字幕肯定有了。刚需是在线刚出的
    kcerty
        34
    kcerty  
       3 月 23 日
    @sevenyangcc #32 那么夸张啊。。。其实一点轻微朦胧还挺好的,挺清晰了反而没那么好看,缺点全部暴露出来。。
    fenfire
        35
    fenfire  
       3 月 23 日
    已经用 vivo 手机的实时翻译看了,那个都不用字幕,直接音频翻译
    vaily
        36
    vaily  
       3 月 23 日
    兄弟牛逼,做了我想做的事👍
    可以考虑加上 cli 版本,方便集成在自动化工作流里
    zmqking
        37
    zmqking  
       3 月 23 日
    @frankkly chrome 自带有翻译
    PC9528
        38
    PC9528  
       3 月 23 日
    @yuwancumian27149 potplayer 支持实时字幕的(还支持翻译), 不过本质上还是用 whisper 实时转录
    johnwonderful
        39
    johnwonderful  
       3 月 23 日
    666
    xrxsh
        40
    xrxsh  
       3 月 23 日
    直接去色花堂下载中文字幕版本的呗
    sola97
        41
    sola97  
       3 月 23 日
    我最近也搞了个用于翻译直播的,用的 qwen3-asr ,本地 gpu 推理,就是延迟有点大
    FlechazoQaQ
        42
    FlechazoQaQ  
       3 月 23 日
    你做得好你做得好啊!!!
    Brightt
        43
    Brightt  
    OP
       3 月 23 日
    @xrxsh 很多都没有,VR 更是基本没有
    Chicagoake
        44
    Chicagoake  
       3 月 23 日
    @xrxsh 有些片子没中文字幕,或者要等很久的。不过一般有资源流出,很快就有中文字幕了。
    myarsenal
        45
    myarsenal  
       3 月 23 日
    如果没有日语字幕的能听译吗
    Brightt
        46
    Brightt  
    OP
       3 月 23 日
    @myarsenal 可以的,有声音就行
    jpyl0423
        47
    jpyl0423  
       3 月 23 日
    有能在 wsl 里运行的包吗
    faceRollingKB
        48
    faceRollingKB  
       3 月 23 日
    ShawnShi
        49
    ShawnShi  
    PRO
       3 月 23 日
    大善人
    shadowking
        50
    shadowking  
       3 月 23 日
    666 ,收藏了
    Rat3
        51
    Rat3  
       3 月 23 日
    @uxstone

    pron 就行( dog style )
    Adyun
        52
    Adyun  
       3 月 23 日   ❤️ 1
    行 现在字幕解决了 期待 AI 配音
    dengji85
        53
    dengji85  
       3 月 23 日
    @Brightt 下载太慢了,需要先在线预览后才能决定要不要下载
    Brightt
        54
    Brightt  
    OP
       3 月 23 日
    @dengji85 搞个 115 ,我这千兆宽带,能跑满,5G 的视频基本一两分钟
    andyskaura
        55
    andyskaura  
       3 月 23 日
    上周才造的轮子 https://v2ex.com/t/1199549 太卷了点
    piaorenyong
        56
    piaorenyong  
       3 月 23 日
    能不能加上中文配音
    FarAhead
        57
    FarAhead  
       3 月 23 日
    先翻译一部试试
    Kenopsia
        58
    Kenopsia  
       3 月 23 日
    科技改变生活!
    FreshOldMan
        59
    FreshOldMan  
       3 月 23 日
    牛逼啊,真直击用户需求
    huyiwei
        60
    huyiwei  
       3 月 23 日
    测试的时候废了不少纸吧
    Brightt
        61
    Brightt  
    OP
       3 月 23 日
    @huyiwei 是废了点纸
    kiii
        62
    kiii  
       3 月 23 日
    反正也是麻烦,不如用 TTS 直接把日语翻译成中文语音,那多开心
    czlccczc
        63
    czlccczc  
       3 月 23 日   ❤️ 1
    videocaptioner
    um1ng
        64
    um1ng  
       3 月 23 日
    Tesla9527
        65
    Tesla9527  
       3 月 23 日
    nice
    zuou
        66
    zuou  
       3 月 23 日
    字幕翻译这个我之前也研究过,后来发现全部上下文直接发给 Grok ,让翻译好按格式返回效果更佳,不用批次翻译了
    tc5156
        67
    tc5156  
       3 月 23 日
    我回去试试,感谢老铁
    yanlaz
        68
    yanlaz  
       3 月 23 日
    @sevenyangcc 还是清晰的好看,好看的会更好看,有真实感,我就不喜欢带太大滤镜的,现在拍的清楚的 4K 其实也不多
    0747916
        69
    0747916  
       3 月 23 日
    科技改变生活
    nocmt
        70
    nocmt  
       3 月 23 日
    实时字幕: https://subflowai.nocmt.com/
    音视频生成字幕: https://apps.nocmt.com/miman/
    andrew2558
        71
    andrew2558  
       3 月 23 日   ❤️ 1
    印证了那句古语:色色才是第一生产力
    pandoudousteve
        72
    pandoudousteve  
       3 月 23 日
    科技改变生活,兄弟你高低应该去 javbus 发个帖
    k4x7UW92WE8
        73
    k4x7UW92WE8  
       3 月 23 日
    有没有可以平替 miraa 的工具
    r6cb
        74
    r6cb  
       3 月 23 日
    什么时候加去码功能
    kcerty
        75
    kcerty  
       3 月 23 日
    @yanlaz 推荐推荐好看的
    Nyeshuai
        76
    Nyeshuai  
       3 月 23 日   ❤️ 1
    @sevenyangcc #18 一样的感觉,一般演员扛不住这种距离~牙齿深处黑的、黄的,痔疮颗粒,鸡皮肤,一被吸引力注意力就倒胃口。
    swananan
        77
    swananan  
       3 月 23 日
    已经 star 了,能支持 codex 或者 cc 这种 agent 的使用方式吗,而不是 api
    junas7
        78
    junas7  
       3 月 23 日
    很不错,强!
    但是 Windows 版本首次启动安装依赖好像安装到 C 盘了,我以为会是项目目录。
    msn1983aa
        79
    msn1983aa  
       3 月 23 日
    果然 GHS 才是推动技术进步的动力
    Brightt
        80
    Brightt  
    OP
       3 月 23 日
    @junas7 是的兄弟 我是用的 flutter 获取标准的应用数据路径
    crocoBaby
        81
    crocoBaby  
       3 月 23 日
    这才是让技术变得有意义
    Daniel0829
        82
    Daniel0829  
       3 月 23 日
    太牛逼了
    feidao158
        83
    feidao158  
       3 月 23 日
    让我想起来了我之前的一个想法,有个匹配该类视频字幕的网站,SubTitle Cat , 之前我的想法是从视频里面提取出来音频 然后再从音频里面提取出来日文字幕 再根据这个日文字幕内容匹配出来对应的番号,根据番号再找对应的中文字幕,不知道这种有没有什么好的实现方式
    Brightt
        84
    Brightt  
    OP
       3 月 23 日
    @feidao158 这种可能要有一个庞大靠谱的对比数据库才行
    Hajar123
        85
    Hajar123  
       3 月 23 日

    下载好像有点问题
    feidao158
        86
    feidao158  
       3 月 23 日
    @Brightt 因为我的视频都在 nas 上面,如果这个工具能够以一个脚本或者之类的方式运行,然后自动下载到对应目录下的文件就好了, 比如原视频是 xxx.mp4,然后通过这个 ai 工具匹配出来自动在同级目录下有了 xxx.ass 之类的,这样视频播放器就能自动匹配上这个字幕文件
    Brightt
        87
    Brightt  
    OP
       3 月 23 日   ❤️ 1
    @Hajar123 我正在弄一个中国大陆源,不需要翻墙就能安装环境
    goodryb
        88
    goodryb  
       3 月 23 日
    本地模型有测试过哪个翻译效果好点么,我用 qwen3 8b 感觉像是直译的,准确度不够高; 另外这个每次翻译 x 条字幕,是会带上下文么,设置大一点效果更好?
    saaak
        89
    saaak  
       3 月 23 日
    @feidao158 #86 下载的视频都不带番号吗
    feidao158
        90
    feidao158  
       3 月 23 日
    @saaak 视频都是从一些三方磁力网站下载的,目前是卡在怎么精准的将对应的番号提取出来,我目前想到的是从对应下载目录或者视频文件名中通过正则匹配出来对应的精准番号,比如原文件名可能是 xx 娱乐网 @xdd-w44.mp4 这种的,不过这种精准度不好保证啊
    xwhxbg
        91
    xwhxbg  
       3 月 23 日
    英雄,其实我真的只拿来看生肉日本电影和动漫,绝不是看 JAV
    Brightt
        92
    Brightt  
    OP
       3 月 23 日
    @goodryb 带上下文,设置大比较费 token ,质量也不会显著提升,我测试过几种方案。目前默认这种就是我自己比较满意的
    Brightt
        93
    Brightt  
    OP
       3 月 23 日
    @xwhxbg 你兄弟看是吧
    saaak
        94
    saaak  
       3 月 23 日
    @feidao158 #90 我现在用的 jellyfin 安装 metatube 插件,对小日子的片子刮削挺准的,大部分情况下不用手动修改。你可以看看这个项目怎么做的( https://github.com/metatube-community/jellyfin-plugin-metatube
    feidao158
        95
    feidao158  
       3 月 23 日
    @saaak 好的 感谢老哥,我研究看下,我另外一个想法是通过 ffmpeg 截取视频关键帧,通过这个来识别,不过就跟 OP 说的一样 这个也需要一个庞大的数据库,这个也没有什么公开的 API
    niubi666wodebody
        96
    niubi666wodebody  
       3 月 23 日
    6666
    niubi666wodebody
        97
    niubi666wodebody  
       3 月 23 日
    有去码软件吗
    ccvip
        98
    ccvip  
       3 月 23 日
    谢谢兄弟,我这里有很多的剧场版和学习资料,迫切需要。 另外,有没有可能研发个根据字幕 AI 配音的插件[doge]
    ireqhawk
        99
    ireqhawk  
       3 月 23 日
    @feidao158 你的文件名里应该已经有番号信息了,为什么要舍近求远从字幕内容去分析. 同系列的影片对话应该都大同小异,不好区分
    feidao158
        100
    feidao158  
       3 月 23 日
    @ireqhawk 因为视频下载的来源是四面八方,文件名有可能是个广告或者夹杂着广告的乱七八糟的名字,而我要找出来这一堆信息里的正确的番号再去字幕 api 搜索,我举个例子下载的文件名可能是 xxx.com@abc-edfh.mp4,我需要找出来其中的 abc-edfh ,再拿着这个信息去匹配字幕 api
    1  2  
    关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   5698 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 48ms · UTC 02:02 · PVG 10:02 · LAX 19:02 · JFK 22:02
    ♥ Do have faith in what you're doing.