V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  nocmt  ›  全部回复第 1 页 / 共 10 页
回复总数  191
1  2  3  4  5  6  7  8  9  10  
23 小时 16 分钟前
回复了 pricky777 创建的主题 Android Vibe 了一个 APP,用于根据 WiFi 状态切换 🪜
@pricky777 #33 弄分流呀,现在规则很完善了,白名单机制国内完全不走代理。
不如弄路由器,家里公司都弄上就没个事情,并且还更稳定。
3 月 25 日
回复了 mangoDB 创建的主题 程序员 Windsurf 计费方式发生巨大变化
走 cursor 、trae 的路呗
3 月 25 日
回复了 nomisk 创建的主题 程序员 跨端技术应该入坑哪个
Flutter +6 ,一把梭全干完,反正都让 AI 写。
3 月 23 日
回复了 lyfxmw 创建的主题 职场话题 老板发话了,所有开发人员晋升 ai 工程师
@leegradyllljjjj 就是,以前一个功能做三天,现在 1 天做几十个功能还要稳定上线,所有事情都是自己干。

出问题了还要自己背锅。
3 月 23 日
回复了 Brightt 创建的主题 分享创造 撸了日本小电影提取字幕并翻译的工具
实时字幕: https://subflowai.nocmt.com/
音视频生成字幕: https://apps.nocmt.com/miman/
目前已支持 Windows 和 macOS ,

安卓最近的更新日志:

2026 年 2 月 27 日 V1.2.5
● 翻译模型预设新增 HY-MT1.5-1.8B(LLM)
● 优化网络连接复用逻辑,提升识别和翻译速度
● 新增悬浮窗在屏幕旋转后宽度自适应功能,保持内容显示完整
● 调整沉浸式模式下悬浮窗高度和文本显示行数
● 阿里 Gummy 添加强制 VAD 断句,避免长时间转录导致字幕显示不完整

2026 年 2 月 23 日 V1.2.4
● 优化实时翻译通知显示和停顿检测参数,提高识别准确率
● 语音识别调用时增加提示词和热词传参,提高识别准确率
● 语音识别新增阿里 Gummy 付费模型,提高识别实时性
● 修正语音识别花费统计的累计计算错误
● 增加机型判断,Meta Quest2 、3 上不支持悬浮窗类型和麦克风拾音功能

2026 年 2 月 21 日 V1.2.3
● 添加 7 天免费试用功能
● 为设置页面的 URL 输入字段添加提示文本
● 语音识别和翻译模型新增预设内容,简化选择
● 语音识别密钥增加帮助指引(硅基流动)
● 首页新增文本翻译功能页面,可直接输入文本进行翻译
● 悬浮窗类型增加沉浸开关,视频观看更简洁

2026 年 2 月 8 日 V1.2.2
● 优化首页和保存字幕时的时间显示为启动后相对时间
● 优化首页通话拾音弹窗、设置保存失败弹窗排版
● 优化设置保存进度效果和下拉框组件样式
● 设置页面语音识别、文本翻译增加延迟测试功能
● 设置页面部分设置项隐藏并增加恢复默认值逻辑
● 优化设置页面部分组件美观度

2026 年 1 月 22 日 V1.2.1
● 悬浮窗类型字幕优化为流式显示
● 修复字幕出现的乱码问题

2026 年 1 月 18 日 V1.2.0
● 优化网络连接配置以提升连接复用
● 优化默认提示词,增强翻译质量
● 激活码新增过期时间显示
● 优化稳定性和修复已知问题

2026 年 1 月 14 日 V1.1.4
● 适配硅基流动 ASR 服务,建议用 TeleAI/TeleSpeechASR 、FunAudioLLM/SenseVoiceSmall 两个免费模型
● 设置页面版本号显示修改获取逻辑
● 支持启动时检查应用更新,支持手动下载覆盖安装
超过 1 个月都没有兑换完,剩余激活码已作废,后续需要的,请小红书联系购买。
@korvin #17 你要有时间的话,可以给你开腾讯会议远程调试一下。联系我 bm9jbXRvbmVAZ21haWwuY29t
@korvin 输出不用选 BlackHole 2ch (输入选这个)
,另外查看系统设备的 麦克风音量显示那边有没有变化

手机这边有没有允许麦克风输入?要给浏览器权限和这个页面麦克风权限。看你手机截图貌似没有开启麦克风
@paopjian 也不多,主要是指令要明确(起码看得懂代码),然后就搞定了。
@aresyang 最近好多 AI 语音输入法,所以才有这个想法,另外主要是这些输入法可以解析音频修改后输出。
1 月 16 日
回复了 seven777 创建的主题 奇思妙想 我有这个需求,请教老师们如何实现较好
总结一下,建议本地运行相关大模型,不然费用非常非常高(毕竟语音识别按秒收费)。
2026 年 1 月 13 日 V1.1.3
● 新增字幕显示方式:双语、仅原文、仅译文
● 优化音频采集转录逻辑,使用流式处理替代文件读写,显著降低功耗并提升性能
● 优化悬浮窗显示效果

2026 年 1 月 12 日 V1.1.1
● 修复语音识别使用云端模型时保存配置检查报错问题
● 修改默认文本翻译配置为硅基流动
● 设置页面新增目标语言选择(支持多种常见语言)
● 语音识别新增过滤无效词处理

2026 年 1 月 10 日 V1.1.0
● 新增麦克风拾音功能,支持系统音频/麦克风切换
● 新增软件激活功能
● 新增粤语识别支持
● 适配无障碍服务以支持通话音频录制
● 优化权限检查流程和提示
@metalvest 提供部署或者对接服务,你用云端的也可以,自己搭建主要是不要钱。
我也接受收费协助部署后端服务(包含 ASR 和 LLM ),10 块钱就行。
1  2  3  4  5  6  7  8  9  10  
关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   5497 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 22ms · UTC 08:47 · PVG 16:47 · LAX 01:47 · JFK 04:47
♥ Do have faith in what you're doing.