1
vacuitym Feb 23
可以用 yolo 自己处理下
|
2
ypx5 Feb 23
不是说 ai 不擅长数数吗
|
3
zooo Feb 23
目前大模型虽然可以识别图,但是识别图加数理逻辑相当差
|
4
DefoliationM Feb 23 via Android
这跟图形处理的模型有关,毕竟先要从图片转成文字,然后再让 llm 处理,现在还是挺难的,麻将这种 2 符号的还没法用 ocr 处理,只能纯图片转文字处理。
|
5
Yishanshan Feb 23
|
6
Rehtt Feb 24
gemini3pro:
多牌: 没有发现多余的牌(如空白牌或百搭牌)。 少牌: 没有花牌。另外,建议你实物确认一下 “南风” 和 “北风” 是否各有 4 张,虽然大概率是压住了,但这是图片中唯二没能一眼看全 4 张的牌种。 |
8
johguse Feb 24
ios 有个 app ,磁场麻将 ai ,可以尝试一下
|
9
cwxiaos Feb 24 via iPhone
印象中谁说过,语义空间的描述不够详细,举了个例子:给一张照片,用语言尽可能详细的描述,随后问的问题由于语言上描述的内容信息丢失而无法回答
这也是 clip 等模型的问题,由于视觉语义转换到文本语义空间导致信息丢失 以上内容是别人说的 |
10
woolong800 Feb 25
能做个基于 ai 眼镜的扑克记牌器吗?只需要记录出过的牌,以及剩下的牌就行了。
|
11
tt83 Feb 25
这就是概论模型,让它数多少张牌都数不清,要查清少了哪张更不行
|
13
boycem Feb 25
|
15
Oldletter Feb 26
这个不是 llm 大模型擅长的,还是要靠自己标注然后做训练,麻将的万字牌训练时候还是比较麻烦的,尤其是这种视角
|