关于业务AI升级的几个疑问请教各位大佬:1、视觉图片识别开源模型哪个合适?2、OCR识别哪家开源模型做得好?3、小型应用什么工具开发比较好?
-
看来大家都开始用ai来审查ai生成的图片了,我后期想的是工作流打通后可以用解码的方式去抽取生成的视频的某些帧审查人物有无畸变,有没有多根手指那些,开发一个专门的工作流。看了零度解说,图片识别最强的还是claude code 的神话模型(唯一 一个可以准确识别筷子数量的图片模型),你可以去看一下他的视频就在最近几期。

-
看来大家都开始用ai来审查ai生成的图片了,我后期想的是工作流打通后可以用解码的方式去抽取生成的视频的某些帧审查人物有无畸变,有没有多根手指那些,开发一个专门的工作流。看了零度解说,图片识别最强的还是claude code 的神话模型(唯一 一个可以准确识别筷子数量的图片模型),你可以去看一下他的视频就在最近几期。

-
看来大家都开始用ai来审查ai生成的图片了,我后期想的是工作流打通后可以用解码的方式去抽取生成的视频的某些帧审查人物有无畸变,有没有多根手指那些,开发一个专门的工作流。看了零度解说,图片识别最强的还是claude code 的神话模型(唯一 一个可以准确识别筷子数量的图片模型),你可以去看一下他的视频就在最近几期。

-
@mei-li 0度 算是 YT 科技圈的 大V了, 百万的粉丝.
我向他投稿过, 就是 hermes agent windows 原生版本. 他没采纳.
他做的视频,主要给那些想白嫖的软件技巧,我感觉他技术水平一般.
推广什么软件, 自己搞一套多好.
等hermes agent 官方出了 Windows 版本,
他还还说 这不是第三方的集成的
他还不知道, hermes agent Windows 核心代码 ,是我提交给官方的.

-
这个你应该尝试下 构建本地的workflow, 别想着一次性, 能做完.
我曾经也想过 调用一次,就能成功.
在线API模型, 有AI审查,有时候图片没有违规,他也拒绝回答.
本地开源模型, 这个倒是很好,但是 模型能力太肉.
这真是一个两难的选择.
-
hermes agent ,他定位 就是个人助手, 其实企业级我们一般不会用.
原因是主要是风险不可控. 公司小,还行.
好多都是电商公司,就老板和老板娘两个人.但是上市公司,一般不敢用这个.
主要是怕数据泄漏. 个人无所谓了. -
@mei-li 0度 算是 YT 科技圈的 大V了, 百万的粉丝.
我向他投稿过, 就是 hermes agent windows 原生版本. 他没采纳.
他做的视频,主要给那些想白嫖的软件技巧,我感觉他技术水平一般.
推广什么软件, 自己搞一套多好.
等hermes agent 官方出了 Windows 版本,
他还还说 这不是第三方的集成的
他还不知道, hermes agent Windows 核心代码 ,是我提交给官方的.

-
@mei-li 0度 ,这种百万粉丝的 博主, 基本后面都有团队, 团队给他稿子和素材, 他是出镜的那个人.
他一个月 10w的美子 ,进账.
绝对不是他一个人,能做到的.
这种每天日更, 一个人很难的.
-
你简单这样测算把, 假如 千展 3美金的单价.
10万播放, 3000美子.他那么多视频, 每天都会复利 , 这赚钱 一天 3000美金很容易 .
一个月下来, 10w美子 很轻松.
懂行YT的 ,来看看我的测算对吗?
