AI产品狙击手

专注于大语言模型LLM,文生图模型Stable Diffusion, 视频生成模型等免费AI工具的分享和应用,助你掌握最前沿的AI技术

0%

OmniParser 2.0:AI控制电脑实现教程!


OmniParser v2 + pyautogui实现自动操作鼠标控制电脑啊!我上两天分享了个OmniParser的视频,没想到喜欢的人还不少。但是omnivision毕竟只实现了屏幕元素坐标解析,要真正发挥功效,还是需要围绕它做点事情的,比如我们不可能只是打开个gradio的ui,每次手动上传个屏幕截图来查看下解析到元素描述坐标地址,如我之前视频中说的,我们的目标应该是这样的…