AI产品狙击手
Browser Use:AI真人般操作浏览器
返回首页
搜索
Browser Use:AI真人般操作浏览器
发表于
2024-12-01
|
更新于
2025-09-15
|
免费AI工具
|
浏览量:
访问入口
文章作者:
Kevin Zhu
文章链接:
https://www.techgogogo.com/2024/12/01/Browser%20Use_AI%E7%9C%9F%E4%BA%BA%E8%88%AC%E6%93%8D%E4%BD%9C%E6%B5%8F%E8%A7%88%E5%99%A8%20/
版权声明:
本博客所有文章除特别声明外,均采用
CC BY-NC-SA 4.0
许可协议。转载请注明来源
AI产品狙击手
!
AI
Computer Use API
上一篇
screen-to-code:设计图直接生成可运行app
将设计图直接转换成app啊!通过Screenshot-to-code这个开源工具,我们只需要提供一张设计图片,mockup或者figma设计稿,它就能将其转换成可执行的代码。 跑起来也相当简单,因为它是支持docker跑的,我们只需要将项目从github上clone下来,然后跑docker-compose up -d –build,就能跑起来了,但是跑之前我们要设置好它背后用到的大语言模型,默认支持OpenAI 和Anthropic,但是我们也可以使用github提供的免费视觉大模型接入,我在上几集视频已经说过怎么用了。 当然,你也可以用ollama的开原模型或者litellm加持的模型,这些我前面视频都有说过了,这里就不赘述了。好,我们跑起来后简单玩下,这里我们先选择好我们希望用的技术栈,有好多选择,比如vue等。然后我们给它提供个网站的截图,很快,一个完全参照截图的HTML + Tailwind应用就完成了,不需要写一行代码。 好,大家喜欢的话赶紧玩起来吧。 访问入口
下一篇
Bolt.new:干翻cursor ai
访问入口
相关推荐
2024-11-29
AutoGLM Chrome 插件:AI真人般控制电脑手机
访问入口
2024-11-29
Claude Computer Use API - 大模型如真人操纵电脑
2025-01-03
Midscene Chrom插件:AI像真人般操作浏览器
通过大语言模型Agent像真人般操作浏览器啊!今天淘到的这个免费AI工具就牛逼了,这是个Chrome插件,叫做midscene.js,我们只需要下达一条命令,它就能和真人一样操作浏览器来完成我们下达的任务。废话不多说,赶紧Demo下… 官网入口
2025-02-18
OmniParser v2:开源AI自动控制电脑完成任务
免费开源AI自动控制你的电脑执行你下达的任务啊。今天要介绍的是微软的OmniParser V2,其实大家如果还记得的话,我接个月前就介绍过OmniParser的v1版本了,这次的升级版本比v1快了60%,能理解更多的屏幕和浏览器上的元素,它的工作原理就是对电脑截屏,然后通过各种视觉大语言模来解析应该操作当前屏幕的哪个位置… Github入口
2025-02-21
OmniParser 2.0:AI控制电脑实现教程!
OmniParser v2 + pyautogui实现自动操作鼠标控制电脑啊!我上两天分享了个OmniParser的视频,没想到喜欢的人还不少。但是omnivision毕竟只实现了屏幕元素坐标解析,要真正发挥功效,还是需要围绕它做点事情的,比如我们不可能只是打开个gradio的ui,每次手动上传个屏幕截图来查看下解析到元素描述坐标地址,如我之前视频中说的,我们的目标应该是这样的… 代码访问入口
2024-11-29
OmniParser:微软AI控制电脑方案
访问入口
Kevin Zhu
AI产品狙击手致力于每天分享最新的大语言模型LLM,文生图模型Stable Diffusion,视频生成模型等AI工具、产品评测和技术趋势,帮助你快速了解并掌握最前沿的AI技术。无论是开发者、产品经理还是技术爱好者,这里都有你需要的内容。
文章
758
标签
599
分类
18
商务合作请联系我
公告
200+免费扣子工作流! 需要的话请联系我并提供你的扣子用户名!
最新文章
3D动画拆解机械原理!复杂知识轻松get!
2025-09-15
一键生成宝宝九宫格图片!即梦实战第51集!
2025-09-15
一键生成爆款书单!扣子免费工作流分享!
2025-09-15
即梦图片4.0!图片编辑提示词!
2025-09-15
小红薯AI运营神器,合规高效MCP!
2025-09-15
☕
✨
✨
✨
为了让网站继续运营
请打赏杯咖啡!
搜索
数据加载中