OmniParser v2 + pyautogui实现自动操作鼠标控制电脑啊!我上两天分享了个OmniParser的视频,没想到喜欢的人还不少。但是omnivision毕竟只实现了屏幕元素坐标解析,要真正发挥功效,还是需要围绕它做点事情的,比如我们不可能只是打开个gradio的ui,每次手动上传个屏幕截图来查看下解析到元素描述坐标地址,如我之前视频中说的,我们的目标应该是这样的…
Grok3推理模型测评:打败DeepSeek r1?
Grok3 reasoning model推理模型测试报告啊。今天终于发现可以在官网上免费用上Grok3了,鉴于上次在lmarena上测试的是early-grok-3,这次准备在官网上正式测试下,我们这次先测试的是推理模型。去到官网,看到这里已经是grok 3了,选择Think,打开推理模式…
Hacker-News:AI生成顶尖科技播客!
Hackernews自动转播客节目啊!今天淘到个很有意思的AI工具,我们知道Hackernews是海外一个非常著名的技术博客网站,由创业教父Paul Grapham创办YC孵化器,也就是Ycombinater来运营。我以前写博客时翻译过不要Paul的文章的,不过这都是好几年前的事了。对了,现任OpenAI的CEO Sam Altman之前就是YC的掌门人,牛逼吧!好,废话不多说了,今天介绍的这个hacker-news的ai工具呢…
Grok-3:号称宇宙最强大语言模型!
马斯克的号称全球最强大语言模型的Grok 3终于出来了。据称是用了20万张A100训练出来的,我哪个天,据统计我们全国也就50万张A100啊。Grok 3一出来后立刻霸榜各种benchmarks,非推理模型打败deepseek v3 等各种前缘大模型啊!同时他们还推出了推理模型,声称打败openai最新的o3 mini,另外他们除了配备推理模型,还配备了Big Brain和DeepSearch模型啊,big brain是个高推理模式…
Grok-3测评报告:盛名之下其实难副!
马斯克号称宇宙最强的最新大语言模型Grok-3测评报告啊!上一个视频跟大家介绍了xai的grok-3,承诺会在下一个视频测评下,那就来吧。我们来到LMArena,来到direct chat,然后选择early-grok-3模型…
OmniParser v2:开源AI自动控制电脑完成任务
免费开源AI自动控制你的电脑执行你下达的任务啊。今天要介绍的是微软的OmniParser V2,其实大家如果还记得的话,我接个月前就介绍过OmniParser的v1版本了,这次的升级版本比v1快了60%,能理解更多的屏幕和浏览器上的元素,它的工作原理就是对电脑截屏,然后通过各种视觉大语言模来解析应该操作当前屏幕的哪个位置…
知乎直答:满血版DeepSeek r1免费用
DeepSeek R1满血版免费用啊!我们知道国产之光DeepSeek r1火遍全球,奈何官方托管访问量过大及其他原因导致老是出现服务繁忙,自家部署的话有只能部署个蒸馏小参数版本。上个视频我们介绍了如何在AskManyAI上用上满血版的DeepSeek r1, 这一集要跟大家介绍在知乎上怎么用上,我们先去到官网,然后点击这里的知乎直答…
AskManyAI:DeepSeek r1满血版免费用.
.DeepSeek R1满血版免费用啊!我们知道国产之光DeepSeek r1火遍全球,奈何官方托管访问量过大及其他原因导致老是出现服务繁忙,自家部署的话有只能部署个蒸馏小参数版本。今天跟大家介绍一个可以免费用DeepSeek r1满血版的方式…
腾讯ima知识库:接入满血DeepSeek r1
腾讯ima知识库接入满血DeepSeek r1啊。这几天腾讯的ima可谓是当红炸子鸡啊,通过它你可以直接将公众号文章和聊天中的文档以及本地文档加入知识库,然后和这些内容进行对话啊。废话不多说,赶紧Demo下,首先去小程序里搜索到这个ima…
Qwen 2.5 Max:免费生成无水印图片和视频
免费生成无水印图片和视频啊!我在不久前才分享过Qwen2.5-Max,当时测试了基本聊天和写代码能力,performance是超过了deepseek v3的,今天发现我的账号已经可以用它的图片生成和视频生成能力了,所以赶紧给大家demo下。我们来到qwenlm…