Nexa AI OmniVision:本地部署多模态大模型
发表于|更新于|免费AI工具
|浏览量:
文章作者: Kevin Zhu
版权声明: 本博客所有文章除特别声明外,均采用 CC BY-NC-SA 4.0 许可协议。转载请注明来源 AI产品狙击手!
相关推荐
2024-11-29
Claude Analysis Tool-Claude最新在线编码解析文档功能
访问入口
2024-11-29
Claude Computer Use API - 大模型如真人操纵电脑

2024-12-12
Gemini 2.0:6大原生多模态炸裂新功能
Gemini 2.0 原生多模态模型炸裂功能初体验啊!它在benchmarks上有多炸裂我这就不说了,这里是迫不及待的想和大家分享它的几个炸裂功能。首先,我们进入到谷歌ai studio上进行gemini 2.0的访问,免费的credits足够我们用的了。先试下第一个功能实时语音, Hi Gemini, how are you, (Hi,I am doing great , thanks for asking, how can I help you today) can you speak faster please, (sure , …..), can you speak in a way that you are so quiet and whispering?(回答: ….) 牛逼吧? 第二个功能,视频对话。 can you let me know what i am holding now, and count number of items。 (回答:。。。。) 第三个功能,屏幕分享。 what do you see in my screen, ( i can ...

2024-12-14
Grok:马斯克最新图片生成AI免费用!
马斯克的Grok最新图片生成模型免费用啊! 之前Grok接入的是Flux 1.1, 估计是用的人太多成本太高,所以Grok推出了自己的模型,原来是叫做Aurora的,后来干脆直接叫做Grok图片生成器。 我们进入X后,打开Grok,我们就可以免费生成图片了,比如“生成一张奇幻深林图片,有着发光的蘑菇和飞翔的精灵” 我们可以看到图片加载不再和以前一样由模糊变清晰,而是从上到下,所以这个模型很有可能用的不是diffusion model 从它的官网博客也能印证这一点,用的是自回归的MoE之类的。这个就不深究了,大家喜欢的赶紧用起来吧。 最后别忘记给我点赞关注分享! 访问入口

2024-12-22
Kimi视觉推理大模型:差评!
看网上都在吹Kimi的视觉推理大模型,说得神乎其技,可以取代OpnAI 200刀每月的专业版之类的,真有这么厉害吗?这里我们也来快速测试下。 首先,我们来个简单都英语填空题,这种题一般的大模型都能做对,本来就是大语言模型的强项,仅作为最基本验证,它也是没有问题的。 再看第二道题,来个脑筋急转弯,分析推理确实是一大堆的,答案也和预期一样,但是它是实打实的脑筋不转弯都从语言学等角度得出的答案,其实这里在中文语境中用脑筋急转弯思路就能很快得出答案,太阳公公嘛,那太阳肯定是男都啰。况且太阳叫做sun,儿子也读作son,也能得到印证。所以我推定它是不适合做脑筋急转弯的,起码不适合做中文的脑筋急转弯。 下一道数学题,“一口井7米深,有只蜗牛从井底往上爬,白片爬3米,晚上下坠2米。问蜗牛几天能从井里爬出来?”这里要注意解题的关键点是最后一天可能它不会滑下来了。我们看它分析,前几天都没有问题,第四天,白天爬3米,就是到了6米,晚上滑下来2米,到了第4米,第五天,白片爬3米,4+3刚好7米,所以就爬出来了,就不用考虑晚上往下滑了。所以答案是5天就能爬出去。我们看它最终做了一大堆装模作样的推理...
2024-11-29
MaaS开放平台深体验:强大工具模型开发实战
访问入口

Kevin Zhu
AI产品狙击手致力于每天分享最新的大语言模型LLM,文生图模型Stable Diffusion,视频生成模型等AI工具、产品评测和技术趋势,帮助你快速了解并掌握最前沿的AI技术。无论是开发者、产品经理还是技术爱好者,这里都有你需要的内容。
商务合作请联系我公告
200+免费扣子工作流! 需要的话请联系我并提供你的扣子用户名!