AI产品狙击手

专注于大语言模型LLM,文生图模型Stable Diffusion, 视频生成模型等免费AI工具的分享和应用,助你掌握最前沿的AI技术

0%

Mistral ai 重大更新啊!我们知道我们可以通过LeChat免费使用Mistral AI,最近发现它的功能做了重大更新,输入框下方展开后可以发现提供了更多功能,如canvas、web search,image generation和code interpreter等,openai收费不收费的,它都免费提供了…

谷歌开放最新Imagen3的API调用啊!我们知道我们可以到google labs上免费用imagen3,但是它们一直没有开放API出来让大家基于它来开发自己的app。而谷歌这次的开放相信对开发者来说是期盼已久了。因为imagen3在文生图领域的排名是最前的。大家可以去LM Arena上看下,这个排名是盲测排名来的…

大语言模型哪家强?怎么快速获取大语言模型的排名!这集主要是想跟大家分享两个工具,来让大家快速掌握当前最前缘的大语言模型的排名和使用情况。第一个是LLM Arena,通过这个工具我们能快速知道当前得分最高的大语言模型是哪些。这里的排名都是通过盲测得到的,绝对公平。盲测的意思就是同时给不同的隐藏名字的大语言模型相同的输入,然后网友人居他们的输出打分来得到的。另外一个就是OpenRouter的LLM Rankings…

谷歌推出最新Gemini 2.0免费用啊,这次Gemini总共推出了3个版本,2.0 Flash, flash-lite,以及pro版本,近期还会推出推理模型。flash模型会有100万上下文窗口,而pro则是200万,同时flash和pro据称将会在下周支持上图片生成。这些模型的performance是异常惊人的,大家可以到LM Arena竞技场上查看,前两名都是gemini的,接着是GPT-4O-latest和DeepSeek-R1,紧跟着又是Gemini的,所以说他霸榜并不为过。大家可以在谷歌的AIStudio上免费用上这些模型…

OpenAI 给免费用户开放搜索和推理功能,直接取代掉Perplexity啊!我知道搜索功能推出有段时间了,但是一直没有全部覆盖到免费用户,但今天我用我一个免费账号试了下,已经可以用上了。 而推理功能是最新的,估计是迫于DeepSeek R1的压力才推出的。这两个功能就算你不登录,只是临时聊天也是可以用上的。快速去Demo下…

首先,我们看数据,V3训练用了2788K的GPU Hours,相当于一块GPU用了近300多年,而他们用了2000块GUP,所以用了越2个月时间就训练出来了。对比下LLama 3.1 405B, 它们用了近3100万个GPU Hours来训练,deepseek的11倍还多,同时还要考虑deepseek用的GPU肯定是没有人家老美的性能好的,这也就是为什么V3的训练花费比海外这些同等级别模型低几个数量级的原因,从而打破老美的算力霸权,也打破了顶尖大模型只能掌握在OpenAI和谷歌这些屯了大量卡的大公司的垄断…

通过一张图片和音频生成全身的能说话的人物视频啊!图生视频我们看得多了,但是生成的都是没有声音的视频,后期还需要自己通过其他工具加入语音和唇形同步,字节跳动的这个OmniHuman就牛逼了,它是个多模态模型,你可以提供不同输入来生成视频,比如提供图片加音频加肢体动作信息来生成和真实视频无异的视频…

50万个免费AI工具任你用啊!大家知道我每天都会分享一个免费AI工具的使用经验,这些工具其中一个很重要的来源就是Hugging Face的space,比如以前分享过的Stable Diffusion 等。要使用这些免费AI工具,我们呢来到huggingface…

这几天发了不少DeepSeek的视频,看到有不少同学对V3和R1的关系不是很清楚,这里简单说下我自己的理解。首先,我们要知道大语言模型的训练最开始是用各种网络数据训练出能对语言有基本理解的模型,这通常叫做预训练过程,得出来的模型通常叫做Base Model,比如这里的DeepSeek-v3就是个base model,这个base model就像一个打破任督二脉的武林高手,一身知识和内功,但是不懂怎么运用…