谷歌最新发布了gemini 2.5 flash,这应该是他们最具性价比的推理多模态模型了。可以输入音频视频和文字,有着百万tokens的context window,针对不同的思维策略进行校准,从而获得更准确的输出。另外一个以前没有见过的是它可以调整推理时消耗的tokens的多少,以防推理使用过多的tokens。也就是可以让它思考久一点或者快一点。API 调用的话,它的百万tokens输入价格是15美分,输出是60美分,比起OpenAI和Claude那些动不动就是美元甚至10美元为单位的推理模型,这个模型可谓是非常便宜的了…
Gemini 2.5 Flash:炸裂功能及测评报告!
请我喝杯咖啡
视频服务器成本高,请多支持我
视频服务器成本高,请多支持我