终于,nano banana 正式开放 api 了!
现在大家不仅可以直接在 Google AI Studio 里基于 Nano Banana,手动搓出属于自己的 App,还可以通过 Gemini API 接入任意发挥了。
根据官方定价,接入 API 后,每张图片大约需要花费 0.039 美元(约 0.28 元)。
与此同时,为了贴合实际生产需求,谷歌还加了两个超级实用的新功能:
画幅比选择和纯图像生成模式。
新增更适合纯视觉场景的新功能
让我们先来看看这两个功能——
首先,终于能自定义画幅比了。
横屏的电影级大片、方形的社交媒体封面、竖版的短视频封面……
不再只有呆呆的方形 1:1,从 16:9、9:16、4:3 再到 3:2,共有十多种宽高比随你挑选。
直接在 AI Studio 就能选择设置,在对话中,Nano Banana 会始终遵守这个要求。
第二个新功能,是开始支持纯图像输出模式,只返回图像,不附带多余文本。
这样不仅能节省 token,还能避免冗余上下文干扰,更适合 App 内实时预览、电商展示、设计工具等纯视觉场景。
可以说,两个新功能都在朝内容创作者的心巴打——看来,谷歌的确在进一步把 Nano Banana 推向实用工具定位。
还有很重要的一个更新,那就是Nano Banana 这次终于开放 API 了。
这意味着开发者可以直接将 Nano Banana 嵌入自家产品,企业也能批量调用 API,实现大规模内容生产。
(注:API 的接入与使用方法详见谷歌开发者手册)
如果不想走复杂的配置流程,Google AI Studio 依然可以继续使用该模型。
进入 AI Studio 的 Build 板块,输入 Prompt 即可 DIY 应用。
例如,告诉它 " 基于 Nano Banana 为我构建一个带滤镜的图像编辑应用 ",等待片刻,就能得到自己的专属 App。
目前,官方给出了 Nano Banana 的 API 定价——
每 100 万个图像输出 token 的价格为 30.00 美元(约 210 元)。
已知生成单张图片最大尺寸为 1024x1024 像素,约消耗 1290 个 tokens,折算下来相当于每张图片 0.039 美元(约 0.28 元)。
值得注意的是,图像生成的价格是 Gemini 2.5 Flash 文本模式的12 倍。
更新之后,实测新功能
接着我们来看看,脱离了 1:1 的方框束缚,Nano Banana 生图解锁了啥样的全新可能——
先看 16:9。
横屏画幅能容纳更多环境细节,带来更强的沉浸感。
因此,这也是现代视频和显示设备的主流比例。
Prompt:一张关于风光大片的照片 内容为一位背包客埋头赶路 穿行在夕阳下的群山与湖泊之间 场景位于广阔的山峦与平静湖面前 背景是橙色霞光逐渐褪入深蓝夜空 湖面倒映着天空的色彩 氛围壮丽沉浸充满电影感 在日落时分的自然柔光下拍摄 使用 Nikon Z7 II 相机 16mm f/2.8 广角镜头 色彩风格为高细节高分辨率的电影级调色 画面比例为 16:9
再看 9:16。
这是专为手机竖屏设计的比例。
大多数人在日常生活中与它的接触时间最多,它能铺满整个手机屏幕,是最能抓住注意力的画幅比。
Prompt:一张人像照片,内容为一名中国女生在富士山下摆姿势拍摄。人物占据画面主要比例,背景是巍峨的富士山与蓝天白雪,充满整个画面。场景突出了人物与山峰之间的对比,营造出清晰震撼的氛围,带有旅行大片的质感。在自然白天阳光下拍摄,使用 Sony Alpha 7R IV 相机搭配 85mm f/1.4 镜头。色彩风格为高饱和度、明亮清晰的社交媒体风格。画面比例为 9:16。
4:3。
它是早期电视和电脑的标准比例,许多老电影、老电视节目都用它呈现,贯穿了不少人的童年(糟糕暴露年纪了)。
使用 4:3 时,往往能带出一股独特的怀旧味道。
虽然如今它已基本
被 16:9 取代,但在需要营造「梦核感」时,4:3 是绝佳的表现手法。
Prompt:一张关于梦核风格的照片 内容为一位少女独自站在空旷的街角 背景是泛着昏黄灯光的便利店与模糊的广告牌 场景呈现出似真似幻的都市夜晚 氛围怀旧迷离带有孤独感与不真实的怀旧气息 在深夜路灯与霓虹交织的光线下拍摄 使用 Nikon Z7 II 相机 50mm f/1.4 镜头 色彩风格为低饱和度带有颗粒质感的梦核风格 画面比例为 4:3。
最后是 3:2。
听上去或许有些陌生,但它其实是最接近人眼视觉的比例,因此在传统相机里非常常见。
3:2 的优势在于构图灵活,可横幅展现山川辽阔,也能竖幅突出天空延伸,后期裁切空间大,非常适合风景摄影。
Prompt:一张以 3:2 画幅比例拍摄的风光照片。画面展现辽阔的高原草地,远处雪山与天空相接,前景蜿蜒的河流引导视线延伸至地平线。沐浴在清晨金色的阳光下,氛围柔和、清澈而明亮。构图开阔且灵活,既可横幅展现山川的壮丽,也可竖幅裁切突出天空与地平线的延伸感。使用徕卡 M11 相机搭配 35mm f/1.4 镜头拍摄。色彩调校强调高分辨率、细节丰富,并呈现自然的摄影风格。
One More Thing
这几天,Reddit 上的网友们为了一条 Sora 邀请码可谓是吵得锣鼓喧天,甚至有人顺势做起了小生意,一条能卖到 10 美元以上。
但截至目前,Gemini 依旧稳坐苹果 App Store 最受欢迎 AI 应用的宝座。
短视频版 GPT,并没能撼动它的地位。
参考链接:
[ 1 ] https://x.com/googleaidevs/status/1973781293977735435
[ 2 ] https://t.co/e0Lt53qauy
[ 3 ] https://ai.google.dev/gemini-api/docs/pricing?hl=zh-cn
一键三连「点赞」「转发」「小心心」
欢迎在评论区留下你的想法!
— 完 —
年度科技风向标「2025 人工智能年度榜单」评选报名开启啦!我们正在寻找 AI+ 时代领航者 点击了解详情
企业、产品、人物 3 大维度,共设立了 5 类奖项,欢迎企业报名参与
一键关注 点亮星标
科技前沿进展每日见
文章推荐更多>
- 1帝国cms怎么上传大文件
- 2mysql数据库使用什么语言
- 3uc浏览器怎么退出登录 uc浏览器账号退出登录方法一键搞定
- 4mongodb数据类型有哪些
- 5台式电脑怎么开机 台式机开机步骤详解
- 6wordpress怎么把所有文章分类单独在一个页面显示
- 7邮件服务器防护:Postfix反垃圾邮件配置
- 8mysql跟sqlserver哪个好
- 9MacBookPro恶意软件检测:内置工具与第三方软件结合
- 10wordpress怎么做固定链接
- 11mongodb安装失败的原因有哪些
- 12phpmyadmin怎么导出
- 13谷歌浏览器在线浏览入口 谷歌浏览器在线观看网页
- 14oracle的删除语句怎么写
- 15国内有哪些比较知名的wordpress主题开发网站
- 16oracle监听怎么开
- 17电脑定时关机搭配UPS电源:断电场景下的自动保护机制
- 18oracle怎么查询存储过程最近编译时间的数据
- 19oracle如何修改端口
- 20wordpress怎么更换域名
- 21wordpress叫什么
- 22mysql主要用来做什么
- 23夸克浏览器怎么找网站 快速找到网站的实用方法分享
- 24哪个浏览器没有安全限制 不用安全检查的浏览器TOP10推荐
- 25oracle数据库怎么备份表结构
- 26怎么给oracle用户授权
- 27电脑怎么连接蓝牙耳机 蓝牙音频设备配对教程
- 28redis读写分离怎么实现
- 29蓝屏代码0x000000a 0x000000a蓝屏错误的原因分析
- 30oracle数据库备份方法主要有哪几种
