大家好,我是老张。
最近总有人问我:“老张,谷歌的Gemini到底怎么用?和ChatGPT比哪个强?听说还能帮我干活,是真的吗?”
说实话,Gemini这两年的进化速度确实惊人。从最初的聊天机器人,到2026年已经变成了一个横跨手机、电脑、办公软件、开发工具的完整AI生态系统。但正因为它功能太多,很多人反而不知道从哪下手。

今天我就把Gemini的使用方法从头到尾捋一遍——从入门到精通,从免费到付费,从普通用户到开发者,看完这篇你就能玩转Google的AI全家桶。
一、Gemini是什么?先搞清楚概念
很多人搜“Google Copilot AI”,其实找的就是Gemini。谷歌已经把所有AI助手功能统一到了Gemini品牌下,包括:
Gemini App:手机和网页端的对话助手
Gemini in Workspace:内嵌在Gmail、Docs、Sheets里的AI功能
Gemini in Chrome:浏览器的AI侧边栏
Gemini API:开发者调用的模型接口
Gemini CLI:开源的命令行智能体
简单说,Gemini不是“一个工具”,而是一套AI能力,遍布你用的谷歌服务。
二、版本选择:免费版够用吗?该不该付费?
2026年3月,谷歌调整了订阅体系,现在分为四个层级:
免费版
核心模型:Gemini 3 Flash(日常够用)
上下文窗口:32,000 tokens(约50页文本)
每日配额:Pro模型基础访问、5次深度研究/月、20张图像生成/天
适用人群:偶尔问问问题、写写文案的普通用户
Google AI Plus
价格:未明确(介于免费和Pro之间)
上下文窗口:128,000 tokens
核心提升:Thinking模式90次/天、Pro模式30次/天、深度研究12次/天
适用人群:轻度依赖AI的创作者
Google AI Pro(原Google One AI Premium)
价格:19.99美元/月
上下文窗口:1,000,000 tokens(约1500页文本或3万行代码)
核心提升:Thinking模式300次/天、Pro模式100次/天、深度研究20次/天、图像生成各100次/天
额外福利:2TB云存储、Gmail智能撰写、Google Photos高级编辑、NotebookLM Pro权限
适用人群:重度使用者、内容创作者、小团队
Google AI Ultra
价格:249.99美元/月
上下文窗口:同Pro(但配额更高)
核心提升:Thinking模式1500次/天、Pro模式500次/天、Deep Think 3.1(19.2万token深度推理)、Agent功能200次/天
额外福利:30TB存储、YouTube Premium、最高级浏览器自动浏览权限
适用人群:企业级用户、开发团队
老张建议:如果你只是偶尔用用,免费版完全够用。如果你每天都要处理长文档、写大量内容,可以考虑Pro版。Ultra版除非是团队用,个人没必要。
三、基础篇:怎么用Gemini App?
手机端使用(以Galaxy手机为例)
第一步:唤醒Gemini
长按手机侧键,即可唤出Gemini界面
需要Android 10以上系统,建议Android 15+ One UI 7.0以获得最佳体验
第二步:上传文件提问
长按侧键唤出Gemini
点击输入框旁的加号图标
选择:相机(拍新照片)、图库(选现有图片)、文件或云端硬盘(上传文档)
附加内容后输入问题,Gemini会根据你上传的内容回答
第三步:使用Gemini Live(实时对话)
Gemini Live是2026年的重磅功能,支持屏幕分享和相机实时画面:
唤出Gemini后,点击麦克风旁的直播图标
选择:相机(让对方看到你眼前的实物)或分享屏幕(让对方看你手机界面)
边展示边提问,比如拍一个路由器问“这个怎么设置?”
可随时暂停对话,点X结束
适用场景:
拍家电问使用技巧
分享YouTube视频链接,问“这个视频里用了什么食材?”
模拟面试:上传职位描述,让Gemini扮演面试官
创意会议:上传草图让AI帮忙深化概念
网页端使用
访问 gemini.google.com 直接用,功能基本和App同步。
四、进阶篇:Gemini在办公软件里怎么用?
这是Gemini最值钱的部分——AI直接嵌在你工作的地方,不用来回切换窗口。
Gmail里的Gemini
智能撰写:
写新邮件或回复时,点击底部工具栏的 “Help me write”
输入你的意图,比如“确认收到方案,建议周五前给反馈,语气友好”
Gemini生成草稿,你可以直接修改后发送
邮件线程总结:
打开超长邮件链,右侧侧边栏会显示“总结此邮件”按钮
一键生成要点摘要,不用翻几十封邮件
Google Docs里的Gemini
Ask Gemini侧边栏:
打开文档,点击右上角 “Ask Gemini”
输入指令,比如:
“总结这篇文档,用三个要点”
“重写第二段,让它更简洁”
“为这篇文章拟三个标题”
满意后点击 “Insert” 直接插入文档
实用技巧:给Gemini设定角色效果更好——“你是我编辑,把这段话压缩到100字,保持所有数据,语气自信但友好”。
Google Sheets里的Gemini
AI公式助手:
选中数据区域,问“计算每个月的平均销售额”
Gemini自动生成公式
不懂公式也能做数据分析
数据洞察:
问“这个表格里有什么趋势?帮我总结三个洞察”
AI分析数据并给出文字结论
Google Slides里的Gemini
输入主题,AI帮你生成大纲和演讲者备注
快速从零搭建演示文稿
Google Chrome里的Gemini
浏览器右上角点击Gemini图标,打开侧边栏,你可以:
网页总结:
“总结当前页面,用五个要点”
“提取这篇文章的核心数据和结论”
多标签对比:
“对比我打开的这几个商品页面,列出价格、评价、优缺点”
“从这些旅游攻略里整理一份三日行程”
自动浏览(Pro/Ultra用户):
“帮我填这个表单,信息用我保存的资料”
“在这几个网站里找最便宜的机票”
需授权确认,AI一步步执行
五、开发者篇:Gemini API怎么用?
如果你是开发者,想自己开发AI应用,需要用Gemini API。
获取API密钥
点击“Get API key”
创建新密钥,立即复制保存(只会显示一次)
设置环境变量:
export GEMINI_API_KEY=你的密钥
安装SDK
pip install -U google-genai # Python
npm install @google/genai # Node.js
基础调用示例
from google import genai from google.genai import types client = genai.Client() response = client.models.generate_content( model="gemini-3.1-pro-preview", contents="解释Gemini 3.1 Pro和前代的主要区别", config=types.GenerateContentConfig( thinking_level="high" # 深度推理模式 ) ) print(response.text)
核心参数说明
thinking_level: “low”(快速响应)或”high”(深度推理),默认high
temperature: 建议保持1.0,降低会影响推理质量
maxOutputTokens: 最多64k
responseMimeType: “application/json”(结构化输出)
responseJsonSchema: 定义返回格式
多模态调用
import base64 with open("diagram.png", "rb") as f: image_bytes = f.read() response = client.models.generate_content( model="gemini-3.1-pro-preview", contents=[ "分析这个系统架构图,提出优化建议", { "inline_data": { "mime_type": "image/png", "data": base64.b64encode(image_bytes).decode() } } ] )
高级特性
Thought Signatures:在多轮函数调用中保持状态,返回的签名需在下一轮请求中包含,否则会报400错误。
Function Calling:自定义工具,让AI调用外部API。
Structured Outputs:用JSON Schema定义输出格式,直接得到结构化数据。
六、极客篇:Gemini CLI命令行智能体
2026年,谷歌开源了Gemini CLI——一个能在终端里帮你干活的AI智能体。
它能干什么
软件开发:自动构建网站功能、创建数据仪表盘、设置GitHub Actions代码审查流程
创意任务:从多媒体文件生成社交媒体内容、整理学习资料
文件操作:访问本地文件系统,跨服务协调(GitHub、Canva、Google Workspace)
典型应用
开发网站功能:“为AI会议网站创建一个议程展示页面”
数据分析:“结合本地CSV和云端数据,创建交互式仪表盘”
学习辅助:“整理这些课程材料,生成复习提纲”
适合有一定命令行基础的技术玩家。
七、进阶技巧:Personal Intelligence个性化智能
2026年1月,谷歌推出了Personal Intelligence功能,让Gemini能访问你的Gmail、搜索历史、YouTube活动等数据,提供更个性化的回答。
如何开启
打开Gemini App
点击右上角个人头像
选择 Personal Intelligence
点击开启,并设置权限(可选控制哪些谷歌应用可以被访问)
能做什么
“帮我找到上个月邮件里提到的那个会议时间”
“根据我看过的YouTube视频,推荐类似内容”
“记得我上次搜的那家餐厅吗?帮我订个位”
目前仅限美国区Pro/Ultra用户,免费用户“soon”会开放。
八、避坑指南与实用建议
1. 免费版够用,重度用再付费
大多数人的日常需求,免费版完全能覆盖。只有当你每天都要处理长文档、高频生成内容时,才考虑Pro版。
2. 提示词要具体
别只说“帮我写个文案”。试试这个格式:
你是我编辑。把这段话压缩到100字,保持所有数据,语气自信友好,目标读者是CEO。
3. 注意网络环境
部分功能(如Personal Intelligence)目前仅限美国区。国内用户使用时需注意合规要求。
4. 保护隐私
虽然Gemini强调隐私保护,但敏感信息(身份证、银行卡)最好别上传。企业用户建议用Vertex AI版本,有数据隔离保障。
5. 多模态很强大
拍照问问题、上传PDF让总结——Gemini最强的不是纯文本,而是图文混合理解。多用这个能力。
6. 关注配额
免费版有每日次数限制,Pro版也有配额。使用Gemini App时可以在设置里查看剩余配额。
九、写在最后:Gemini适合谁用?
如果你:
日常用Gmail、Docs、Chrome——Gemini能让你效率翻倍
偶尔需要AI帮忙写东西——免费版就够了
重度内容创作者——Pro版值得投资
开发者想自己搭AI应用——API功能强大
技术极客——CLI工具很好玩
2026年的Gemini,已经从一个“聊天机器人”进化成了无处不在的AI助手。它不追求“最会聊天”,而是追求“在你需要的地方出现”。
用好它,你会发现自己不知不觉就快了很多。
如果你在使用中遇到问题,或者有独门技巧想分享,欢迎在评论区留言。咱们一起交流,一起在AI时代找到自己的节奏。
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...




