主题
XAI-Grok模型
📋 简介
Grok 是由 Elon Musk(埃隆·马斯克) 创立的 xAI 公司开发的大语言模型,目标是“最大程度追求真理”并帮助人类理解宇宙。
它不像很多模型那样过度“政治正确”或设限严格,风格更直接、幽默,有时会带点毒舌和不羁。Grok 从设计上就试图减少常见的 AI 审查和刻板回答,目前最新版本的:推理、代码、数学、长文本理解等能力都进入第一梯队。
🚨 马斯克是谁?
现在站在你面前的是:“美国一字并肩王”、“未来4年世界首富”、“美国国一辅助”、“巨星杀手”、“天使投资人”、“美国护国公”、“北美摄政王”、“世界上最疯狂的赌徒”、“世界上第一个单挑复仇者联盟的人”
你需要先知道的 4 件事
- 模型名(model) :例如
grok-4.1、grok-4.1-thinking。 - 接口地址(Base URL) :
https://api.aicy.pro - 请求格式:OpenAI 兼容 JSON(
model +messages等)。 - 鉴权方式:
Authorization: Bearer <YOUR_API_KEY>
模型怎么选?
| 模型 | 核心定位 | 典型场景(推荐) |
|---|---|---|
grok-3-fast | 更偏速度 / 成本 | 高并发对话、简单问答、批处理 |
grok-4-fast | 新一代 Fast | 日常通用任务、需要更快响应的 agent/workflow |
grok-4 | 通用旗舰 | 更稳的综合能力:写作、代码、分析 |
grok-4.1 | 迭代增强 | 复杂一些的分析与编码、对稳定性要求更高的生产链路 |
grok-4.1-thinking | 深度推理(慢) | 多步推理、难题拆解、严谨方案评审(建议配合流式与更长超时) |
grok-4-expert | 专家档(更强也更重) | 关键链路、最难的推理与编码、需要更高上限的场景 |
grok-imagine-0.9 | 图片生成 | 文生图、海报/插画风格探索、产品概念图 |
选择建议:
- 不确定用哪个:先用
grok-4-fast,质量不够再切到grok-4.1 /grok-4。 - 需要“更会想”的答案:用
grok-4.1-thinking(通常更慢、成本更高)。 - 图片生成:用
grok-imagine-0.9,并走POST /v1/images/generations。
常用参数(Chat Completions)
| 参数 | 作用 | 建议起步值 |
|---|---|---|
temperature | 随机性,越大越发散 | 代码/严谨问答:0.2~0.5;创意写作:0.7~1.0 |
top_p | 采样范围,越小越保守 | 0.8~0.95 |
max_tokens | 限制输出长度 | 按场景设置,避免无上限输出 |
stream | 是否流式输出 | 大结果/交互式体验建议开启 |
提示:不同客户端可能会对参数做二次封装;以实际请求与报错信息为准。
3 分钟快速开始(curl)
1)确认 Key 可用
- 控制台入口:
https://api.aicy.pro/console/token - 如果你为 Key 配置了 模型限制列表 或 IP 白名单,请确认当前模型与出口 IP 在允许范围内。
- Key 建议只放在服务端环境变量中,不要写到前端或公开仓库。
2)列出可用模型
bash
curl -sS \
-H "Authorization: Bearer YOUR_API_KEY" \
"https://api.aicy.pro/v1/models"3)发起一次最简单的对话请求(Chat Completions)
macOS / Linux(bash)
bash
curl -sS \
-H "Authorization: Bearer YOUR_API_KEY" \
-H "Content-Type: application/json" \
"https://api.aicy.pro/v1/chat/completions" \
-d '{
"model": "grok-4-fast",
"messages": [
{ "role": "system", "content": "你是一个严谨的技术助手。" },
{ "role": "user", "content": "用 3 句话解释什么是中转站,并给出 1 个使用场景。" }
]
}'Windows(PowerShell)
提示:PowerShell 里
curl 可能是别名,建议使用curl.exe。
powershell
$env:AICY_API_KEY = "YOUR_API_KEY"
curl.exe -sS `
-H "Authorization: Bearer $env:AICY_API_KEY" `
-H "Content-Type: application/json" `
"https://api.aicy.pro/v1/chat/completions" `
-d @'
{
"model": "grok-4-fast",
"messages": [
{ "role": "system", "content": "你是一个严谨的技术助手。" },
{ "role": "user", "content": "用 3 句话解释什么是中转站,并给出 1 个使用场景。" }
]
}
'@4)可选:流式输出(stream)
bash
curl -N -sS \
-H "Authorization: Bearer YOUR_API_KEY" \
-H "Content-Type: application/json" \
"https://api.aicy.pro/v1/chat/completions" \
-d '{
"model": "grok-4-fast",
"stream": true,
"messages": [
{ "role": "user", "content": "把下面这段话润色得更口语一些:我们提供开箱即用的服务,让您无需繁琐配置即可使用 AI 编程助手。" }
]
}'说明:流式一般以 SSE(
text/event-stream)返回多段data: {...}。如果你自己解析 HTTP 响应,请确保能正确处理 keep-alive 空行与分块数据。
图片生成(grok-imagine-0.9)
使用 OpenAI 兼容图片接口:
bash
curl -sS \
-H "Authorization: Bearer YOUR_API_KEY" \
-H "Content-Type: application/json" \
"https://api.aicy.pro/v1/images/generations" \
-d '{
"model": "grok-imagine-0.9",
"prompt": "生成一张极简风格的深色科技感 banner,主题是 AI 编程助手,中间留白方便放标题。",
"n": 1
}'说明:返回可能包含图片
url或 base64 数据(取决于网关与参数)。如遇参数不兼容,请优先按报错提示调整字段。
计费与用量(Token)
Grok 模型按 Token 计费(不同模型单价不同)。一次请求通常会产生两类 Token:
- 输入(prompt)Token:你的提示词、系统指令、上下文历史等。
- 输出(completion)Token:模型生成的内容。
更准确的用量请以接口返回的 usage 字段为准(如 prompt_tokens、completion_tokens、total_tokens)。
并发、排队与超时(重要)
当服务器高峰期承受高流量时,可能出现 “已连接但尚未开始推理” 的排队情况(流式与非流式都可能发生 keep-alive)。
建议(面向上线/大并发用户):
- 客户端 HTTP 超时建议设置为 > 10 分钟(或使用更合理的重试与降级策略)。
- 对 429/5xx 做指数退避重试(并设置最大重试次数)。
- 控制单次请求上下文长度,避免把无关历史长期带入。
- 对 “thinking / expert” 模型单独设置更长超时与更严格的重试上限。
常见问题(FAQ)
1)提示 “model not found”,怎么办?
常见原因:
-
model填写错误(大小写、拼写、前后空格)。 - 你的 Key 配置了 模型限制列表,但未包含该模型。
- 模型列表更新,该模型暂时不可用。
处理方式:
- 先调用
GET https://api.aicy.pro/v1/models,从返回中复制模型id。 - 检查 Key 的模型限制列表是否放行该模型。
2)返回 401/403(未授权),怎么办?
请检查:
-
Authorization 请求头是否存在,是否为Bearer YOUR_API_KEY格式。 -
API Key是否复制完整,是否误带空格或换行。 - 是否命中了 Key 的 IP 白名单限制。
3)为什么我用浏览器打开接口是 404?
多数接口只支持 POST(例如 POST /v1/chat/completions),直接用浏览器 GET 访问可能会返回 404 或方法不支持;请按文档使用 POST 并带上 JSON 请求体。
4)响应很慢,甚至看起来“卡住”了?
优先按顺序排查:
- 是否处于排队期(见“并发、排队与超时”)。
- 是否选择了更大的模型(例如
grok-4.1-thinking /grok-4-expert)。 - 上下文是否过长(历史对话太多、粘贴了大段代码/日志)。
- 尝试开启
stream: true,改善交互体验。
