XAI-Grok模型

📋 简介

Grok 是由 Elon Musk（埃隆·马斯克）创立的 xAI 公司开发的大语言模型，目标是“最大程度追求真理”并帮助人类理解宇宙。

它不像很多模型那样过度“政治正确”或设限严格，风格更直接、幽默，有时会带点毒舌和不羁。Grok 从设计上就试图减少常见的 AI 审查和刻板回答，目前最新版本的：推理、代码、数学、长文本理解等能力都进入第一梯队。

🚨 马斯克是谁？

现在站在你面前的是：“美国一字并肩王”、“未来4年世界首富”、“美国国一辅助”、“巨星杀手”、“天使投资人”、“美国护国公”、“北美摄政王”、“世界上最疯狂的赌徒”、“世界上第一个单挑复仇者联盟的人”

你需要先知道的 4 件事

模型名（model） ：例如 grok-4.1、grok-4.1-thinking。
接口地址（Base URL） ：https://api.aicy.pro
请求格式：OpenAI 兼容 JSON（model + messages 等）。
鉴权方式：Authorization: Bearer <YOUR_API_KEY>

模型怎么选？

模型	核心定位	典型场景（推荐）
`grok-3-fast`	更偏速度 / 成本	高并发对话、简单问答、批处理
`grok-4-fast`	新一代 Fast	日常通用任务、需要更快响应的 agent/workflow
`grok-4`	通用旗舰	更稳的综合能力：写作、代码、分析
`grok-4.1`	迭代增强	复杂一些的分析与编码、对稳定性要求更高的生产链路
`grok-4.1-thinking`	深度推理（慢）	多步推理、难题拆解、严谨方案评审（建议配合流式与更长超时）
`grok-4-expert`	专家档（更强也更重）	关键链路、最难的推理与编码、需要更高上限的场景
`grok-imagine-0.9`	图片生成	文生图、海报/插画风格探索、产品概念图

选择建议：

不确定用哪个：先用 grok-4-fast，质量不够再切到 grok-4.1 / grok-4。
需要“更会想”的答案：用 grok-4.1-thinking（通常更慢、成本更高）。
图片生成：用 grok-imagine-0.9，并走 POST /v1/images/generations。

常用参数（Chat Completions）

参数	作用	建议起步值
`temperature`	随机性，越大越发散	代码/严谨问答：0.2～0.5；创意写作：0.7～1.0
`top_p`	采样范围，越小越保守	0.8～0.95
`max_tokens`	限制输出长度	按场景设置，避免无上限输出
`stream`	是否流式输出	大结果/交互式体验建议开启

提示：不同客户端可能会对参数做二次封装；以实际请求与报错信息为准。

3 分钟快速开始（curl）

1）确认 Key 可用

控制台入口：https://api.aicy.pro/console/token
如果你为 Key 配置了 模型限制列表 或 IP 白名单，请确认当前模型与出口 IP 在允许范围内。
Key 建议只放在服务端环境变量中，不要写到前端或公开仓库。

2）列出可用模型

bash

curl -sS \
  -H "Authorization: Bearer YOUR_API_KEY" \
  "https://api.aicy.pro/v1/models"

3）发起一次最简单的对话请求（Chat Completions）

macOS / Linux（bash）

bash

curl -sS \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -H "Content-Type: application/json" \
  "https://api.aicy.pro/v1/chat/completions" \
  -d '{
  "model": "grok-4-fast",
  "messages": [
    { "role": "system", "content": "你是一个严谨的技术助手。" },
    { "role": "user", "content": "用 3 句话解释什么是中转站，并给出 1 个使用场景。" }
  ]
}'

Windows（PowerShell）

提示：PowerShell 里 curl 可能是别名，建议使用 curl.exe。

powershell

$env:AICY_API_KEY = "YOUR_API_KEY"

curl.exe -sS `
  -H "Authorization: Bearer $env:AICY_API_KEY" `
  -H "Content-Type: application/json" `
  "https://api.aicy.pro/v1/chat/completions" `
  -d @'
{
  "model": "grok-4-fast",
  "messages": [
    { "role": "system", "content": "你是一个严谨的技术助手。" },
    { "role": "user", "content": "用 3 句话解释什么是中转站，并给出 1 个使用场景。" }
  ]
}
'@

4）可选：流式输出（stream）

bash

curl -N -sS \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -H "Content-Type: application/json" \
  "https://api.aicy.pro/v1/chat/completions" \
  -d '{
  "model": "grok-4-fast",
  "stream": true,
  "messages": [
    { "role": "user", "content": "把下面这段话润色得更口语一些：我们提供开箱即用的服务，让您无需繁琐配置即可使用 AI 编程助手。" }
  ]
}'

说明：流式一般以 SSE（text/event-stream）返回多段 data: {...}。如果你自己解析 HTTP 响应，请确保能正确处理 keep-alive 空行与分块数据。

图片生成（grok-imagine-0.9）

使用 OpenAI 兼容图片接口：

bash

curl -sS \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -H "Content-Type: application/json" \
  "https://api.aicy.pro/v1/images/generations" \
  -d '{
  "model": "grok-imagine-0.9",
  "prompt": "生成一张极简风格的深色科技感 banner，主题是 AI 编程助手，中间留白方便放标题。",
  "n": 1
}'

说明：返回可能包含图片 url 或 base64 数据（取决于网关与参数）。如遇参数不兼容，请优先按报错提示调整字段。

计费与用量（Token）

Grok 模型按 Token 计费（不同模型单价不同）。一次请求通常会产生两类 Token：

输入（prompt）Token：你的提示词、系统指令、上下文历史等。
输出（completion）Token：模型生成的内容。

更准确的用量请以接口返回的 usage 字段为准（如 prompt_tokens、completion_tokens、total_tokens）。

并发、排队与超时（重要）

当服务器高峰期承受高流量时，可能出现 “已连接但尚未开始推理” 的排队情况（流式与非流式都可能发生 keep-alive）。

建议（面向上线/大并发用户）：

客户端 HTTP 超时建议设置为 > 10 分钟（或使用更合理的重试与降级策略）。
对 429/5xx 做指数退避重试（并设置最大重试次数）。
控制单次请求上下文长度，避免把无关历史长期带入。
对 “thinking / expert” 模型单独设置更长超时与更严格的重试上限。

常见问题（FAQ）

1）提示 “model not found”，怎么办？

常见原因：

model 填写错误（大小写、拼写、前后空格）。
你的 Key 配置了 模型限制列表，但未包含该模型。
模型列表更新，该模型暂时不可用。

处理方式：

先调用 GET https://api.aicy.pro/v1/models，从返回中复制模型 id。
检查 Key 的模型限制列表是否放行该模型。

2）返回 401/403（未授权），怎么办？

请检查：

Authorization 请求头是否存在，是否为 Bearer YOUR_API_KEY 格式。
API Key 是否复制完整，是否误带空格或换行。
是否命中了 Key 的 IP 白名单限制。

3）为什么我用浏览器打开接口是 404？

多数接口只支持 POST（例如 POST /v1/chat/completions），直接用浏览器 GET 访问可能会返回 404 或方法不支持；请按文档使用 POST 并带上 JSON 请求体。

4）响应很慢，甚至看起来“卡住”了？

优先按顺序排查：

是否处于排队期（见“并发、排队与超时”）。
是否选择了更大的模型（例如 grok-4.1-thinking / grok-4-expert）。
上下文是否过长（历史对话太多、粘贴了大段代码/日志）。
尝试开启 stream: true，改善交互体验。

XAI-Grok模型 ​

你需要先知道的 4 件事 ​

模型怎么选？ ​

常用参数（Chat Completions） ​

3 分钟快速开始（curl） ​

1）确认 Key 可用 ​

2）列出可用模型 ​

3）发起一次最简单的对话请求（Chat Completions） ​

macOS / Linux（bash） ​

Windows（PowerShell） ​

4）可选：流式输出（stream） ​

图片生成（grok-imagine-0.9） ​

计费与用量（Token） ​

并发、排队与超时（重要） ​

常见问题（FAQ） ​

1）提示 “model not found”，怎么办？ ​

2）返回 401/403（未授权），怎么办？ ​

3）为什么我用浏览器打开接口是 404？ ​

4）响应很慢，甚至看起来“卡住”了？ ​

XAI-Grok模型

你需要先知道的 4 件事

模型怎么选？

常用参数（Chat Completions）

3 分钟快速开始（curl）

1）确认 Key 可用

2）列出可用模型

3）发起一次最简单的对话请求（Chat Completions）

macOS / Linux（bash）

Windows（PowerShell）

4）可选：流式输出（stream）

图片生成（grok-imagine-0.9）

计费与用量（Token）

并发、排队与超时（重要）

常见问题（FAQ）

1）提示 “model not found”，怎么办？

2）返回 401/403（未授权），怎么办？

3）为什么我用浏览器打开接口是 404？

4）响应很慢，甚至看起来“卡住”了？