跳转到内容

XAI-Grok模型

📋 简介

Grok 是由 Elon Musk(埃隆·马斯克) 创立的 xAI 公司开发的大语言模型,目标是“最大程度追求真理”并帮助人类理解宇宙。

它不像很多模型那样过度“政治正确”或设限严格,风格更直接、幽默,有时会带点毒舌和不羁。Grok 从设计上就试图减少常见的 AI 审查和刻板回答,目前最新版本的:推理、代码、数学、长文本理解等能力都进入第一梯队。

🚨 马斯克是谁?

现在站在你面前的是:“美国一字并肩王”、“未来4年世界首富”、“美国国一辅助”、“巨星杀手”、“天使投资人”、“美国护国公”、“北美摄政王”、“世界上最疯狂的赌徒”、“世界上第一个单挑复仇者联盟的人”

你需要先知道的 4 件事

  1. 模型名(model) :例如 grok-4.1​、grok-4.1-thinking
  2. 接口地址(Base URL)https://api.aicy.pro
  3. 请求格式:OpenAI 兼容 JSON(model​ + messages 等)。
  4. 鉴权方式Authorization: Bearer <YOUR_API_KEY>

模型怎么选?

模型核心定位典型场景(推荐)
grok-3-fast更偏速度 / 成本高并发对话、简单问答、批处理
grok-4-fast新一代 Fast日常通用任务、需要更快响应的 agent/workflow
grok-4通用旗舰更稳的综合能力:写作、代码、分析
grok-4.1迭代增强复杂一些的分析与编码、对稳定性要求更高的生产链路
grok-4.1-thinking深度推理(慢)多步推理、难题拆解、严谨方案评审(建议配合流式与更长超时)
grok-4-expert专家档(更强也更重)关键链路、最难的推理与编码、需要更高上限的场景
grok-imagine-0.9图片生成文生图、海报/插画风格探索、产品概念图

选择建议:

  • 不确定用哪个:先用 grok-4-fast​,质量不够再切到 grok-4.1​ / grok-4
  • 需要“更会想”的答案:用 grok-4.1-thinking(通常更慢、成本更高)。
  • 图片生成:用 grok-imagine-0.9​,并走 POST /v1/images/generations

常用参数(Chat Completions)

参数作用建议起步值
temperature随机性,越大越发散代码/严谨问答:0.2~0.5;创意写作:0.7~1.0
top_p采样范围,越小越保守0.8~0.95
max_tokens限制输出长度按场景设置,避免无上限输出
stream是否流式输出大结果/交互式体验建议开启

提示:不同客户端可能会对参数做二次封装;以实际请求与报错信息为准。

3 分钟快速开始(curl)

1)确认 Key 可用

  • 控制台入口:https://api.aicy.pro/console/token
  • 如果你为 Key 配置了 模型限制列表IP 白名单,请确认当前模型与出口 IP 在允许范围内。
  • Key 建议只放在服务端环境变量中,不要写到前端或公开仓库。

2)列出可用模型

bash
curl -sS \
  -H "Authorization: Bearer YOUR_API_KEY" \
  "https://api.aicy.pro/v1/models"

3)发起一次最简单的对话请求(Chat Completions)

macOS / Linux(bash)

bash
curl -sS \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -H "Content-Type: application/json" \
  "https://api.aicy.pro/v1/chat/completions" \
  -d '{
  "model": "grok-4-fast",
  "messages": [
    { "role": "system", "content": "你是一个严谨的技术助手。" },
    { "role": "user", "content": "用 3 句话解释什么是中转站,并给出 1 个使用场景。" }
  ]
}'

Windows(PowerShell)

提示:PowerShell 里 curl​ 可能是别名,建议使用 curl.exe

powershell
$env:AICY_API_KEY = "YOUR_API_KEY"

curl.exe -sS `
  -H "Authorization: Bearer $env:AICY_API_KEY" `
  -H "Content-Type: application/json" `
  "https://api.aicy.pro/v1/chat/completions" `
  -d @'
{
  "model": "grok-4-fast",
  "messages": [
    { "role": "system", "content": "你是一个严谨的技术助手。" },
    { "role": "user", "content": "用 3 句话解释什么是中转站,并给出 1 个使用场景。" }
  ]
}
'@

4)可选:流式输出(stream)

bash
curl -N -sS \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -H "Content-Type: application/json" \
  "https://api.aicy.pro/v1/chat/completions" \
  -d '{
  "model": "grok-4-fast",
  "stream": true,
  "messages": [
    { "role": "user", "content": "把下面这段话润色得更口语一些:我们提供开箱即用的服务,让您无需繁琐配置即可使用 AI 编程助手。" }
  ]
}'

说明:流式一般以 SSE(text/event-stream​)返回多段 data: {...}。如果你自己解析 HTTP 响应,请确保能正确处理 keep-alive 空行与分块数据。

图片生成(grok-imagine-0.9)

使用 OpenAI 兼容图片接口:

bash
curl -sS \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -H "Content-Type: application/json" \
  "https://api.aicy.pro/v1/images/generations" \
  -d '{
  "model": "grok-imagine-0.9",
  "prompt": "生成一张极简风格的深色科技感 banner,主题是 AI 编程助手,中间留白方便放标题。",
  "n": 1
}'

说明:返回可能包含图片 url 或 base64 数据(取决于网关与参数)。如遇参数不兼容,请优先按报错提示调整字段。

计费与用量(Token)

Grok 模型按 Token 计费(不同模型单价不同)。一次请求通常会产生两类 Token:

  • 输入(prompt)Token:你的提示词、系统指令、上下文历史等。
  • 输出(completion)Token:模型生成的内容。

更准确的用量请以接口返回的 usage​ 字段为准(如 prompt_tokens​、completion_tokens​、total_tokens)。

并发、排队与超时(重要)

当服务器高峰期承受高流量时,可能出现 “已连接但尚未开始推理” 的排队情况(流式与非流式都可能发生 keep-alive)。

建议(面向上线/大并发用户):

  • 客户端 HTTP 超时建议设置为 > 10 分钟(或使用更合理的重试与降级策略)。
  • 对 429/5xx 做指数退避重试(并设置最大重试次数)。
  • 控制单次请求上下文长度,避免把无关历史长期带入。
  • 对 “thinking / expert” 模型单独设置更长超时与更严格的重试上限。

常见问题(FAQ)

1)提示 “model not found”,怎么办?

常见原因:

  • model 填写错误(大小写、拼写、前后空格)。
  • 你的 Key 配置了 模型限制列表,但未包含该模型。
  • 模型列表更新,该模型暂时不可用。

处理方式:

  1. 先调用 GET https://api.aicy.pro/v1/models​,从返回中复制模型 id
  2. 检查 Key 的模型限制列表是否放行该模型。

2)返回 401/403(未授权),怎么办?

请检查:

  • Authorization​ 请求头是否存在,是否为 Bearer YOUR_API_KEY 格式。
  • API Key 是否复制完整,是否误带空格或换行。
  • 是否命中了 Key 的 IP 白名单限制。

3)为什么我用浏览器打开接口是 404?

多数接口只支持 POST​(例如 POST /v1/chat/completions​),直接用浏览器 GET​ 访问可能会返回 404 或方法不支持;请按文档使用 POST 并带上 JSON 请求体。

4)响应很慢,甚至看起来“卡住”了?

优先按顺序排查:

  1. 是否处于排队期(见“并发、排队与超时”)。
  2. 是否选择了更大的模型(例如 grok-4.1-thinking​ / grok-4-expert)。
  3. 上下文是否过长(历史对话太多、粘贴了大段代码/日志)。
  4. 尝试开启 stream: true,改善交互体验。

爱次元 让 AI 编程更简单