Skip to content
Star

首次设置

安装完说点啥后,您需要配置一个 ASR 供应商才能开始使用语音识别功能。新用户使用时会弹出推荐的三个方案,本页将指导您完成更多个性化设置。

选择 ASR 供应商

说点啥支持 12+ ASR 供应商,包括云端服务和本地模型。对于首次使用,我们推荐以下方案:

推荐方案

供应商类型免费/费用特点优势适合人群
硅基流动云端内置免费 ASR/LLM 服务无需额外配置即可使用,支持 SenseVoice 和 Qwen3-Omni新手使用
火山引擎云端新用户通常有赠送额度(以控制台为准)流式识别,实时出字追求流畅体验
SenseVoice本地完全离线,无 API 费用完全离线,隐私安全,支持伪流式注重隐私

新手推荐

如果您是第一次使用,建议先选择硅基流动,应用默认启用其内置免费 ASR/LLM 服务,无需额外注册或配置即可体验。

配置硅基流动(推荐)

下面以硅基流动为例,演示如何配置您的第一个 ASR 供应商。

如果只是想先体验内置的免费 ASR/LLM 服务,可以直接在应用中选择“硅基流动”作为供应商,保持“免费 ASR/LLM”相关开关为开启,无需在官网注册或填写 API Key。

以下步骤主要适用于希望使用自己 API Key 的进阶用户。

1. 注册硅基流动账号

  1. 访问 硅基流动官网
  2. 点击右上角「注册」或「登录」
  3. 使用手机号或邮箱完成注册
  4. 登录后进入控制台

2. 获取 API Key

  1. 在硅基流动控制台,点击左侧「API 密钥」
  2. 点击「创建新密钥」按钮
  3. 输入密钥名称(如「说点啥」),点击「创建」
  4. 复制生成的 API Key(以 sk- 开头)

安全提示

API Key 是敏感信息,请妥善保管,不要分享给他人。如果泄露,请立即在控制台删除并重新创建。

3. 在说点啥中配置

  1. 打开说点啥,点击键盘上方的「设置」按钮(齿轮图标)
  2. 进入「语音识别设置」
  3. 在「ASR 供应商」部分,选择「硅基流动」
  4. 填入刚才获取的 API Key
  5. 点击「保存」或返回

4. 配置 AI 后处理(可选)

硅基流动也提供大语言模型服务,可用于 AI 后处理功能:

  1. 在说点啥设置中,进入「AI 后处理设置」
  2. 开启「启用 AI 后处理」
  3. 选择「硅基流动」作为 LLM 供应商
  4. 填入相同的 API Key(与 ASR 共用)
  5. 选择模型或填入自定义模型 ID
  6. 点击「保存」

AI 后处理

AI 后处理可以根据提示词自动为识别结果添加标点、纠正错误、优化语气,让语音输入更加自然流畅。建议开启此功能并选择使用速度较快的模型以获得更好的体验。

测试语音输入

完成配置后,让我们测试一下语音识别是否正常工作:

  1. 打开输入框

打开任意支持文本输入的应用

  1. 进行语音输入
  • 确认当前输入法为说点啥
  • 长按键盘上的麦克风按钮(大按钮),开始说话
  • 说完后松开按钮,等待识别结果

3. 查看结果

  • 如果配置正确,识别结果会自动输入到文本框中
  • 如果出现错误,报错信息会自动复制到粘贴板中,请检查:
    • API Key 是否正确
    • 网络连接是否正常
    • 麦克风权限是否已授予
    • 是否有语音输入(检查音量波形)

调整基本设置

首次设置完成后,您可以根据个人喜好调整以下设置:

录音模式

  1. 进入说点啥设置 → 「基本设置」
  2. 选择「录音模式」:
    • 长按说话(默认):按住录音,松开停止
    • 点按切换:点一下开始,再点一下停止

智能自动停止(VAD)

VAD 适用于点按录音模式,在无人声传入超过一定阈值后,会自动停止录音。 如果您的录音经常因为停顿而被截断,可以调整 VAD 设置:

  1. 进入说点啥设置 → 「基本设置」
  2. 开启「智能自动停止(VAD)」
  3. 调整「静音检测时长」(0.5-3 秒)
  4. 调整「灵敏度」(1-10,数值越大越容易被打断)

VAD 建议

  • 如果经常误停止,增加静音检测时长或降低灵敏度
  • 如果停止太慢,减少静音检测时长或提高灵敏度

键盘高度

  1. 进入说点啥设置 → 「界面设置」
  2. 选择「键盘高度」:
    • 中等(默认):平衡舒适度和屏幕占用
  3. 调整键盘底部间距

常见问题

无法识别语音

问题:点击录音后无反应或识别失败

解决方案

  1. 检查麦克风权限是否已授予
  2. 确认 API Key 是否正确填写
  3. 检查网络连接是否正常
  4. 查看错误提示信息,根据提示操作

识别结果不准确

问题:识别结果错字较多或语义不正确

解决方案

  1. 尝试切换其他 ASR 供应商
  2. 开启 AI 后处理功能
  3. 确保录音环境安静,避免背景噪音
  4. 说话清晰,语速适中

API Key 无效

问题:提示 API Key 无效或认证失败

解决方案

  1. 检查 API Key 是否完整复制
  2. 确认 API Key 未过期或被删除
  3. 检查 API Key 是否有足够的额度
  4. 重新创建 API Key 后再试

提示额度不足或超出限制

问题:提示供应商额度不足或超出限制

解决方案

  1. 在对应供应商控制台查看当前配额与计费规则;
  2. 如需降低成本,可切换到内置免费方案(如硅基流动免费服务)或本地模型(SenseVoice、Paraformer 等);
  3. 如需继续使用当前云端供应商,请按控制台提示调整套餐或充值。

下一步

完成首次设置后,您可以:

Released under the Apache 2.0 License.