LM Studio 本地模型使用指南 / 04 - 聊天界面

聊天界面

掌握 LM Studio 的聊天界面，学会对话管理、系统提示配置和参数调优。

4.1 聊天界面布局

界面概览

┌──────────────────────────────────────────────────────────┐
│ LM Studio - Chat                                         │
├──────────────────────────────────────────────────────────┤
│                                                          │
│  模型: [Qwen2.5-7B-Instruct ▾]   [⚙️ 参数] [📝 预设]    │
│                                                          │
│  ┌─────────────────────────────────────────────────────┐ │
│  │                                                     │ │
│  │  🤖 Assistant: 你好！有什么我可以帮助你的吗？         │ │
│  │                                                     │ │
│  │  👤 User: 帮我写一个 Python 排序算法                 │ │
│  │                                                     │ │
│  │  🤖 Assistant: 好的，以下是几种常见的排序算法...      │ │
│  │                                                     │ │
│  └─────────────────────────────────────────────────────┘ │
│                                                          │
│  ┌─────────────────────────────────────────────────────┐ │
│  │ 在此输入消息...                           [发送 ➤]  │ │
│  └─────────────────────────────────────────────────────┘ │
│                                                          │
│  [📊 Tokens: 128/32768] [⚡ 45 tok/s] [⏱ 2.8s]         │
└──────────────────────────────────────────────────────────┘

底部状态栏信息

指标	含义	说明
Tokens	当前上下文使用量 / 最大上下文	如 128/32768
tok/s	生成速度（tokens per second）	越高越好
⏱ 时间	响应时间	从发送到完成的时间

4.2 对话管理

创建新对话

操作：
1. 点击左上角的 "+" 或 "New Chat" 按钮
2. 选择要使用的模型
3. （可选）设置系统提示
4. 开始对话

对话历史管理

LM Studio 自动保存对话历史：

对话列表操作：
├── 新建对话: 点击 "+ New Chat"
├── 切换对话: 点击左侧对话列表中的条目
├── 重命名对话: 右键点击 → Rename
├── 删除对话: 右键点击 → Delete
└── 导出对话: 右键点击 → Export (JSON/Markdown)

导出对话

支持的导出格式：
├── JSON: 包含完整的消息结构，适合程序处理
└── Markdown: 人类可读格式，适合分享和存档

导出的 JSON 结构：
{
  "model": "qwen2.5-7b-instruct",
  "messages": [
    {"role": "system", "content": "..."},
    {"role": "user", "content": "..."},
    {"role": "assistant", "content": "..."}
  ],
  "parameters": {
    "temperature": 0.7,
    "top_p": 0.9
  }
}

4.3 系统提示（System Prompt）

什么是系统提示？

系统提示（System Prompt）是在对话开始前发送给模型的指令，用于定义 AI 的行为、角色和限制。

设置系统提示

在聊天界面中：
1. 点击模型选择器旁边的 📝 或 "System Prompt" 区域
2. 输入系统提示文本
3. 系统提示会应用到当前对话

系统提示示例

示例一：通用助手

你是一个知识渊博、乐于助人的 AI 助手。请遵循以下规则：
1. 回答要准确、简洁
2. 如果不确定，请明确说明
3. 使用中文回答
4. 代码示例使用 Python

示例二：代码审查员

你是一位资深的代码审查专家。当用户提交代码时：
1. 首先评估代码的整体结构和可读性
2. 识别潜在的 bug 和安全漏洞
3. 提出改进建议
4. 给出重构示例（如果适用）

回复格式：
## 代码评估
- 可读性: X/10
- 安全性: X/10
- 性能: X/10

## 发现的问题
1. [问题描述]

## 改进建议
1. [建议内容]

示例三：写作助手

你是一位专业的中文写作助手，专注于技术文档写作。

要求：
- 使用简体中文
- 术语首次出现时附英文原文
- 段落之间保持逻辑连贯
- 使用 Markdown 格式
- 主动脉以列表和表格形式呈现结构化信息
- 每个章节控制在合理长度内

风格：专业、清晰、实用

4.4 参数调优

核心参数说明

在聊天界面的 ⚙️ 参数面板中，可以调整以下参数：

Temperature（温度）

范围: 0.0 - 2.0
默认: 0.7

作用: 控制生成文本的随机性
├── 0.0: 完全确定性，每次生成相同结果
├── 0.3-0.5: 较为保守，适合事实性问答
├── 0.7-0.9: 平衡创造性和准确性（推荐）
└── 1.0+: 更随机，适合创意写作

使用场景:
├── 代码生成: 0.0 - 0.3
├── 事实问答: 0.1 - 0.3
├── 通用对话: 0.7 - 0.9
├── 创意写作: 0.8 - 1.2
└── 头脑风暴: 1.0 - 1.5

Top-P（核采样）

范围: 0.0 - 1.0
默认: 0.9

作用: 从累积概率达到 P 的最小词集中采样
├── 0.1: 只从最高概率的少数词中选择
├── 0.9: 从覆盖 90% 概率的词中选择（推荐）
└── 1.0: 考虑所有可能的词

通常与 Temperature 配合使用:
├── Temperature 高 + Top-P 低: 在高频词中随机选择
└── Temperature 低 + Top-P 高: 在更广泛的词中保守选择

Top-K

范围: 1 - 100+
默认: 40

作用: 只从概率最高的 K 个词中采样
├── K=1: 贪心解码，总是选最高概率的词
├── K=40: 从概率最高的 40 个词中选择（推荐）
└── K=100: 考虑更多可能的词

注意: Top-K 通常与 Top-P 一起使用，两者取交集

Repeat Penalty（重复惩罚）

范围: 1.0 - 2.0
默认: 1.1

作用: 降低已出现过的 token 的概率，减少重复
├── 1.0: 无惩罚
├── 1.1: 轻度惩罚（推荐）
└── 1.5+: 强惩罚，可能导致回复不连贯

使用场景:
├── 长文本生成: 1.1 - 1.3（避免重复段落）
└── 对话: 1.0 - 1.1（轻微惩罚即可）

Max Tokens（最大生成长度）

范围: 1 - 模型最大上下文长度
默认: 模型最大上下文长度

作用: 限制单次回复的最大 token 数量
├── 短回复: 256-512 tokens
├── 中等回复: 1024-2048 tokens
└── 长回复: 4096+ tokens

注意: 这不是精确的控制，模型会在接近限制时寻找合适的断句点

参数预设（Presets）

LM Studio 支持保存和加载参数预设：

预设示例：

[精确模式]
temperature = 0.1
top_p = 0.9
repeat_penalty = 1.0

[平衡模式]（默认）
temperature = 0.7
top_p = 0.9
repeat_penalty = 1.1

[创意模式]
temperature = 1.0
top_p = 0.95
repeat_penalty = 1.1

[代码模式]
temperature = 0.0
top_p = 1.0
repeat_penalty = 1.0

4.5 多轮对话技巧

上下文管理

多轮对话的上下文窗口：

每次发送消息时，模型会看到：
┌─────────────────────────────────────┐
│ [System Prompt]                     │
│ [历史消息 1: User]                   │
│ [历史消息 2: Assistant]              │
│ [历史消息 3: User]                   │
│ ...                                 │
│ [当前消息: User]                     │
└─────────────────────────────────────┘

当上下文超出最大长度时：
├── 最早的消息会被截断
├── System Prompt 通常会保留
└── 可能导致模型"忘记"早期对话内容

长对话策略

策略一：定期总结
当对话变长时，让模型总结之前的要点：
"请总结我们目前对话的主要内容"

策略二：重新开始
当上下文耗尽时，创建新对话并粘贴之前的总结

策略三：控制单轮长度
避免单次发送过长的文本，分段发送

策略四：使用更大的上下文模型
选择支持 32K+ 上下文的模型

4.6 快捷操作

键盘快捷键

操作	Windows/Linux	macOS
发送消息	Enter	Enter
换行	Shift + Enter	Shift + Enter
新对话	Ctrl + N	Cmd + N
清空当前对话	Ctrl + L	Cmd + L
聚焦输入框	Ctrl + /	Cmd + /

实用功能

代码块操作：
├── 复制代码: 点击代码块右上角的 📋 图标
├── 语言识别: 自动识别编程语言并高亮
└── 语法高亮: 支持 Python, JavaScript, Go, Rust 等

消息操作：
├── 复制消息: 右键 → Copy
├── 重新生成: 点击 Assistant 消息下方的 🔄 图标
├── 编辑消息: 点击 User 消息的 ✏️ 图标
└── 删除消息: 右键 → Delete

4.7 业务场景示例

场景一：技术文档写作

System Prompt:
你是技术文档写作专家。请用清晰的中文撰写技术文档，
使用 Markdown 格式，包含代码示例和表格。

对话：
User: 写一篇关于 Python asyncio 的入门教程

Assistant: [生成结构化的 Markdown 教程]

场景二：代码调试助手

System Prompt:
你是一位 Python 调试专家。当用户描述问题时：
1. 分析可能的原因
2. 提供调试步骤
3. 给出修复方案

User: 我的 Flask 应用在高并发时经常超时
Assistant: [分析原因并给出解决方案]

场景三：数据分析助手

System Prompt:
你是数据分析助手。帮助用户：
1. 解读数据
2. 提供分析思路
3. 生成可视化代码（matplotlib/plotly）

User: 我有一份销售数据 CSV，想分析月度趋势
Assistant: [提供 pandas 分析代码和可视化方案]

4.8 常见问题

问题	原因	解决方案
回复被截断	Max Tokens 设置太小	增大 Max Tokens 值
回复重复	Repeat Penalty 太低	增大到 1.1-1.2
回复不连贯	Temperature 太高	降低到 0.7-0.8
回复太保守	Temperature 太低	提高到 0.8-1.0
模型"忘记"上下文	上下文超出限制	使用更短的对话或更大上下文模型
响应速度慢	模型太大或 CPU 推理	使用更小模型或启用 GPU

4.9 本章小结

要点	内容
系统提示	定义 AI 行为的关键，值得花时间设计
参数调优	Temperature 最重要，根据场景选择 0.1-1.0
上下文管理	注意 token 限制，定期总结长对话
导出功能	支持 JSON 和 Markdown 格式导出
快捷操作	掌握键盘快捷键提升效率

LM Studio 本地模型使用指南 / 04 - 聊天界面

聊天界面

4.1 聊天界面布局

界面概览

底部状态栏信息

4.2 对话管理

创建新对话

对话历史管理

导出对话

4.3 系统提示（System Prompt）

什么是系统提示？

设置系统提示

系统提示示例

示例一：通用助手

示例二：代码审查员

示例三：写作助手

4.4 参数调优

核心参数说明

Temperature（温度）

Top-P（核采样）

Top-K

Repeat Penalty（重复惩罚）

Max Tokens（最大生成长度）

参数预设（Presets）

4.5 多轮对话技巧

上下文管理

长对话策略

4.6 快捷操作

键盘快捷键

实用功能

4.7 业务场景示例

场景一：技术文档写作

场景二：代码调试助手

场景三：数据分析助手

4.8 常见问题

4.9 本章小结

扩展阅读