设计师们正在探索未知领域。十多年来,我们首次在用户体验设计中面对一个未被开垦的全新领域。这里没有现成的剧本,也没有既定模式可供参考。即便是最前沿的 AI 实验室,也在通过实验不断学习,观察哪些新交互方式能引发用户共鸣。
这让我想起移动触控界面初现时,设计师们创造了如今我们习以为常的交互模式。正如早期 iOS 和 Android 的设计选择定义了移动计算时代,今天的突破正在塑造未来数十年我们与 AI 协作的方式。
实时观察这些设计选择引起的连锁反应令人着迷。当某个设计奏效时,竞争者会争相效仿——这不是出于懒惰,而是因为我们都在共同探索这个新范式中的合理模式。
今天,我想重点介绍最激发我想象力的突破——那些塑造我们对 AI 交互集体认知的设计选择。其中有些现在看来显而易见,但每个突破是关键的发现,帮助我们更好地理解人类和 AI 会如何协作。
一、对话范式( ChatGPT )
核心洞察:人类本就擅长通过对话表达复杂想法——何必让他们学习新方式?
影响:确立对话作为人机交互的基础范式。
对话式 AI 如今已无处不在,但正是这个突破性设计开启了我们的 AI 时代。虽然 GPT 技术早已存在于 OpenAI 的开发者平台,但当时并未引发广泛共鸣——它看起来更像是开发者工具。我记得初次使用时虽感惊艳,却未能激发我对于 AI 潜力的想象。
采用对话形式带来了质的改变,这被证明是本世代最重要的设计决策。聊天界面随后被广泛模仿,影响了几乎所有后续消费级 AI 工具。这波生成式 AI 浪潮以自然语言为核心,而对话正是用语言交流的核心,这种范式会持续存在。

上面是早期的 ChatGPT,下面是之前的开发环境。
二、来源透明( Perplexity )
核心洞察:没有来源标注,用户无法验证 AI 的研究结论。
影响:让 AI 搜索结果变得可验证。
当人们开始使用 ChatGPT 时,缺乏引用来源成为一个普遍的痛点。虽然 ChatGPT 能基于海量训练数据生成回答,但无法追溯信息来源,使其难以用于严谨研究。
Perplexity 通过实时引用来源改变了这一状况,使答案可追踪验证。该功能被广泛模仿(包括 OpenAI 的网页搜索),解决了根本的信任问题:用户不仅要答案,更要答案来源的可信度。

虽然在UI方面很简单,但引用来源是一个很大的进步。
三、共同创作( Claude Artifacts )
核心洞察:对话不仅能生成文字,更能驱动生成创意资产。
影响:开创对话生成创意资产的创作流程。
首次使用 Claude 里的 “ Artifacts ”功能时,我第一次感受到我不仅仅是和 AI 对话,而是和 AI 在共同创作。虽然之前和 ChatGPT 和 Claude 的对话有助于构思,Perplexity 有助于研究,但“ Artifacts ”功能给了我惊奇的体验——我可以通过对话开启创作流程,并将其中最好的部分转化为可使用的创意资产。虽然生成资产之后的工作流仍需完善,但我们正朝着这个方向进步。
对我而言,“ Artifacts ”功能证明 AI 协作将成为新型创作流程的核心,用户将与 AI 共同生成创意成果。

和“ Artifacts ”对话共同创作。
四、自然交互(语音输入)
核心洞察:语音比打字能实现更自然和更丰富的表达。
影响:降低和 AI 详细讨论的门槛。
许多人忽视了语音输入的价值,这可能是源于对语音助手(比如 Siri )的固有想法。但现实是,AI 转录技术已非常成熟。
语音输入是很关键的,因为它让用户能真正运用自然语言。当人们使用文字来表达时,会更仔细地组织语言。而口头表达能让用户更即兴地表达,为语言模型提供更丰富的输入——这正是 AI 非常需要的。实际体验表明,当前语言模型完全能过滤掉口语中杂乱的部分(比如”呃””啊”),捕捉到用户想要表达的意思。

ChatGPT iOS 应用上的语音输入
五、工作流整合( Cursor IDE )
核心洞察:深度嵌入的 AI 能优化工作流程。
影响:将代码编辑器转变为 AI 驱动的创造工具。
Cursor 将 AI 创作流程直接整合到代码库中。某些功能让人顿生”代码编辑器本该如此”的感慨(如强大的 Tab 代码补全)。
作为前 UI 开发者,我已经几年没有编写代码了。因为代码语法和框架迭代更新,重新开始编程对我而言是困难的。Cursor 帮助我规避了这些困难:我可以问 Cursor 任何关于的代码的细节问题并快速获得解答。
Cursor 还展现了 AI 直接读写文件系统的强大能力,大幅提升了用户的工作效率。

与现有的编码工作流程的深度集成
六、环境辅助( X 平台的 Grok)
核心洞察:用户在到困惑/困难的时刻,最需要 AI 的帮助。
影响:实现内容场景中的即时 AI 辅助。
X 平台上的 Grok 按钮十分实用。面对 X 平台的信息洪流,我常缺乏理解帖文的背景信息。Grok 提供一键式实时解读,无论是表情包还是新闻标题,都能快速获得 AI 辅助解析。
随着网络内容日益增加,这类辅助将愈发重要。虽然当前设计仍有改进空间,但已让我期待在其他平台看到类似功能。Grok 按钮展示了环境辅助的价值。最终,我认为操作系统级助手( Gemini、Siri 等)可能会提供此类功能。

Grok 按钮可以为用户提供即时背景信息
七、过程透明( DeepSeek )
核心洞察:展示 AI 推理过程能获得用户更多的信任。
影响:通过展示 AI 推理使其更拟人化。
DeepSeek 最近凭借 R1 推理模型引发关注。虽然它不是市场上的第一个推理模型,它做出了一个关键的设计决策:暴露模型的“思考过程”。它展示了它是如何得到最后的结论的,这种推理语言也使其更加拟人化。用户可以依此验证结论的合理性,甚至可能从 AI 的推理本身中找到值得继续探索的想法。
这让我想起进度条对网页应用体验的革命性影响。无反馈会引起用户的焦虑,进度条的展示让用户知晓系统正在工作。展示 AI 推理同理——它证明系统确实正在运作。

DeepSeek 展示了它是如何“思考”得出结论的
总结思考
这些突破不仅是巧妙的交互/界面设计决策,更是人机交互新章节的开篇。每个突破都代表着有人勇敢的实验,尝试未有的模式,然后建立起能引起用户共鸣的模式。
从 ChatGPT 的对话范式,到 Claude 的共同创作,再到 DeepSeek 的推理可视化——我们见证着新创意媒介的快速进化。创新速度非但未减,反而在持续加速。但正是这种态势令人兴奋,我们不仅是观察者,更是参与者。每位与 AI 协作的设计师、开发者和创作者,都有机会为人机交互的新模式做出贡献。