AI 使用分享

开场：一个真实的“魔法”瞬间

前几天，领导丢给我一份红头文件 PDF：《关于开展2026年度医院物联网创新发展科研计划的通知》。里面密密麻麻提了 17 个科研方向，作为非医疗行业的从业者，我看完是一头雾水。

原始“PDF”文档：
- 关于开展2026年度医院物联网创新发展科研计划.pdf
第一步：通用 AI 求助
- 我把这份资料扔给 AI，让它帮我科普一下这 17 个方向到底是干嘛的。AI 很快给我出了一份看起来很专业的科普报告。
AI 初步科普文档：
- 初版调研分析

但这有一个致命痛点：这只是一份“人尽皆知”的通用调研，它并不知道这 17 个方向跟我们公司有什么关系？我们能接得住哪些需求？

第二步：给 AI 加上“我们公司”的记忆
- 接着，我做了一个小小的动作：我找了一份咱们公司对外的《苏高新数科营销话术》文档，连同刚才的红头文件，一起喂给了 AI。
公司“WORD”语料输入
- 苏高新数科营销话术250707.docx
- (事实上，光这个营销话术文档是不够的，但是我手上一下子没有理想的公司语料)
魔法出现了：
- 进阶版调研分析
- AI 重新生成的《调研分析-进阶版》中，不仅向我科普了行业方向，更直接根据我们公司的能力矩阵，梳理出了“机会分析与业务映射”！它告诉我，哪些方向契合我们现有的物联网底座，哪些方向我们可以直接包装成“智慧后勤一体化方案”，并且还自动帮我加上了精美的汇报排版。

思考：同样是面对 AI，差距是怎么产生的？

为什么有的人用 AI，觉得它就像个听不懂人话的智障，只能写一写放之四海而皆准的废话？而有的人用 AI，却能让它成为深谙公司业务架构的顶级智囊？

这，就是我们今天分享的核心主题——是否具备 AI Native（AI 原生）的思维！

一、认知启航：什么是真正的 AI Native？

“从设计之初就把 AI 当成核心能力，而不是后期 ‘加上去’ 的功能。”

通俗对比：

非 AI Native：传统软件 + 套个 AI 插件 / 加个对话按钮（切出去找 AI 对话框问个问题，复制粘贴回来）
AI Native：AI 是底层引擎，界面、交互、逻辑都围绕它设计。在开始一项工作之前，首先考虑：“怎么把这些信息准备成 AI 最喜欢吃的样子”，然后让 AI 帮你生成骨架甚至血肉。

为了达到开场讲的那个“魔术效果”，首要条件就是我们要学会用 AI 听得懂的语言和它沟通。

二、核心基建：如何把工作转化为 AI 听得懂的语言？

要想让 AI 真正懂你，首先要给它提供它可以“看懂”的文档。

2.1 AI 的母语：Markdown

目前行业上公认的、能被大多数 AI 模型最完美解析的文档格式，就是 Markdown。它没有那些复杂的排版干扰，全是结构化的纯净文本。

2.2 素材转化神器：如何将传统文档 Markdown 化？

如何把我们日常遇到的各种文件迅速转化为 Markdown？

MinerU（全能解析）
- 支持 PDF / Word / PPT / HTML 解析。
- 功能：把内容拆分为文字和图片，图片部分如可以 OCR 会自动 OCR，图片以链接形式插入 Markdown 文档。
- 扩展：还支持 JSON 格式，对格式布局可以一定程度保留。
- 门槛：无门槛，下载即用。
Jina（网页抓取）
- 功能：HTML 转 Markdown。
- 链接：https://jina.ai/reader/
- 示例用法：https://r.jina.ai/https://open.feishu.cn/document/develop-gadgets-(not-recommended)/basic-information/overview (某些场景下 MinerU 解析不了网页，比如一些动态渲染反爬取的场景，可以用来解析文本)
- 门槛：无门槛，下载即用。
飞书2md（飞书专用）
- 功能：将飞书文档一键转存为 Markdown。
- 链接：https://github.com/Wsine/feishu2md
- 门槛：轻度门槛，需使用命令行工具进行配置，且需要在飞书审核开放平台获取 APP ID 和 APP SECRET 信息。

2.3 核心法则：给 AI 充分的“上下文”

就像开场所展示的，无论 AI 多聪明，你不给它《营销话术》，它就永远不知道公司业务，做出来的就是通用回答。
衍生思考：这就引出了**“公司资产的 AI 化”**——公司越快拥抱 AI（构建起各个业务线的数字语料库），AI 才能越精准地帮助公司。

三、全员通用场景：让 AI 帮你做调研、写文档与画图

掌握了输入基建后，你可以立刻在日常工作中享受到 AI 的效率红利。在这里我们重点推荐一款神奇的工具作为一切的基础：VSCode。

3.1 为什么推荐 VSCode 作为你的个人知识库与 AI 助理？

可能大家听说过 VSCode 是程序员用来写代码的工具（IDE），但其实，在丰富的插件加持下，它对我来说更是一个无比强大的文档编辑管理工具。
市面上有 Cherry Studio、Notegen、ima、Obsidian 等各种个人文档知识库管理工具，各有优缺点；但我个人实际使用的是 VSCode，并通过 GitHub 进行跨机器的云端同步。更重要的是，目前大多数顶级的 AI 生产力插件，都是基于 VSCode 这个平台开发的，所以我们非常有必要先从它讲起。

3.1.1 痛点对比：为什么不用网页版 AI？

传统 Web 网页端问答（如 ChatGPT / Kimi）的痛点：
你问一句，AI 答一句。然后你需要自己当“搬运工”，反复把 AI 的回答“复制粘贴（Copy & Paste）”整理到文档里。如果你的文档需要参考好几份资料，你还得手动一个个把文件上传喂给 AI，操作极其繁琐。
本地 AI 编辑工具（基于 VSCode）的降维打击：
- 一语调用海量资料：在对话窗口直接告诉 AI 参考资料的文件夹路径，或者直接输入 @ 加上文件名，就能瞬间把复杂的背景资料传给 AI。
- 让 AI 主动替你修改文档：再也不用全手动复制粘贴了！你可以直接指挥 AI 帮你修改当前文档。AI 会主动在你的文件里打字、增删内容。
- 清晰的版本控制（Source Control）：AI 改了我的文档，万一改错了怎么办？VSCode 自带 Source Control（一般叫 Git 或版本控制系统，你可以通俗理解为一个“找不同”系统）。它可以高亮显示出 AI 到底改了文档的哪几句，方便我们进行逐行地接受或拒绝。后续你还能通过提交（Commit）非常方便地对历史版本进行管理溯源。
注：Google 现在也有一个“边聊边改”的网页版 Canvas 模式，大家可以看这个示例：Google Canvas 演示，但从变更明细查看和版本溯源的角度来看，目前依然不如本地 VSCode 方便。

3.2 我常用的 AI 插件与工具组合

因为我的核心诉求是“让 AI 直接阅读、分析并按需编辑本地文档”，虽然市面上的工具形态有很多种，但实现效果本质都差不多。以下是我常用的几个绝佳选择：

Gemini CLI：我用得最多的核心工具之一，依靠其支持的最高 100M 超长上下文记忆，主要用来处理超大项目和长篇资料，底层用的是自家顶级的 Gemini 模型。
Amazon Q 插件：VSCode 专属插件，背后使用的是逻辑推理能力极强的 Claude 4 - 4.5 系列模型。
Antigravity：同样是一款类 VSCode 且集成度非常高的智能体编辑助手，谷歌出品自带 gemini和claude 4.7 和 gpt
特别推荐：Trae：如果大家觉得配置这些工具有门槛，或者由于网络原因不方便“翻墙”，最直接的方式是使用 Trae。它是字节跳动出品的一款完全对标 VSCode 的国产软件，自带强大的 AI 能力，免翻墙开箱即用，国内网络直连非常顺畅。

3.3 “所见即所得”的文档排版与质感提升

通过 Markdown 编辑器配合 CSS / HTML，你的笔记和汇报可以轻易呈现出极为高级的质感。

3.3.1 插件的妙用：Markdown 编辑器

Markdown Preview Enhanced：用于目录预览、浏览器预览、pdf导出等。
Markdown Editor：用以提供类似飞书样式、“所见即所得”的编辑体验。

3.3.2 CSS 样式和 HTML 标签的结合（让纯文本获得高级质感）

我们可以直接在 Markdown 中嵌入 CSS，从而实现当前大家看到的目录样式，文字中夹杂的气泡标签。

动效与视觉展现：

渐变色分割线

带有动效的插入（GIF特效）

全局样式

<link rel="stylesheet" href="https://gitee.com/tataboxer/pub/raw/master/markdown-global-style.css">

大家也可以在文档直接贴上述这串代码，来体验下这个样式效果

3.3.3 图床 PicGo：如何处理庞大的图片？

背景痛点：过去很多人弃用本地文档、转投飞书等在线文档的一个巨大痛点，就是图片的展示与保存问题。在本地写文档时，你随意 Copy & Paste（复制粘贴）一张图片，本地路径会变得极其混乱，一旦把文档发给别人或跨设备同步，图片就会全部失效变成“图裂”。

解决方案：这也就是为什么我们要引入**“图床”**的概念。图床可以简单理解为“专门用来统一存放图片并生成网络链接的云端网盘”。
当我们全面希望用 Markdown 替代传统飞书文档时，搭配上图床工具（如 PicGo），当你截图粘贴进 VSCode 时，它能在后台瞬间自动把本地图片上传到云端，并在文档里只留下一行干净的网络链接。这样图片不再跟文本抢占本地空间，文档如丝般顺滑，彻底告别沉冗的附件与图片失效烦恼。

本人目前使的是 github 作为图床，设置参考：

3.4 图文并茂的可视化表达

利用 AI，复杂的图表只需“出一张嘴”或“一段提示词”。

3.4.1 工具 1：Mermaid 图工具

Mermaid 是什么？能干什么？
Mermaid 是一种基于纯文本语法的画图代码。你不需要用鼠标去繁琐地拖拽连线，只要像写普通句子一样写几行关系代码（比如 A --> B），它就能自动渲染成标准的结构图表。
**打破门槛的化学反应：**对我们普通人来说，现在甚至完全不需要去背诵学习它的语法，只要让 AI 直接把梳理好的逻辑转手输出一段 Mermaid 代码，它就能在 Markdown 里瞬间变身图表：

查看mermaid具体代码

graph TD
    subgraph Raw_Data [原始养料_Raw Data]
        D1[D1: 文档_手册_SOP<br>当前缺失] 
        D2[D2: 结构化时序数据<br>IBMS_能耗_IoT]
    end

    subgraph LLM_Capability [文科生能力_LLM]
        L1(L1: RAG 知识检索)
        L2(L2: 意图识别)
        L3(L3: 话术生成)
    end

    subgraph Algo_Capability [理科生能力_算法_规则_当前缺失项]
        A1[A1: 数据清洗与特征工程]
        A2[A2: 异常检测模型]
        A3[A3: 归因分析_专家规则 <br>或 机器学习模型]
    end

    subgraph Output_Value [输出价值]
        V1[V1: 专家级洞察]
        V2[V2: 预测性建议]
    end

    D1 -.-> L1
    D2 --> A1
    A1 --> A2
    A2 --> A3
    A3 --> L3
    L1 --> L3
    L3 --> V1
    L3 --> V2

    %% 样式定义：统一缺失环节为红框实线，并强制黑色字体以适配 Dark Mode
    classDef missing fill:#ffcccc,stroke:#ff0000,stroke-width:2px,color:#000;
    class D1,A1,A2,A3 missing;

类型	缩略图 (点击展开大图)
脑图	查看大图
流程图	查看大图
架构图	查看大图

3.4.2 工具 2：Excalidraw 画图工具

极其优秀的白板工具（官网演示版：https://excalidraw.com/）。原版的网页端只是一个单纯的手绘风白板，考虑到本地文档的关联方便，我们这里探讨的实际上是直接使用的 VSCode 专属插件版本。
结合 AI 以后，我们可以直接让 AI 通过文本指令替代我们“执笔”输出带有手绘草图风格的画版，而不需要再从零拉框手绘画图。

类型	缩略图 (点击展开大图)
流程图	查看大图
原型	查看大图
架构图	查看大图

如何让 AI 直接帮你画出复杂的 Excalidraw？

提示词大法（Prompt）：你可以预设一个“资深可视化架构分析专家”的角色，让 AI 直接输出 .excalidraw.json 格式的文件。
日常偷懒大法：
实际上大多数时候我不会这么麻烦，非常口语化的直接让ai生成可导入excalidraw的json内容

注：当然，如果你的项目不在乎 Token 预算费用，并且能忍耐较长时间的生图等待，直接找最新的强大原生多模态 AI 一键生成高清图片效果固化呈现固然更好；但 Excalidraw 依然胜在它极其适合于我们需要随时落地编辑、局部调整或者结构化更改的思维导图及架构场景

3.5 进阶场景：让 AI 帮你做一份精美的 PPT

做汇报、做分享，不可避免要用到 PPT。在 PPT 制作这个场景下，我摸索出了一个绝佳的 AI 组合打法：

前期素材准备（VSCode）：首先在 VSCode 中利用上述提到的 AI 助手，通过对话交流，先把 PPT 的内容素材、核心观点理顺，直接让 AI 梳理出极其详细的 PPT 大纲（Outline）。
后期生成 PPT（NotebookLM）：拿着准备好的大纲，直接去 NotebookLM 平台生成。市面上有很多号称能一键生成 PPT 的同类工具，但它们大多只能机械地套用匹配预制的结构模板。而 NotebookLM 利用了其多模态能力和 Nano banana 2 极其强大的生图能力，能根据段落内容语境自动生成有意义的、高度贴配的相关插画配图，在同类产品中拥有真正“断层领先”的体验水平。
- 我的演示示例：NotebookLM 生成 PPT 分享示例
- 缺点与后期二次修图补救方案：由于 NotebookLM 生成的内容往往带有平台水印、最终导出多是不可被选中的纯图片，而且部分中文字体的版面支持尚不完美。
- 解决方案推荐：我极力推荐后期转用 WPS 的 AI 工具进行二次修改——利用它极其完善的内置文字 AI 修改、AI 消除和去图片水印（只需开通 WPS 会员，例如从 PDD 上获取的单日会员仅约 0.28 元/天）。如果你想追求零成本，Windows 自家的“电脑管家”内置的“智能圈选”同样能实现免费的图片内排版文字提取编辑替换，但整体丝滑度手感我始终建议首选 WPS。

四、进阶应用：产品设计与 AI 编程的初探

注：以下部分主要是面向产品同学，但非产研同学也可以作为了解 AI 编程潜力的一个绝佳起点听一听。

不仅是写文档，我们甚至可以直接利用 AI 跨界完成原型设计，缩短产品与研发的壁垒。

4.1 AI 驱动的产品全流程实战

PRD示例展示：大家可以看到如何用纯净结构化的方式描写产品需求。
现在的 PRD 设计，绝不仅限于前期需求的调研、方案的设计或是流程图的梳理，甚至还可以直接包含极简的文字版交互原型。此时 AI 就是最懂你的思维搭子。正如我们前面所屡次提到的：要去了解 AI、用 AI 的语言去重构文档，并且充分发挥想象力去拥抱它，这样 AI 才能反过来极大程度地帮助你。

现场演示：奇瑞项目工作区全流程
在分享时，我会直接打开奇瑞项目的真实工作区。大家可以看到，在一个完整的产品项目中，不仅仅是最终的 PRD 文档才用到 AI，实际上从项目的最早期阶段就已在全面拥抱 AI：

业务需求的 Markdown 化：把甲方的原始需求、会议纪要等散乱信息，通过 AI 整理成结构清晰的 Markdown 需求文档。
- 奇瑞AI-甲方原始需求
需求调研的 Markdown 化：比如飞书开发者平台的会议预定 API 接口文档，也是通过 AI 进行调研、抓取、整理并讨论，最终沉淀为本地可追溯的 Markdown 调研报告。
- 奇瑞项目_甲方调研清单
智能体逻辑设计：AI 不仅帮你写文档，甚至可以帮你梳理和设计智能体的内部逻辑流程。
- 智能体逻辑流程设计
最终 PRD 设计文档：前面所有步骤沉淀下来的结构化素材，最终汇聚为一份极其完整的 PRD 文档——这才是 AI 作为"思维搭子"的完整链路。
- AI纳管PRD

4.2 原型设计的降维打击

提及 AI 生成原型，我们不仅要把它看作是输出一张张用于视觉展示的静态参考图，更应该意识到：现在的技术允许我们直接利用 AI 将脑海里只言片语的需求设想，彻底转化并生成一段直接能在浏览器里运行操作的前端底座代码（比如网页端真实的 HTML/JS 逻辑）。
这就意味着，即便是根本不具备开发经验和不会写底层代码的产品团队或业务人员，也能亲自动手打通一套真实可点击、有关联交互和响应状态的系统级原型 Demo，这是一种以往沟通链路上前所未有的“技术平权”。

4.2.1 传统 AI 网页原型生成

常规做法是将需求传递给 AI，让其直接生成可在浏览器打开的 HTML 网页原型，有两种主要输入方式：

图生成（贴图让 AI 还原）：直接扔一张草图或截图，AI 帮你无损还原成真实可交互的网页。
- 这里引用了满仓的上次分享材料的截图
  点击查看大图
提示词生成（文字描述驱动）：
- 意图输入：使用 PRD示例描述功能和页面需求。
- 风格注入：使用 UI设计模板约束整体排版质感，让 AI 生成的页面直接呈现标准化的高质量视觉风格。
- 生成结果示例：触发器管理页面原型
- 未来探索：甚至可以通过 Cursor 的 MCP 工具无缝打通 Figma，实现从画板设计稿到最终代码之间真正无损的"大一统"。

4.2.2 进阶用法：ASCII 约束原型 + 进阶工作流

上面"提示词生成"有一个隐患：如果纯靠文字描述一个复杂页面的布局，文本天然存在歧义，AI 非常容易跑偏。

我的解法是在 PRD 文档里直接内嵌 ASCII 纯文本骨架原型来给 AI 做空间约束。这套方法有两大核心好处：

流程极快、不切流：不需要打开专门的画图软件一点点手绘排版，手指不用离开键盘，纯文字直接勾勒页面结构，速度极快。
给 AI 极强的视觉约束（最重要）：ASCII 原型相当于给 AI 提供了一份"页面地图"，可以极好地指导和限制 AI 的生成布局，最终生成的网页结果会非常贴合你的预期，大幅降低反复调试的成本。

我的实战文档飞书小程序_原型设计_v1.0.pdf 完整使用了这套方法，最终生成的原型成果：生成的小程序。

4.3 AI 编程：远不止做原型

上面展示的原型设计只是 AI 编程能力的冰山一角。事实上，借助当前的 AI 编程工具，一个产品经理也可以独立完成过去需要专业开发团队才能实现的完整项目。

以下是我个人在过去一年中，通过 AI 辅助编程实际交付的部分项目（除地图 AR 交互为高保真原型外，其余项目均为具备完整功能的可交付系统）：

领域	代表项目	一句话描述
🏛️ 地图AR交互	蜂鸟地图室内导航系统	集成 3D 地图、AR 寻宝、位置共享的科技馆 Web 应用
📸 AI 视觉	智能人像抠图工具	YOLOv8 + PaddlePaddle 实时人像分割的桌面应用
🕸️ 可视化	知识图谱浏览器	CSV 一键生成 2D/3D 交互式知识图谱
🤖 知识工程	知识库自动化工坊	从海量对话数据到高质量 FAQ 的全自动 ETL 管线
📊 AI 评测	智能体评测平台	批量测试 Coze 数字人回复质量，多维度自动评分的全链路系统

这些项目涵盖了 Web 全栈、桌面应用、机器学习管线等多个维度。限于今天的分享时间，这里只做一个简单的展示。如果大家对 AI 编程感兴趣，欢迎后续私下交流，我们可以再做一次专题分享！

五、效率翻倍：更多 AI 生产力小神器

5.1 语音输入工具（打破键盘瓶颈）

代体：我目前在用的工具，使用的是本地 800多MB 的 SenseVoice（非大模型，响应极快）+ 大模型语义修正（我配置的是 modelscope 免费的 Qwen3 模型）。
Capslock：我自己开发的工具，接入的是腾讯的 ASR（自动语音识别）和字节的 LLM ASR。

5.2 AI 浏览器（指路明灯）

如 Perplexity。
核心使用场景：

查找传统搜索引擎难以搜集或已经过时的信息，比如非常新的官方开发文档（如最新的飞书 API）。
充当复杂技术域的向导：当我们面对不懂如何操作的现代技术网站，比如 Cloudflare、Railway、Vercel 等，它可以作为一步步教你的导师。