前几天,领导丢给我一份红头文件 PDF:《关于开展2026年度医院物联网创新发展科研计划的通知》。里面密密麻麻提了 17 个科研方向,作为非医疗行业的从业者,我看完是一头雾水。
但这有一个致命痛点:这只是一份“人尽皆知”的通用调研,它并不知道这 17 个方向跟我们公司有什么关系?我们能接得住哪些需求?
思考:同样是面对 AI,差距是怎么产生的?
为什么有的人用 AI,觉得它就像个听不懂人话的智障,只能写一写放之四海而皆准的废话?而有的人用 AI,却能让它成为深谙公司业务架构的顶级智囊?
这,就是我们今天分享的核心主题——是否具备 AI Native(AI 原生)的思维!
“从设计之初就把 AI 当成核心能力,而不是后期 ‘加上去’ 的功能。”
通俗对比:
为了达到开场讲的那个“魔术效果”,首要条件就是我们要学会用 AI 听得懂的语言和它沟通。
要想让 AI 真正懂你,首先要给它提供它可以“看懂”的文档。
目前行业上公认的、能被大多数 AI 模型最完美解析的文档格式,就是 Markdown。它没有那些复杂的排版干扰,全是结构化的纯净文本。
如何把我们日常遇到的各种文件迅速转化为 Markdown?
MinerU(全能解析)
Jina(网页抓取)
https://r.jina.ai/https://open.feishu.cn/document/develop-gadgets-(not-recommended)/basic-information/overview (某些场景下 MinerU 解析不了网页,比如一些动态渲染反爬取的场景,可以用来解析文本)飞书2md(飞书专用)
就像开场所展示的,无论 AI 多聪明,你不给它《营销话术》,它就永远不知道公司业务,做出来的就是通用回答。
衍生思考:这就引出了**“公司资产的 AI 化”**——公司越快拥抱 AI(构建起各个业务线的数字语料库),AI 才能越精准地帮助公司。
掌握了输入基建后,你可以立刻在日常工作中享受到 AI 的效率红利。在这里我们重点推荐一款神奇的工具作为一切的基础:VSCode。
可能大家听说过 VSCode 是程序员用来写代码的工具(IDE),但其实,在丰富的插件加持下,它对我来说更是一个无比强大的文档编辑管理工具。
市面上有 Cherry Studio、Notegen、ima、Obsidian 等各种个人文档知识库管理工具,各有优缺点;但我个人实际使用的是 VSCode,并通过 GitHub 进行跨机器的云端同步。更重要的是,目前大多数顶级的 AI 生产力插件,都是基于 VSCode 这个平台开发的,所以我们非常有必要先从它讲起。
传统 Web 网页端问答(如 ChatGPT / Kimi)的痛点:
你问一句,AI 答一句。然后你需要自己当“搬运工”,反复把 AI 的回答“复制粘贴(Copy & Paste)”整理到文档里。如果你的文档需要参考好几份资料,你还得手动一个个把文件上传喂给 AI,操作极其繁琐。
本地 AI 编辑工具(基于 VSCode)的降维打击:
@ 加上文件名,就能瞬间把复杂的背景资料传给 AI。注:Google 现在也有一个“边聊边改”的网页版 Canvas 模式,大家可以看这个示例:Google Canvas 演示 ,但从变更明细查看和版本溯源的角度来看,目前依然不如本地 VSCode 方便。
因为我的核心诉求是“让 AI 直接阅读、分析并按需编辑本地文档”,虽然市面上的工具形态有很多种,但实现效果本质都差不多。以下是我常用的几个绝佳选择:
通过 Markdown 编辑器配合 CSS / HTML,你的笔记和汇报可以轻易呈现出极为高级的质感。
我们可以直接在 Markdown 中嵌入 CSS,从而实现当前大家看到的 目录样式 ,文字中夹杂的 气泡标签。
动效与视觉展现:
<link rel="stylesheet" href="https://gitee.com/tataboxer/pub/raw/master/markdown-global-style.css">
大家也可以在文档直接贴上述这串代码,来体验下这个样式效果
背景痛点:过去很多人弃用本地文档、转投飞书等在线文档的一个巨大痛点,就是图片的展示与保存问题。在本地写文档时,你随意 Copy & Paste(复制粘贴)一张图片,本地路径会变得极其混乱,一旦把文档发给别人或跨设备同步,图片就会全部失效变成“图裂”。
解决方案:这也就是为什么我们要引入**“图床”**的概念。图床可以简单理解为“专门用来统一存放图片并生成网络链接的云端网盘”。
当我们全面希望用 Markdown 替代传统飞书文档时,搭配上图床工具(如 PicGo),当你截图粘贴进 VSCode 时,它能在后台瞬间自动把本地图片上传到云端,并在文档里只留下一行干净的网络链接。这样图片不再跟文本抢占本地空间,文档如丝般顺滑,彻底告别沉冗的附件与图片失效烦恼。
本人目前使的是 github 作为图床,设置参考:
利用 AI,复杂的图表只需“出一张嘴”或“一段提示词”。
Mermaid 是什么?能干什么?
Mermaid 是一种基于纯文本语法的画图代码。你不需要用鼠标去繁琐地拖拽连线,只要像写普通句子一样写几行关系代码(比如 A --> B),它就能自动渲染成标准的结构图表。
**打破门槛的化学反应:**对我们普通人来说,现在甚至完全不需要去背诵学习它的语法,只要让 AI 直接把梳理好的逻辑转手输出一段 Mermaid 代码,它就能在 Markdown 里瞬间变身图表:
graph TD
subgraph Raw_Data [原始养料_Raw Data]
D1[D1: 文档_手册_SOP<br>当前缺失]
D2[D2: 结构化时序数据<br>IBMS_能耗_IoT]
end
subgraph LLM_Capability [文科生能力_LLM]
L1(L1: RAG 知识检索)
L2(L2: 意图识别)
L3(L3: 话术生成)
end
subgraph Algo_Capability [理科生能力_算法_规则_当前缺失项]
A1[A1: 数据清洗与特征工程]
A2[A2: 异常检测模型]
A3[A3: 归因分析_专家规则 <br>或 机器学习模型]
end
subgraph Output_Value [输出价值]
V1[V1: 专家级洞察]
V2[V2: 预测性建议]
end
D1 -.-> L1
D2 --> A1
A1 --> A2
A2 --> A3
A3 --> L3
L1 --> L3
L3 --> V1
L3 --> V2
%% 样式定义:统一缺失环节为红框实线,并强制黑色字体以适配 Dark Mode
classDef missing fill:#ffcccc,stroke:#ff0000,stroke-width:2px,color:#000;
class D1,A1,A2,A3 missing;
| 类型 | 缩略图 (点击展开大图) |
|---|---|
| 脑图 | 查看大图![]() |
| 流程图 | 查看大图![]() |
| 架构图 | 查看大图![]() |
极其优秀的白板工具(官网演示版:https://excalidraw.com/)。原版的网页端只是一个单纯的手绘风白板,考虑到本地文档的关联方便,我们这里探讨的实际上是直接使用的 VSCode 专属插件版本。
结合 AI 以后,我们可以直接让 AI 通过文本指令替代我们“执笔”输出带有手绘草图风格的画版,而不需要再从零拉框手绘画图。
| 类型 | 缩略图 (点击展开大图) |
|---|---|
| 流程图 | 查看大图![]() |
| 原型 | 查看大图![]() |
| 架构图 | 查看大图![]() |
如何让 AI 直接帮你画出复杂的 Excalidraw?
.excalidraw.json 格式的文件。注:当然,如果你的项目不在乎 Token 预算费用,并且能忍耐较长时间的生图等待,直接找最新的强大原生多模态 AI 一键生成高清图片效果固化呈现固然更好;但 Excalidraw 依然胜在它极其适合于我们需要随时落地编辑、局部调整或者结构化更改的思维导图及架构场景
做汇报、做分享,不可避免要用到 PPT。在 PPT 制作这个场景下,我摸索出了一个绝佳的 AI 组合打法:
注:以下部分主要是面向产品同学,但非产研同学也可以作为了解 AI 编程潜力的一个绝佳起点听一听。
不仅是写文档,我们甚至可以直接利用 AI 跨界完成原型设计,缩短产品与研发的壁垒。
PRD示例展示:大家可以看到如何用纯净结构化的方式描写产品需求。
现在的 PRD 设计,绝不仅限于前期需求的调研、方案的设计或是流程图的梳理,甚至还可以直接包含极简的文字版交互原型。此时 AI 就是最懂你的思维搭子。正如我们前面所屡次提到的:要去了解 AI、用 AI 的语言去重构文档,并且充分发挥想象力去拥抱它,这样 AI 才能反过来极大程度地帮助你。
现场演示:奇瑞项目工作区全流程
在分享时,我会直接打开奇瑞项目的真实工作区。大家可以看到,在一个完整的产品项目中,不仅仅是最终的 PRD 文档才用到 AI,实际上从项目的最早期阶段就已在全面拥抱 AI:
提及 AI 生成原型,我们不仅要把它看作是输出一张张用于视觉展示的静态参考图,更应该意识到:现在的技术允许我们直接利用 AI 将脑海里只言片语的需求设想,彻底转化并生成一段直接能在浏览器里运行操作的前端底座代码(比如网页端真实的 HTML/JS 逻辑)。
这就意味着,即便是根本不具备开发经验和不会写底层代码的产品团队或业务人员,也能亲自动手打通一套真实可点击、有关联交互和响应状态的系统级原型 Demo,这是一种以往沟通链路上前所未有的“技术平权”。
常规做法是将需求传递给 AI,让其直接生成可在浏览器打开的 HTML 网页原型,有两种主要输入方式:

上面"提示词生成"有一个隐患:如果纯靠文字描述一个复杂页面的布局,文本天然存在歧义,AI 非常容易跑偏。
我的解法是在 PRD 文档里直接内嵌 ASCII 纯文本骨架原型来给 AI 做空间约束。这套方法有两大核心好处:
我的实战文档 飞书小程序_原型设计_v1.0.pdf 完整使用了这套方法,最终生成的原型成果:生成的小程序。
上面展示的原型设计只是 AI 编程能力的冰山一角。事实上,借助当前的 AI 编程工具,一个产品经理也可以独立完成过去需要专业开发团队才能实现的完整项目。
以下是我个人在过去一年中,通过 AI 辅助编程实际交付的部分项目(除地图 AR 交互为高保真原型外,其余项目均为具备完整功能的可交付系统):
| 领域 | 代表项目 | 一句话描述 |
|---|---|---|
| 🏛️ 地图AR交互 | 蜂鸟地图室内导航系统 | 集成 3D 地图、AR 寻宝、位置共享的科技馆 Web 应用 |
| 📸 AI 视觉 | 智能人像抠图工具 | YOLOv8 + PaddlePaddle 实时人像分割的桌面应用 |
| 🕸️ 可视化 | 知识图谱浏览器 | CSV 一键生成 2D/3D 交互式知识图谱 |
| 🤖 知识工程 | 知识库自动化工坊 | 从海量对话数据到高质量 FAQ 的全自动 ETL 管线 |
| 📊 AI 评测 | 智能体评测平台 | 批量测试 Coze 数字人回复质量,多维度自动评分的全链路系统 |
这些项目涵盖了 Web 全栈、桌面应用、机器学习管线等多个维度。限于今天的分享时间,这里只做一个简单的展示。如果大家对 AI 编程感兴趣,欢迎后续私下交流,我们可以再做一次专题分享!
如 Perplexity。
核心使用场景: