AI 使用分享

开场:一个真实的“魔法”瞬间

前几天,领导丢给我一份红头文件 PDF:《关于开展2026年度医院物联网创新发展科研计划的通知》。里面密密麻麻提了 17 个科研方向,作为非医疗行业的从业者,我看完是一头雾水。

但这有一个致命痛点:这只是一份“人尽皆知”的通用调研,它并不知道这 17 个方向跟我们公司有什么关系?我们能接得住哪些需求?

思考:同样是面对 AI,差距是怎么产生的?

为什么有的人用 AI,觉得它就像个听不懂人话的智障,只能写一写放之四海而皆准的废话?而有的人用 AI,却能让它成为深谙公司业务架构的顶级智囊?

这,就是我们今天分享的核心主题——是否具备 AI Native(AI 原生)的思维!


一、 认知启航:什么是真正的 AI Native?

“从设计之初就把 AI 当成核心能力,而不是后期 ‘加上去’ 的功能。”

通俗对比:

为了达到开场讲的那个“魔术效果”,首要条件就是我们要学会用 AI 听得懂的语言和它沟通


二、 核心基建:如何把工作转化为 AI 听得懂的语言?

要想让 AI 真正懂你,首先要给它提供它可以“看懂”的文档。

2.1 AI 的母语:Markdown

目前行业上公认的、能被大多数 AI 模型最完美解析的文档格式,就是 Markdown。它没有那些复杂的排版干扰,全是结构化的纯净文本。

2.2 素材转化神器:如何将传统文档 Markdown 化?

如何把我们日常遇到的各种文件迅速转化为 Markdown?

  1. MinerU(全能解析)

    • 支持 PDF / Word / PPT / HTML 解析。
    • 功能:把内容拆分为文字和图片,图片部分如可以 OCR 会自动 OCR,图片以链接形式插入 Markdown 文档。
    • 扩展:还支持 JSON 格式,对格式布局可以一定程度保留。
    • 门槛:无门槛,下载即用。
  2. Jina(网页抓取)

    • 功能:HTML 转 Markdown。
    • 链接https://jina.ai/reader/
    • 示例用法https://r.jina.ai/https://open.feishu.cn/document/develop-gadgets-(not-recommended)/basic-information/overview (某些场景下 MinerU 解析不了网页,比如一些动态渲染反爬取的场景,可以用来解析文本)
    • 门槛:无门槛,下载即用。
  3. 飞书2md(飞书专用)

    • 功能:将飞书文档一键转存为 Markdown。
    • 链接https://github.com/Wsine/feishu2md
    • 门槛:轻度门槛,需使用命令行工具进行配置,且需要在飞书审核开放平台获取 APP ID 和 APP SECRET 信息。

2.3 核心法则:给 AI 充分的“上下文”

就像开场所展示的,无论 AI 多聪明,你不给它《营销话术》,它就永远不知道公司业务,做出来的就是通用回答。
衍生思考:这就引出了**“公司资产的 AI 化”**——公司越快拥抱 AI(构建起各个业务线的数字语料库),AI 才能越精准地帮助公司。


三、 全员通用场景:让 AI 帮你做调研、写文档与画图

掌握了输入基建后,你可以立刻在日常工作中享受到 AI 的效率红利。在这里我们重点推荐一款神奇的工具作为一切的基础:VSCode

3.1 为什么推荐 VSCode 作为你的个人知识库与 AI 助理?

可能大家听说过 VSCode 是程序员用来写代码的工具(IDE),但其实,在丰富的插件加持下,它对我来说更是一个无比强大的文档编辑管理工具
市面上有 Cherry Studio、Notegen、ima、Obsidian 等各种个人文档知识库管理工具,各有优缺点;但我个人实际使用的是 VSCode,并通过 GitHub 进行跨机器的云端同步。更重要的是,目前大多数顶级的 AI 生产力插件,都是基于 VSCode 这个平台开发的,所以我们非常有必要先从它讲起。

3.1.1 痛点对比:为什么不用网页版 AI?

3.2 我常用的 AI 插件与工具组合

因为我的核心诉求是“让 AI 直接阅读、分析并按需编辑本地文档”,虽然市面上的工具形态有很多种,但实现效果本质都差不多。以下是我常用的几个绝佳选择:

  1. Gemini CLI:我用得最多的核心工具之一,依靠其支持的最高 100M 超长上下文记忆,主要用来处理超大项目和长篇资料,底层用的是自家顶级的 Gemini 模型。
  2. Amazon Q 插件:VSCode 专属插件,背后使用的是逻辑推理能力极强的 Claude 4 - 4.5 系列模型。
  3. Antigravity:同样是一款类 VSCode 且集成度非常高的智能体编辑助手,谷歌出品 自带 gemini和claude 4.7 和 gpt
  4. 特别推荐:Trae:如果大家觉得配置这些工具有门槛,或者由于网络原因不方便“翻墙”,最直接的方式是使用 Trae。它是字节跳动出品的一款完全对标 VSCode 的国产软件,自带强大的 AI 能力,免翻墙开箱即用,国内网络直连非常顺畅。

3.3 “所见即所得”的文档排版与质感提升

通过 Markdown 编辑器配合 CSS / HTML,你的笔记和汇报可以轻易呈现出极为高级的质感。

3.3.1 插件的妙用:Markdown 编辑器

3.3.2 CSS 样式和 HTML 标签的结合(让纯文本获得高级质感)

我们可以直接在 Markdown 中嵌入 CSS,从而实现当前大家看到的 目录样式 ,文字中夹杂的 气泡标签

动效与视觉展现:

<link rel="stylesheet" href="https://gitee.com/tataboxer/pub/raw/master/markdown-global-style.css">

大家也可以在文档直接贴上述这串代码,来体验下这个样式效果

3.3.3 图床 PicGo:如何处理庞大的图片?

背景痛点:过去很多人弃用本地文档、转投飞书等在线文档的一个巨大痛点,就是图片的展示与保存问题。在本地写文档时,你随意 Copy & Paste(复制粘贴)一张图片,本地路径会变得极其混乱,一旦把文档发给别人或跨设备同步,图片就会全部失效变成“图裂”。

解决方案:这也就是为什么我们要引入**“图床”**的概念。图床可以简单理解为“专门用来统一存放图片并生成网络链接的云端网盘”。
当我们全面希望用 Markdown 替代传统飞书文档时,搭配上图床工具(如 PicGo),当你截图粘贴进 VSCode 时,它能在后台瞬间自动把本地图片上传到云端,并在文档里只留下一行干净的网络链接。这样图片不再跟文本抢占本地空间,文档如丝般顺滑,彻底告别沉冗的附件与图片失效烦恼。

本人目前使的是 github 作为图床,设置参考:

20260310153555

3.4 图文并茂的可视化表达

利用 AI,复杂的图表只需“出一张嘴”或“一段提示词”。

3.4.1 工具 1:Mermaid 图工具

Mermaid 是什么?能干什么?
Mermaid 是一种基于纯文本语法的画图代码。你不需要用鼠标去繁琐地拖拽连线,只要像写普通句子一样写几行关系代码(比如 A --> B),它就能自动渲染成标准的结构图表。
**打破门槛的化学反应:**对我们普通人来说,现在甚至完全不需要去背诵学习它的语法,只要让 AI 直接把梳理好的逻辑转手输出一段 Mermaid 代码,它就能在 Markdown 里瞬间变身图表:

查看mermaid具体代码
graph TD
    subgraph Raw_Data [原始养料_Raw Data]
        D1[D1: 文档_手册_SOP<br>当前缺失] 
        D2[D2: 结构化时序数据<br>IBMS_能耗_IoT]
    end

    subgraph LLM_Capability [文科生能力_LLM]
        L1(L1: RAG 知识检索)
        L2(L2: 意图识别)
        L3(L3: 话术生成)
    end

    subgraph Algo_Capability [理科生能力_算法_规则_当前缺失项]
        A1[A1: 数据清洗与特征工程]
        A2[A2: 异常检测模型]
        A3[A3: 归因分析_专家规则 <br>或 机器学习模型]
    end

    subgraph Output_Value [输出价值]
        V1[V1: 专家级洞察]
        V2[V2: 预测性建议]
    end

    D1 -.-> L1
    D2 --> A1
    A1 --> A2
    A2 --> A3
    A3 --> L3
    L1 --> L3
    L3 --> V1
    L3 --> V2

    %% 样式定义:统一缺失环节为红框实线,并强制黑色字体以适配 Dark Mode
    classDef missing fill:#ffcccc,stroke:#ff0000,stroke-width:2px,color:#000;
    class D1,A1,A2,A3 missing;
类型 缩略图 (点击展开大图)
脑图
查看大图
流程图
查看大图
架构图
查看大图

3.4.2 工具 2:Excalidraw 画图工具

极其优秀的白板工具(官网演示版:https://excalidraw.com/)。原版的网页端只是一个单纯的手绘风白板,考虑到本地文档的关联方便,我们这里探讨的实际上是直接使用的 VSCode 专属插件版本
结合 AI 以后,我们可以直接让 AI 通过文本指令替代我们“执笔”输出带有手绘草图风格的画版,而不需要再从零拉框手绘画图。

类型 缩略图 (点击展开大图)
流程图
查看大图
原型
查看大图
架构图
查看大图

如何让 AI 直接帮你画出复杂的 Excalidraw?

注:当然,如果你的项目不在乎 Token 预算费用,并且能忍耐较长时间的生图等待,直接找最新的强大原生多模态 AI 一键生成高清图片效果固化呈现固然更好;但 Excalidraw 依然胜在它极其适合于我们需要随时落地编辑、局部调整或者结构化更改的思维导图及架构场景

3.5 进阶场景:让 AI 帮你做一份精美的 PPT

做汇报、做分享,不可避免要用到 PPT。在 PPT 制作这个场景下,我摸索出了一个绝佳的 AI 组合打法:


四、 进阶应用:产品设计与 AI 编程的初探

注:以下部分主要是面向产品同学,但非产研同学也可以作为了解 AI 编程潜力的一个绝佳起点听一听。

不仅是写文档,我们甚至可以直接利用 AI 跨界完成原型设计,缩短产品与研发的壁垒。

4.1 AI 驱动的产品全流程实战

PRD示例展示:大家可以看到如何用纯净结构化的方式描写产品需求。
现在的 PRD 设计,绝不仅限于前期需求的调研、方案的设计或是流程图的梳理,甚至还可以直接包含极简的文字版交互原型。此时 AI 就是最懂你的
思维搭子
。正如我们前面所屡次提到的:要去了解 AI、用 AI 的语言去重构文档,并且充分发挥想象力去拥抱它,这样 AI 才能反过来极大程度地帮助你。

现场演示:奇瑞项目工作区全流程
在分享时,我会直接打开奇瑞项目的真实工作区。大家可以看到,在一个完整的产品项目中,不仅仅是最终的 PRD 文档才用到 AI,实际上从项目的最早期阶段就已在全面拥抱 AI:

4.2 原型设计的降维打击

提及 AI 生成原型,我们不仅要把它看作是输出一张张用于视觉展示的静态参考图,更应该意识到:现在的技术允许我们直接利用 AI 将脑海里只言片语的需求设想,彻底转化并生成一段直接能在浏览器里运行操作的前端底座代码(比如网页端真实的 HTML/JS 逻辑)
这就意味着,即便是根本不具备开发经验和不会写底层代码的产品团队或业务人员,也能亲自动手打通一套真实可点击、有关联交互和响应状态的系统级原型 Demo,这是一种以往沟通链路上前所未有的“技术平权”。

4.2.1 传统 AI 网页原型生成

常规做法是将需求传递给 AI,让其直接生成可在浏览器打开的 HTML 网页原型,有两种主要输入方式:

  1. 图生成(贴图让 AI 还原):直接扔一张草图或截图,AI 帮你无损还原成真实可交互的网页。
    • 这里引用了满仓的上次分享材料的截图
      点击查看大图
  2. 提示词生成(文字描述驱动)
    • 意图输入:使用 PRD示例 描述功能和页面需求。
    • 风格注入:使用 UI设计模板 约束整体排版质感,让 AI 生成的页面直接呈现标准化的高质量视觉风格。
    • 生成结果示例触发器管理页面原型
    • 未来探索:甚至可以通过 Cursor 的 MCP 工具无缝打通 Figma,实现从画板设计稿到最终代码之间真正无损的"大一统"。

4.2.2 进阶用法:ASCII 约束原型 + 进阶工作流

上面"提示词生成"有一个隐患:如果纯靠文字描述一个复杂页面的布局,文本天然存在歧义,AI 非常容易跑偏。

我的解法是在 PRD 文档里直接内嵌 ASCII 纯文本骨架原型来给 AI 做空间约束。这套方法有两大核心好处:

  1. 流程极快、不切流:不需要打开专门的画图软件一点点手绘排版,手指不用离开键盘,纯文字直接勾勒页面结构,速度极快。
  2. 给 AI 极强的视觉约束(最重要):ASCII 原型相当于给 AI 提供了一份"页面地图",可以极好地指导和限制 AI 的生成布局,最终生成的网页结果会非常贴合你的预期,大幅降低反复调试的成本。

我的实战文档 飞书小程序_原型设计_v1.0.pdf 完整使用了这套方法,最终生成的原型成果:生成的小程序

4.3 AI 编程:远不止做原型

上面展示的原型设计只是 AI 编程能力的冰山一角。事实上,借助当前的 AI 编程工具,一个产品经理也可以独立完成过去需要专业开发团队才能实现的完整项目。

以下是我个人在过去一年中,通过 AI 辅助编程实际交付的部分项目(除地图 AR 交互为高保真原型外,其余项目均为具备完整功能的可交付系统):

领域 代表项目 一句话描述
🏛️ 地图AR交互 蜂鸟地图室内导航系统 集成 3D 地图、AR 寻宝、位置共享的科技馆 Web 应用
📸 AI 视觉 智能人像抠图工具 YOLOv8 + PaddlePaddle 实时人像分割的桌面应用
🕸️ 可视化 知识图谱浏览器 CSV 一键生成 2D/3D 交互式知识图谱
🤖 知识工程 知识库自动化工坊 从海量对话数据到高质量 FAQ 的全自动 ETL 管线
📊 AI 评测 智能体评测平台 批量测试 Coze 数字人回复质量,多维度自动评分的全链路系统

这些项目涵盖了 Web 全栈、桌面应用、机器学习管线等多个维度。限于今天的分享时间,这里只做一个简单的展示。如果大家对 AI 编程感兴趣,欢迎后续私下交流,我们可以再做一次专题分享!

五、 效率翻倍:更多 AI 生产力小神器

5.1 语音输入工具(打破键盘瓶颈)

5.2 AI 浏览器(指路明灯)

Perplexity
核心使用场景:

  1. 查找传统搜索引擎难以搜集或已经过时的信息,比如非常新的官方开发文档(如最新的飞书 API)。
  2. 充当复杂技术域的向导:当我们面对不懂如何操作的现代技术网站,比如 Cloudflare、Railway、Vercel 等,它可以作为一步步教你的导师。