AI 应用开发全景 & 系列视频介绍

小麦2025年08月09日1933 字

新系列开坑了,一个面向前端技术栈友好的 AI 应用开发专题。

大家好,欢迎来到全新系列视频,《通俗易懂 AI 应用开发》的第一期。

我将在这一期视频中,首先谈谈我对 AI 应用开发的全景认知,以及后续视频内容的计划。

AI 应用开发是一个非常前沿的领域,在正式开始之前,不妨先了解一下是什么 AI 应用开发,以及它涵盖哪些具体内容。

首先,AI 应用开发是指利用人工智能技术,构建具备智能功能的软件应用的过程。

这里有两个关键点:人工智能技术和智能功能。许多软件都宣称自己是智能软件,但要注意区分自动化和智能化。

它们可能只是实现了自动化而非智能化,真正的智能需要包含:感知、推理和行动这几个要素。

我们熟知的 DeepSeek 思考过程其实就是智能中推理的表现。

AI 应用开发的核心目标就是:如何将人工智能技术落地到生产生活中?

那么 AI 应用开发具体有哪些内容呢?

下面这张图展示了我认知中的 AI 应用开发全景,从最下面的基础层到终态通用人工智能,让我一一道来。

首先,数据、算法和模型是上层应用的基础,就像建高楼前要打的地基,数据工程、模型训练和调优都在这里完成。

大多数 AI 应用开发者其实并不直接参与基础层的工作,而是直接使用接入层提供的服务。

在接入层,模型即服务(MaaS)是指将底层模型作为云服务提供给开发者的模式,开发者可以通过简单的 API 调用来使用模型,而无需自己进行模型的开发、训练和部署。

这是一种非常简单和方便的集成模式,能满足大多数需求。

另外,有一部分开发者会自己进行模型微调或是训练自己的领域模型,搭建自己的服务来实现更精细的功能。

来到技术基建,这一层提供构建 AI 应用的核心技术。

常用的开发框架有:模型服务商为各种编程语言提供的 SDK,比如 OpenAI 的 SDK、开源框架 LangChain、LangGraph、LlamaIndex、Haystack 等等。

提示工程大家可能不太陌生,它侧重提示词的编写规则和技巧,以在不改变模型的情况下获得更好的效果。

网络上也有关于提示工程非常好的学习资料,这里就不细讲了。

RAG 全称检索增强生成,是目前比较重要的一个技术。像是智能客服、知识库问答、以及一系列基于特定数据的检索式应用,其背后都是 RAG 技术。

RAG 技术其实是比较复杂的,本身包含:分块(Chunk)、向量化(Embedding)、检索器(Retriever)和生成(Generate)等技术点,每一块技术点在工程实践中都大有学问,值得好好研究。

流程引擎听起来挺高级,它其实是支撑基于 Workflow 工作流应用的底层技术。

有朋友应该听说过:Dify、n8n、Coze 这样的产品,它们背后都有一套流程引擎来调度工作流。

然后是我用黄色虚线框标注的上下文工程、MCP 和 A2A,它们都是近期出现的新名词,有的是工程实践方法论,有的是通信协议规范,都属于早期的技术探索。

而应用观测是用于监测和评估应用效果的常用技术手段,可从传统软件的工程实践中迁移过来。

当然,由于篇幅有限,技术基建这块还有一些内容我并没有画出来,不过不妨碍我们入门理解。

来到上层应用这块,相对初级的 AI 应用便是聊天机器人和提示词应用。

它们都是没有外挂知识,仅仅基于模型本身的知识和能力回答用户提问。

提示词应用相比白板 Chat Bot,预制了固定的系统提示词来完成特定风格的任务,像是出现在聊天对话框周边的各类 xx 助手,都算在此列。

如果再深入一些,那么会接触到工作流(Workflow)、智能体(Agent)、以及智能体编排这些概念。

刚刚说过工作流,即按照固定的先后顺序,事先用线串联节点,编排好完成一件事情的具体流程。在节点中调用大模型完成一部分需要智能的任务。

不过就像先前所说,这更像是一种自动化,而不是智能化。

相反,Agentic AI 是一种更加智能,能充分发挥模型推理能力的范式。

采用 Agentic AI 范式的应用,可以自主决策和使用工具从头到尾地完成任务,而不需要非常复杂的工作流编排。

Agentic AI 本身也包含多种结构,像 Reflection、Tool Use、Planning 和 MultiAgent,虽然它们的结构看起来非常简单,但却能非常灵活地完成任务。

Agent 编排则更进一步,用于在多 Agent 系统中处理好各 Agent 之间的协作关系。

常见的 Coding Agent,比如 Cursor 的 Agent 模式就是一种 Agentic AI。

前段时间一票难求的 Manus,是 Agentic AI 范式下的多 Agent 系统。

OK,那么以上这就是我关于 AI 应用开发的全景认知。

回到正题,《通俗易懂 AI 应用开发》这个系列视频具体会涉及哪些内容呢?

考虑到技术更迭、观众受众和制作成本,我选取了这个图中较为基础的部分作为讲解内容。

我会从具体的项目开始,以一期实践视频 + 一期解析视频的节奏发布。

实践视频以敲代码为主,重点是将功能用较少的代码实现出来;而解析视频则侧重讲解代码背后的底层原理。

同时,我也会将每一期视频的代码开源,方便大家学习复现。

另外,我会以 TypeScript 作为主要的编程语言,一方面是因为我是职业前端工程师更熟悉 TS,另一方面是我演示的项目会包含完整的前端 UI。

使用统一的语言和技术栈能减少不必要的麻烦。

那么很自然的,我会在视频中包含部分前端技术栈的讲解,包括但不限于使用 Node.js 实现服务端和 CLI,使用 React 构建 UI,前后端的流处理方法,样式库和组件库的使用。

相信之前关注我的前端朋友会比较感兴趣。

如果你觉得这期视频对你有帮助,或者对后续内容非常期待,不妨点个关注支持一下。

我是小麦,一位热爱技术和分享的软件工程师,我们下期再见。

本文为「捣鼓键盘的小麦」原创文章,转载请联系微信:Micoozlee

评论

你需要先登录才能发表评论
Made by 捣鼓键盘的小麦 / © 2025 Front Talk 版权所有