4分钟搭建一个基于豆包大模型的中药材识别系统，大模型入门到精通，收藏这篇就足够了！

我对产品的理解是：通过一种精妙的方法解决了一个问题，而这个问题恰好是大多数人所面临的共性问题。然而，不可能将这种方法逐一传授给每个人。

程序学到昏

8816人浏览 · 2025-10-11 10:24:58

程序学到昏 · 2025-10-11 10:24:58 发布

在演示和操作方面，我们可以先简要了解豆包大模型在哪些层面进行了升级。接下来，我们将通过一段画面来展示豆包大模型在图片理解和视觉理解层面的升级内容。

视觉是人类了解世界最重要的手段，对于大模型来说亦是如此。只有具备优秀的视觉理解能力，模型才能有效处理真实世界的信息，辅助人类完成一系列复杂工作。

豆包大模型升级后的图片理解能力，如何通过产品化真正发挥其价值，是值得深入探索的方向。

我反复强调的一个观点是大模型能力的产品化之路。在内部，我们常将大模型比作水，这一比喻源自NFX的一篇论文《AI is like water》。大模型能力如同水，水是生命之源，但只有当它被装入瓶中时，才能真正发挥价值。因此，要让大模型发挥其优势，必须为它找到最合适的容器，使其能够被引用和使用。我们认为这个容器就是产品，即基于大模型开发的应用。

我对产品的理解是：通过一种精妙的方法解决了一个问题，而这个问题恰好是大多数人所面临的共性问题。然而，不可能将这种方法逐一传授给每个人。因此，可以将这种方法转化为产品。用户无需理解产品背后的原理或方法，只需使用这个开箱即用的产品，就能像你一样解决他们所面临的共性问题。这就是大模型能力产品化的真正意义所在。

目前，大家是如何使用豆包大模型的？

这两天，我在尝试让AI完成一些任务。例如，当我看到一道美食时，想了解它的制作方法。过去，我需要通过小红书搜索菜谱，而现在，我只需编写一段提示词，定义AI的角色、背景、画像、能力和目标等。基于这段提示词，我将照片发送给豆包大模型，AI便能返回照片中菜肴的名称、食材以及制作步骤。

当然，这段提示词可能显得复杂。实际上，我也是让AI帮我撰写的——赋予它“提示词专家”的身份，并提供框架，让它生成提示词。随后，我将这段提示词复制粘贴，用于解决特定场景下的任务，例如食物营养分析与建议。通过这种方式，AI能够高效发挥作用。

此外，我还尝试了另一个有趣的应用：识别植物。同样通过AI生成的提示词，当我上传一张植物图片时，AI能够返回植物的名称、别名、拉丁名、简介以及相关诗词等信息。例如，我上传了一张绣球花的照片，AI立即提供了它的名称、别名、花草趣闻和栽种方法等。这类似于“形色”APP的功能——拍摄植物照片即可获取相关信息。

在设计这一流畅的流程后，我思考如何让更多人使用它。如果仅限于在豆包大模型的桌面端交互，其他人无法参与。因此，我想到利用飞书多维表格——我们将其定义为一种产品形态。我的设想是：将豆包大模型的能力整合到多维表格中，通过表格运行这一流程，并将其分享给他人。这样，就能创建一个基于多维表格的“形色”或“未知书”类应用。

当我们意识到豆包大模型具备多模态能力时，

在图片理解等多模态能力升级后，我们将其接入多维表格的自定义捷径功能。现在我将演示如何通过自定义捷径重新启用豆包大模型的全部能力。

这个完整模板的优势在于：用户无需再学习如何编写提示词，例如让AI拍照识别卡路里的提示词，或如何逐步解析AI生成的信息。所有提示词和流程都已封装在这个模板中。

通过分享的模板链接，用户可以直接使用。最简单的操作方式是在仪表盘界面选择所需功能，比如拍照识别热量功能。例如，我可以上传一张战斧牛排的照片进行识别。

我将其上传至搭建的资源管理系统中，选择“晚饭”选项并提交，主题为“吃饺子”。接下来，我们回到主界面，查看后台的具体操作流程。

我上传了一张战斧牛排的照片，AI基于豆包大模型的识别能力，对照片进行分析并打标，识别为西餐，同时提取营养小贴士和食物分类信息，计算卡路里和重量，并在飞书上展示。

我能够收到一条热量记录，其中包含刚刚输入的牛排照片、食材清单、热量估算、重量估算以及营养小贴士。这样我就不必在豆包中重复这些操作。

我发送提示词和照片后，系统会返回分析结果。通过逐步拆解，无需进一步操作。

大家可以直接通过我分享的链接进行操作。我看到已经有人上传了自己的晚餐，并通过AI进行拆解等一系列流程。接下来，我将解释这一过程是如何实现的。

首先，关于字段捷径的使用方法及其核心逻辑：以往多维表格仅有字段这一概念，字段在多维表格中即代表列。多维表格中包含多种类型的列，共有20余种不同的字段。过去添加列的方法是点击加号，在字段类型中选择所需的字段。

现在，我们上线了字段捷径功能。多维表格的字段分为两层：一层是原有的20多种字段，另一层则是字段捷径。只需将鼠标悬停在此处，即可解锁这些字段捷径。其中最关键的一项是AI字段捷径。其核心逻辑在于，以往需要编写复杂提示词才能完成的AI任务，现在已被封装成模板。通过使用字段捷径，用户可以直接基于这些AI字段捷径完成高级AI任务。

使用过字段捷径的用户可能知道，飞书官方此前仅提供6个AI字段捷径，均用于文本处理。这些捷径覆盖了6个常见的通用文本处理场景。

总结、生成、提取、分类、打标、翻译这六项功能。

飞书官方推出了6个文本处理的自定义捷径，以解决这一通用问题。随着上周豆包大模型的升级，多模态能力愈发重要。为此，我们将豆包大模型的图片理解与视觉理解能力整合至官方自定义捷径中。此处标签显示为飞书科技，表明这是与优秀AI团队共创的官方捷径，而非第三方捷径。使用时，只需直接点击即可。

关联账号的步骤非常简单，仅需三分钟即可完成。注册豆包大模型账号后，可立即获得50万免费token。注册方式如下：进入指定模板，查找相关文档，按照步骤操作即可完成注册并获取token。

新建一列后，选择AI图片理解功能，完成账号注册与关联。随后，选择需要AI理解的图片（即附件字段），并输入自定义指令。需特别注意的是，提示词的详细程度对AI在多维表格中的生成结果影响显著。随着多维表格AI能力的持续提升，提示词的质量对生成结果至关重要。

大家可以观察我已插入到这份多维表格中的图片理解任务。该任务的提示词结构如下：

首先，我定义了角色——营养学专家与饮食顾问；其次，设定了任务背景——分析包含多种食材的照片并提供详细信息；接着明确了能力要求、画像特征、技术手段、目标设定、限制条件、输出形式、工作流程以及示例说明。这是一个较为完善的提示词框架，现推荐给大家。

这类提示词显然难以在短时间内手动完成。解决方案是借助AI辅助生成：我向AI说明”你是一名精通提示词工程的AI专家，请根据上述框架为我编写适用于AI识图的提示词”。

具体要求是什么？我希望输出的形式是怎样的？只需将这段话发送给豆包，它会返回一段详细的提示词，即刚才输入到AI识图捷径中的内容。操作非常简单，只需复制粘贴即可。将这段提示词粘贴到新建的”AI图片理解”捷径列中，置于自定义指定位置即可。

接下来，系统将自动生成相关信息。请注意，这些图表并非由我创建。让我们查看生成结果：包含15项分析，如炒面、重量、卡路里等数据。虽然输出内容符合预设框架，但当前呈现方式仍有优化空间。目前的输出结果较为集中，需要进一步拆解为营养助手、食材种类、具体卡路里数值和重量等模块。

若仅作为一次性交付物，当前形式尚可接受。但若要打造开箱即用的产品，必须解决用户核心需求：通过拍照即可直观获取食物热量信息。为此，需要调用更多AI功能模块进行数据拆解。

首先调用分类功能，新建列并选择”分类”字段，输入”分辨料理类型”的提示词。系统成功识别料理类别后，再新建一列调用生成功能，结合食物信息提取和类型识别，生成营养分析与饮食建议。

继续新建列，基于豆包大模型的图像识别结果，提取主要食材名称。卡路里和重量计算则通过新建的AI字段，从图像识别节点生成的信息中提取。最终实现效果：上传照片即可立即获取食材清单、热量值、重量数据及营养建议。

此前有用户反馈使用过类似”形色”的应用，让我们进行对比分析。

在这份数据表中，我希望实现的功能是：上传植物照片后，AI能立即识别并返回植物名称、别名、拉丁名、简介、相关诗词、趣闻、养护方法及植物价值等信息。让我们以“猪葵”为例进行测试。

我已将产品入口链接发布至会议群中，各位可直接点击体验。现在展示这张图片。

复制粘贴至此处，随后点击提交。

接下来，我们查看当前进展。已有大量用户提交了植物照片。请确保上传的是植物照片。

此时，我的飞书应能收到一条回复。关于我刚刚上传的照片，植物识别结果已生成，内容包括植物名称、别名、拉丁名、简介、相关诗词、趣闻、栽种难度、养护方法及植物价值等信息。

系统自动生成了该植物的名片并推送给我。

在飞书多维表格中，我可以生成一个植物画册，清晰地记录我在哪一天识别了哪种植物，这将成为我的个人植物知识库。

回归今日主题，探讨如何将大模型能力产品化，使其真正落地并为用户创造更大价值。关键在于将大模型能力转化为具体可用的产品，如同找到合适的容器装水，从而解决用户的共性问题。这需要思考如何将技术转化为实际应用场景。

进入豆包的桌面端后，输入提示词并上传照片，系统会返回结果。虽然这种方式能解决我的问题，但无法直接推广给更多用户。

现在通过飞书多维表格，只需定义好表结构并在AI捷径中输入提示词和指令，用户即可直接使用该产品。

只需填写表单并获取链接，上传主照片即可使用该产品。这是一个基于飞书多维表格的形色应用。

接下来，我们来看一下具体操作流程。与之前相同，首先新建一列，将鼠标悬停在“探索字段捷径”处，选择新建AI图片理解字段。该功能基于指定图片进行生成，我在此处将所有用户上传的图片都存放在“植物照片”附件字段中。

随后，我输入了一个由AI生成的指令提示词。只需使用我分享给大家的提示词模板，AI就能自动生成符合框架的提示内容。设置完成后，系统即可自动更新，植物名称和拉丁学名等信息都会完整呈现。

为了对这些信息进行结构化处理，我调用了另一个AI字段功能——信息提取。将鼠标悬停在该选项上，选择需要提取的字段（即AI生成的结果），系统就会自动将植物名称、拉丁学名和简介等信息结构化提取出来。

可能有用户会问：如何实现仅通过表单上传照片，无需进入表格就能自动接收消息卡片？这实际上是通过自动化流程实现的。

要获取这一结果，可以通过自动化配置轻松实现。

首先明确自动化的定义：自动化是指通过特定触发条件来引发一系列执行动作的机制。在本场景中，关键需要明确具体的触发条件设置。

对于AI生成的场景，触发条件通常需要选择新增或修改的记录满足特定条件。这是因为AI生成是一个过程，必须确保每个AI字段对应的单元格包含信息后才能进行推送。具体条件是这些AI字段对应的单元格不为空。虽然有人建议可以延迟几分钟，但最稳妥的方式仍是确保单元格非空。

执行动作是发送飞书消息，需定义接收方式、标题等内容。可以直接引用第一条记录中的条件，点击加号逐一引用，操作非常简单。完成后即可生成自动化界面。

那么，使用飞书多维表格搭建的拍照识别植物产品，其具体链路是怎样的？

入口是一个表单链接或二维码。交互形式为上传植物照片后，进入飞书平台。

等待生成结果，无需再次进入豆包。

我不再需要反复编写这些提示词，因为它们已全部存储在飞书多维表格中。

首先定义表结构和每个AI节点的提示词，之后用户可以直接使用。这相当于为大模型能力构建了产品化的路径。借助豆包大模型能力的本质提升，我们将其接入多维表格中，作为官方提供的AI快捷功能。用户只需新建一列即可使用该功能。

此类应用场景非常丰富，例如：

拍照识别食材配方
条形码识别：上传条形码照片，AI可自动识别对应数字
发票识别：上传发票后，AI可自动判断发票金额，特别适用于年底财务报销场景
车辆识别：拍摄车辆照片即可完成相关操作

AI识图能够直接获取车牌号，这体现了其应用价值。

我同样可以在豆包的桌面端完成这样的交互。之所以选择将其嵌入多维表格，主要有三个原因。

首先，正如我一直强调的，优秀产品的本质在于用巧妙的方式解决大多数用户的共性问题。虽然无法将这段提示词直接交付给每个用户，但我们可以将整个流程封装为一个开箱即用的产品。

让用户通过扫描二维码链接直接使用产品，以解决共性问题，甚至超越个人能力。这是第一个价值。

第二个价值在于，桌面端交互通常是线性串行的任务推进，而在多维表格中，通过分享产品入口，可以批量生成记录，实现并行处理。例如，无需等待A任务完成再执行B任务，而是可以同时推进A到Z任务。

这种批量生成的结果可用于创建预表盘，直观展示每日卡路里摄入量及三餐分布。正如一位朋友所言，每一行都是一个工作流，每一列都是AI节点。传统方式需要人工填写每一列，无法形成自动化工作流。而现在，多维表格实现了万马奔腾般的并行工作流。

以写服务为例，定时统计场景中，这种并行处理方式显著提升了效率。

我们的销售团队需要处理大量客户跟进记录。以往我们使用专业的CRM（客户关系管理）系统，但这些系统操作复杂，导致销售人员拜访客户后，往往需要延迟两天才愿意将客户信息录入系统。

作为销售管理者，通常还需等待三天才能查看团队所有客户的跟进情况。现在，我只需通过手机端即可实时查看这些信息。

我只需在群组中直接发送客户信息及跟进情况，这些数据会自动同步至多维表格。随后，AI字段将自动解析客户名称、拜访次数及当前阶段等信息，将非结构化数据转化为结构化标签。

作为管理者，若我负责200名销售人员的400位客户，便能直观掌握整体跟进情况。

现在，我发送一条消息到群聊中，AI随即开始拆解信息，而我只需关注预表盘的变化。预表盘的动态显示使信息呈现更为直观。

从这一维度来看，过去的工作流程需要人工逐一推动每个节点，而现在只需将信息输入多维表格并启动流程，AI便会自动执行后续操作。在AI节点和字段捷径的驱动下，各项工作流能够并行推进。

今天我只传递了一条消息，但未来可能有200名销售通过同一张表格传递400个客户的信息，这400条工作流将同步推进。

第三个价值在于生态整合。目前展示的仅是飞书官方提供的字段捷径，实际上飞书与豆包大模型同属字节跳动旗下，因此豆包的图片理解能力已被产品化为AI图片理解字段捷径。

我们与多家优秀的头部AI创业团队合作，共同开发了大量第三方字段捷径。简而言之，现在您可以在多维表格中直接生成视频、模特图、PPT，甚至发送微信推送消息等。

以往使用这些功能需要进入不同产品界面、注册多个账号，可能还需付费且效果未知。现在，飞书官方已为您完成初步筛选，所有进入字段捷径中心的功能都经过质量验证，能切实提升业务价值。

您无需再进入各个产品界面，只需新建一列，即可像使用飞书官方AI字段捷径一样使用这些第三方功能。部分功能需要付费，但也有免费选项，例如豆包的图片生成与理解功能，以及与01万物共创的智能巡检功能。

这意味着您只需在飞书多维表格的单一界面中，就能完成以往需要切换多个平台才能实现的操作。这体现了三大优势：

将大模型能力融入多维表格产品模块；
批量生成功能；
生态整合，实现一站式操作。

昨天，出于对这个创新功能的期待，我特意搭建了这个演示模板。

昨天下午四点开始，我工作到凌晨两点，完成了这个项目。其中一项功能是拍照解题，类似于我小时候使用的学霸君软件。用户只需上传一张包含题目的图片，系统就能直接给出答案。作为一个文科生，我从未想过能在飞书多维表格中，利用豆包大模型的AI图片理解功能，实现这样的应用。

具体流程如下：

用户上传图片后，系统会在AI节点的驱动下并行处理。
关键步骤是添加AI图片理解字段，并输入提示词。
这些提示词由AI生成，最终输出包含题目解析的结果。
然而，这些信息需要进一步拆解为正确答案、知识点、提升方案和类似题目。
整个过程通过AI技术逐步完成，最后将这些信息整合到自动化流程中。

自动化的触发条件是所有AI结果生成后，发送一条飞书消息，将生成的结果整合到消息卡片中。完成后，用户可在飞书端查看题目解答。

这里存在一个识别错误，我来检查原因。

设计知识点与题目答案的配置出现了错误。经过检查，发现确实是我在配置时出现了问题。在自动化流程中，应当引用设计知识点而非其他内容。调整后，问题得以解决。

值得一提的是，当前AI技术在多维表格中的应用已相当可靠。自动化流程的配置无需编写代码，直接设置即可完成。最终，题目解答顺利完成。

题目答案涉及设计知识点和语法知识点，以及提升方案。举一反三，试想这些场景的来源：如何想到通过拍照识别卡路里、植物或名画？这些AI识图场景的灵感同样来自AI的启发。例如，搭建一个中药材识别场景也是可行的方案。

我们以中药材识别为例，首先新建一个数据表。

首先，我会将表格精简至一行，以便清晰地展示搭建过程。通常，我会将第一列设置为日期，并选择自动创建时间功能，这将成为识别时间。接着，我会删除所有预设字段，仅保留一个附件字段。该字段用于存放上传或拍摄的图片，是AI识图的关键字段，例如中药材照片。

然后，我将新建一列用于AI识别中药材功能。在此列中，选择AI图片理解功能，关联我的豆包大模型账号，并指定基于中药材照片生成结果的自定义指令。

我尝试与AI对话，要求其识别一张中药材照片后，以列表形式输出以下信息：

·中药材名称

·使用方法

·价值

·注意事项

·功效

·参考价格

·在《本草经》中的记载

这样可以避免AI生成不相关的内容。

为其添加角色描述，包括背景、角色画像、能力、目标及输出形式。以下内容需明确标注：中药材名称及使用方法。这是我的习惯，希望标注更为清晰。

工作流程方面，需从专业流程中生成正式版本输出。具体操作如下：输入一张清晰的中药材照片，输出其名称及使用方法。这是我的习惯。大家可以暂时关闭麦克风，赵海也可以关闭。好的，差不多了。

接下来，我将检查其生成结果是否正确。我需要找一张中药材的照片进行验证。中药材照片，给我介绍一种中药材——当归。

接下来，我们将使用飞书多维表格进行演示。当前桌面端的功能尚不完善，无法完全满足需求。因此，我们需要进一步配置以实现预期效果。这正是豆包大模型的能力体现，它已被集成到多维表格中，封装为“AI图片理解（豆包）”功能，建议大家积极使用。

关于中药材信息提取，我们需要从豆包生成的记录中提取特定字段。首先提取中药材名称，仅输出名称即可。接着新建字段提取使用方法：识别中药材后，提取其使用方法并输出。

操作过程中，可以连续添加多个提取项。例如，若需要一次性提取四项内容，系统支持通过指令“分裂四项”来批量提取指定字段。

目前尚无法实现这一功能。表结构必须由用户自行定义。在飞书中，将鼠标悬浮在此处展开字段配置，此处提供AI字段选项。

第三个步骤涉及提取中药材的价值和功效，并输出相关信息。第四个步骤是定义使用注意事项，这一部分仍需用户手动完成。

用户可以让豆包协助完成上述想法的撰写。以提取动作为例，既可由豆包执行，也可由用户操作。通过AI图片识别字段提取图片信息后，再利用AI提取字段将信息拆解为结构化标签。接下来，用户可根据需求进行后续操作。

我需要明确产品的输入和输出定义。用户通过哪个入口上传照片？新建视图或表单视图均可上传中药材照片。实际上，仅保留中药材照片上传功能即可。

目前用户可以开始上传照片，但识别结果获取方式尚未定义。

点击自动化功能，创建自动化流程时需注意，必须新增或修改自动版图条件方可继续。使用我刚刚提到的数据表，识别中药材的名称、使用方法、价值功效及注意事项，确保所有字段均不为空。只有当AI生成结果在这些单元格中完整呈现时，才能进行后续推送操作。

选择发送飞书消息作为表格助手，第一步需筛选满足条件的记录，并提取记录创建人信息，即上传照片的用户。随后系统会生成中药材识别结果。在此过程中，可添加马尔钢字段，其中双星号表示加粗效果，也可通过短信发送。我们提供专门的AI短信解析功能，同样支持微信发送。

依次引用记录中的字段：中药材名称、使用方法、价值功效及注意事项。线上观众可提前准备中药材照片，稍后将有机会亲身体验。完成字段引用后，保存并启用流程。

我已将产品入口发布至飞书会议聊天框，欢迎大家体验。这展示了如何基于多维表格与大模型能力快速打造产品。现在展示多维表格问卷二维码，请注意直播间规则限制二维码展示时间。观察生成结果时，发现一位用户上传了模特图而非中药材，请说明原因。

抱歉，我没有开启自动更新功能。若要实现工作流，必须开启自动更新。现在应该已有朋友收到飞书推送的自动化消息了。大家继续生成内容。

各位朋友可以发送表情互动。现在，大家无需像我之前那样将提示词发送给AI，经过多轮对话才能完成任务。我已将AI互动流程产品化地整合进多维表格中，通过我分享的表单即可直接实现原本需要多轮AI交互才能完成的工作。这正是大模型能力产品化的核心价值。

利用飞书多维表格，您可以搭建各类AI产品解决方案，实现智能化任务处理。该工具的优势在于：不仅能通过表单和自动化完成信息输入输出，还能灵活呈现多种视图模式。例如，基于集体智慧，我们已创建出中药材图鉴应用。

中药台照片、使用方法及价值功效等信息，这是在短短4分钟内与AI共同创作的《本草纲目》内容。我还可以生成一个看板，消耗的是我的token，因为使用的是我的王大仙账号。

目前已有许多用户提出产品相关问题，协助优化产品功能。例如，有人上传了非药材照片，系统应如何反馈？

例如，针对识别错误的问题，可以采取以下措施：基于飞书多维表格构建的MVP版本产品，通过逐步优化自动化流程、字段设置和提示词，持续提升其性能。

值得注意的是，开发出这款能够完成中药材识别任务并推送结果的产品，仅耗时极短。这正是我们为大模型找到的解决方案。

有用户反馈，即便是较为冷门的中药材，系统也能准确识别。这得益于我们快速开发的MVP版中药材识别AI应用。虽然仍有优化空间，但当前版本已具备多项实用功能。

一方面，依靠豆包大模型卓越的图像识别能力；另一方面，飞书多维表格让非技术人员无需编写代码，只需理清流程即可构建专属AI产品。

为提升易用性，我已将该功能链接添加到首页仪表盘，并设置了快捷访问按钮。

然后选择操作，打开链接，拍照识别中药材，选取美观的草药保存。在群策群力之下，模板首页新增了一个入口。

直接点击即可使用该产品。回到三个核心价值：首先，为何能在豆包界面实现此功能？

但现在也可以在飞书多维表格中完成这项任务。具体分为三点：

第一点是产品化，例如水与瓶子的关系，大模型与基于大模型开发的产品之间的关系，任何人都可以构建这样的产品；

第二点是批量生成；

第三点是生态构建。风生水起对此总结得非常到位。批量生成意味着每一行代表一个工作流，每一列则是一个AI节点。

以往，这些节点需要人工输入，我必须不断推动才能让工作流继续运行。如今，仅需上传一张照片即可启动流程，后续的推进则由AI节点自动完成。

工作流在飞书多维表格中并行处理。此外，你可以在多维表格中实现许多原本需要AI才能完成的任务，所有操作都能在一个界面完成。这就是基于多维表格的AI生态系统。

现在，我们可以直接创建群组并加入。

请扫描飞书群二维码，加入今天的课程群。

飞书多维表格极大地提升了工作效率，它能将单一工作流批量处理。每列代表一个AI节点，每行则是一条工作流。这一观点由AJ老师提出，我认为这是对多维表格AI功能最精辟的概括。

我已将相关链接分享至群内。

今天的日程安排如下：

大家可以直接创建模板，我已将模板分享至群聊中。复制该模板后，可以多尝试使用，相信能创造出多种应用场景。

昨天我们讨论到，待豆包视觉大模型接入后，将会带来更多可能性。例如，我们有一位从事线下零售的朋友，需要在超市进行巡店。他希望工作人员拍摄一段环绕视频，通过多维表格接入豆包视觉模型的API上传视频，系统便能自动解析视频内容并识别问题。

我搭建了一些业务场景。例如，过去进行商超客流识别时，需要部署一个端侧大模型在摄像头硬件上。而现在，我们只需拍摄一张照片即可完成识别。

上传到多维表格中，然后通过飞书数字化工具进行处理。

基于豆包大模型，我们官方推出的AI图片理解功能可以识别图片中的人数，并给出对应的区间。随后，系统会调用其他AI功能进行标注。

例如：

若人数超过20人，则提示需要增派人手；
若人数较少，则暂时无需增派人手。

此外，考勤场景也具备可行性，但由于其敏感性较高，暂未纳入当前模板。昨日，我在一段视频中看到了相关演示。简历解析功能也已集成在该模板中。

简历解析、客流检测等功能均包含在此模板中。该模板已分享至今日的交流群。线上交流持续一个半小时，未能准备更多赠品。

让我们用AI来为大家送上赞美。我将调整提示词，要求AI生成一段约100字的赞美内容。大家可以扫描屏幕上的二维码，AI会为每个人生成一段个性化的赞美、一首包含名字的藏头诗，以及一份自我介绍。此外，AI还会为各位生成一个具有艺术风格的AI头像。

这是今天分享环节的一个小彩蛋。我已将链接发布在日程群中，请使用飞书扫描二维码参与。每位使用飞书多维表格的用户（我们称之为Maker）都将获得专属的Maker名片。名片中的部分信息，包括头像，都是由AI生成的。

现在让我们看看生成效果。Maker画册正在提交中，每位Maker的名片正在逐步生成。我看到AJ的名片已经出现了。关于英文名字的藏头诗，AI也能处理。例如“J君附会一昂扬”这样的创意表达。

大家觉得AI的赞美如何？如果觉得说到心坎里了，可以用表情回应。AI头像也在陆续输出中。我已将这些内容分享到聊天群中。

这就是我们为多维表格活动搭建的体验系统。今天恰好在分享的最后环节为大家展示，作为一个小彩蛋。大家可以看到，工作流中一个个AI节点正在生成，这充分体现了如何通过多维表格将大模型能力转化为AI产品。系统仍在持续运行，效果令人惊艳。

这个系统的特别之处在于：头像生成完全基于提示词实现。我们通过自动化流程，从多维表格各个部分提取信息，拼接生成提示词字段。这些提示词随后被引用到AI字段中，最终生成用户头像。值得注意的是，这些头像并非基于上传照片生成，而是AI根据用户标签，通过算法想象合成的个性化形象。整个过程仍在持续动态生成中。

生成头像功能采用了 A 和 B 模型。部分用户可能需要等待，但最终都会完成。

飞书多维表格采用非线性逻辑，支持 ABC 任务并行处理，实现批量生成。自动化触发后，记录将直接出现在飞书自动化卡片中。

在自动化卡片中，点击记录详情即可查看专属于你的AI名片。此外，我还利用多维表格构建了一个交友系统。如果用户对某人的资源或标签感兴趣，可以点击“交个朋友”按钮。例如，当用户点击该按钮后，对方（如二师兄）就能看到”王大仙想与其交朋友”的提示，从而发起对话。

想入门 AI 大模型却找不到清晰方向？备考大厂 AI 岗还在四处搜集零散资料？别再浪费时间啦！2025 年 AI 大模型全套学习资料已整理完毕，从学习路线到面试真题，从工具教程到行业报告，一站式覆盖你的所有需求，现在全部免费分享！

👇👇扫码免费领取全部内容👇👇

一、学习必备：100+本大模型电子书+26 份行业报告 + 600+ 套技术PPT，帮你看透 AI 趋势

想了解大模型的行业动态、商业落地案例？大模型电子书？这份资料帮你站在 “行业高度” 学 AI：

1. 100+本大模型方向电子书

在这里插入图片描述

2. 26 份行业研究报告：覆盖多领域实践与趋势

报告包含阿里、DeepSeek 等权威机构发布的核心内容，涵盖：

职业趋势：《AI + 职业趋势报告》《中国 AI 人才粮仓模型解析》；
商业落地：《生成式 AI 商业落地白皮书》《AI Agent 应用落地技术白皮书》；
领域细分：《AGI 在金融领域的应用报告》《AI GC 实践案例集》；
行业监测：《2024 年中国大模型季度监测报告》《2025 年中国技术市场发展趋势》。

3. 600+套技术大会 PPT：听行业大咖讲实战

PPT 整理自 2024-2025 年热门技术大会，包含百度、腾讯、字节等企业的一线实践：

在这里插入图片描述

安全方向：《端侧大模型的安全建设》《大模型驱动安全升级（腾讯代码安全实践）》；
产品与创新：《大模型产品如何创新与创收》《AI 时代的新范式：构建 AI 产品》；
多模态与 Agent：《Step-Video 开源模型（视频生成进展）》《Agentic RAG 的现在与未来》；
工程落地：《从原型到生产：AgentOps 加速字节 AI 应用落地》《智能代码助手 CodeFuse 的架构设计》。

二、求职必看：大厂 AI 岗面试 “弹药库”，300 + 真题 + 107 道面经直接抱走

想冲字节、腾讯、阿里、蔚来等大厂 AI 岗？这份面试资料帮你提前 “押题”，拒绝临场慌！

1. 107 道大厂面经：覆盖 Prompt、RAG、大模型应用工程师等热门岗位

面经整理自 2021-2025 年真实面试场景，包含 TPlink、字节、腾讯、蔚来、虾皮、中兴、科大讯飞、京东等企业的高频考题，每道题都附带思路解析：

2. 102 道 AI 大模型真题：直击大模型核心考点

针对大模型专属考题，从概念到实践全面覆盖，帮你理清底层逻辑：

3. 97 道 LLMs 真题：聚焦大型语言模型高频问题

专门拆解 LLMs 的核心痛点与解决方案，比如让很多人头疼的 “复读机问题”：

三、路线必明： AI 大模型学习路线图，1 张图理清核心内容

刚接触 AI 大模型，不知道该从哪学起？这份「AI大模型学习路线图」直接帮你划重点，不用再盲目摸索！

在这里插入图片描述

路线图涵盖 5 大核心板块，从基础到进阶层层递进：一步步带你从入门到进阶，从理论到实战。

L1阶段:启航篇丨极速破界AI新时代

L1阶段：了解大模型的基础知识，以及大模型在各个行业的应用和分析，学习理解大模型的核心原理、关键技术以及大模型应用场景。

L2阶段：攻坚篇丨RAG开发实战工坊

L2阶段：AI大模型RAG应用开发工程，主要学习RAG检索增强生成：包括Naive RAG、Advanced-RAG以及RAG性能评估，还有GraphRAG在内的多个RAG热门项目的分析。

L3阶段：跃迁篇丨Agent智能体架构设计

L3阶段：大模型Agent应用架构进阶实现，主要学习LangChain、 LIamaIndex框架，也会学习到AutoGPT、 MetaGPT等多Agent系统，打造Agent智能体。

L4阶段：精进篇丨模型微调与私有化部署

L4阶段：大模型的微调和私有化部署，更加深入的探讨Transformer架构，学习大模型的微调技术，利用DeepSpeed、Lamam Factory等工具快速进行模型微调，并通过Ollama、vLLM等推理部署框架，实现模型的快速部署。

L5阶段：专题集丨特训篇【录播课】

四、资料领取：全套内容免费抱走，学 AI 不用再找第二份

不管你是 0 基础想入门 AI 大模型，还是有基础想冲刺大厂、了解行业趋势，这份资料都能满足你！
现在只需按照提示操作，就能免费领取：

👇👇扫码免费领取全部内容👇👇

2025 年想抓住 AI 大模型的风口？别犹豫，这份免费资料就是你的 “起跑线”！

DeepSeek技术社区

欢迎加入DeepSeek 技术社区。在这里，你可以找到志同道合的朋友，共同探索AI技术的奥秘。

更多推荐

Claude 4.6/4.7 官方 API 直连保姆级教程：用 DataEyes 省下 90% 的接码时间

一个月前我在做一个企业内部知识库的 RAG 项目，需要同时支持 Claude 做长文档推理、GPT-4o 处理多模态、Gemini 做代码审查。结果卡在哪你知道吗？不是模型能力不够，是光配置接口就搞了三天。Claude 官方需要 Anthropic 账号绑定海外信用卡，申请通过等一周；AWS Bedrock 上买 Claude 权限要验证企业资质；GPT-4o 限制区域调用，不得不挂代理；每个模型