通过Coze平台搭建AI智能体,提前感受下Manus的能力

前言

这段时间里,我一直在研究整理,AI时代下,各传统应用场景所经历的新的变化。众多脱颖而出的AI产品中,到底有哪些过人之处,可以在哪些方面给我们带来巨大的帮助。

感兴趣的朋友,可以回头看下我以前的文章。这个主题,我已经写了8篇内容。今天是第九篇,主要讲述下扣子这款产品。

什么是扣子

扣子(Coze)是由字节跳动推出的新一代 AI 应用开发平台,于2024年2月1日上线。它允许用户通过零代码或低代码的方式快速搭建基于大模型的各类 AI 应用,并将这些应用发布到社交平台、通讯软件,或通过 API 和 SDK 集成到业务系统中。

扣子是一个新一代的AI应用开发平台,无论你是否有编程基础,都可以在扣子上快速搭建基于大模型的各类Bot,并将Bot发布到各个社交平台、通讯软件或部署到网站等其他渠道。

扣子平台上的智能体被称为Bot,它可以是各种类型的聊天机器人,除了简单的对话,通过扣子的插件和工作流等机制,还可以实现相对复杂的业务流程,比如内容创作、数据分析以及各种类型的文档处理等,还可以制作小游戏。在扣子平台的Bot商店里,有用户创建的各种Bot。

image

商店中的这些智能体应用,我们都可以使用。有免费的,也有收费的,我们也可以自己创建智能体,并将其发布到商店中,供别人使用。

扣子的特点

无限拓展的能力集
扣子集成了丰富的插件工具,可以极大地拓展Bot的能力边界。平台已经集成了超过60款各类型的插件,包括资讯阅读、旅游出行、效率办公、图片理解等API及多模态模型。

丰富的数据源
扣子提供了简单易用的知识库功能来管理和存储数据,支持Bot与你自己的数据进行交互。无论是内容量巨大的本地文件还是某个网站的实时信息,都可以上传到知识库中。

持久化的记忆能力
扣子提供了方便AI交互的数据库记忆能力,可持久记住用户对话的重要参数或内容。例如,创建一个数据库来记录阅读笔记,包括书名、阅读进度和个人注释。

灵活的工作流设计
扣子的工作流功能可以用来处理逻辑复杂且有较高稳定性要求的任务流。通过拖拉拽的方式,用户可以快速搭建一个工作流。

强大的插件生态
扣子拥有目前国内最完备的插件生态,支持联网搜索、代码运行、文件读取、图片生成等多种功能,极大地拓展了智能体的能力边界。

多模态交互能力
支持文字、图片、语音等多种交互方式,可以生成高质量的图片和视频内容。

工作流编排
提供可视化的工作流编排功能,用户可以通过拖拉拽的方式组合插件和模型,实现复杂的业务流程。

知识库管理
提供简单易用的知识库功能,支持文档上传和向量搜索,让智能体能够与指定数据进行交互。

扣子可以帮助我们做什么

看了上面介绍的内容,我们对扣子这个平台已经有了大致的认识。

但是,它在哪些方面可以给我们提供帮助呢?

由于对话是与Bot交互的最主要也最基本的方式,所以我们可以简单粗暴地将这些Bot统称为聊天机器人,但是不同的聊天机器人所提供的功能和适用场景是不一样的。从应用场景的角度,参考Coze平台的标签,我们尝试对这些Bot进行一个简单的分类:

聊天机器人:基于各种大模型简单套壳的机器人,没啥特别的。

互联网运营:比如,爆款文案、抖音、小红书文案生成,平台上这类Bot已经烂大街了。另外还可以通过插件自动抓取分析抖音、小红书爆款视频、热帖等内容、以及生成对标内容等

效率工具:比如思维导图生成、Excel助手、PPT生成、数据分析及图表生成等。

内容写作:比如写小说、写诗、写论文、写行业分析报告等,还可以生成插图,语音阅读。

设计类:如图标、海报、图片生成,修图、扣图等

学习类:比如英文学习、翻译,编程,各年级、各学科解题助手等。

虚拟角色:比如虚拟男女友等,即扮演特定角色的聊天机器人,当然可以支持多模态(语音、图片等),也可以结合工作流将一些工作岗位自动化。

垂直搜索:不同行业的垂直搜索工具,比如工商信息、招聘信息、新闻搜索信息流等。

智能客服:Coze上比较多的是微信公众号自动应答机器人,可能更适合个人或小团队,对于有一定规模的公司,应该都有客服团队或自建客服系统,似乎也没有必要迁移到公域,这也跟Coze平台C端定位有关。

游戏娱乐:比如剧本杀、看图猜词等。

扣子的整体介绍

扣子的特点就是使用简单,上手容易,非常适合新手用户。

但是说归说,具体的用法还是需要看一看。

扣子的官网地址是:https://www.coze.cn/

打开官网后,第一步需要完成的是注册和登录

image

完成登录后,会看到扣子的操作页面

image

页面比较简洁,一眼看去,就能找到想要的功能。

页面中间部分,比较醒目的新手教程,对我们是非常有帮助的,有着非常详细的使用介绍,如果大家想要真正用好扣子平台,这部分教程内容是一定要认真学习的。

回到正题,通过这个页面,我们可以发现扣子平台的几大功能版块。

工作空间

我们在扣子中使用的所有资源,其实都是存放在工作空间中的。

image

工作空间是资源组织的基础单元,不同空间内的资源和数据相互隔离。如需和其他扣子用户一起开发 AI 应用,你可以创建工作空间或加入其他用户的工作空间。空间中的模型、智能体、插件、工作流和知识库等资源可以在成员之间共享,不同工作空间之间资源隔离,保证数据安全。

需要注意的是,个人空间是一种特殊的工作空间,每个扣子用户都有且只有一个个人空间,个人空间不能邀请其他扣子用户加入,该空间内的资源也不能与他人共享。

项目开发

项目开发版块中,支持创建智能体和应用

image

智能体

扣子中的智能体,可以理解成一个对话机器人,实现的功能相对单一。

用户可定义Bot的名称、人设、回复逻辑,并通过提示词(Prompt)优化其行为模式。例如,通过描述角色性格和目标,让Bot模拟特定人物(如历史人物曹操)的对话风格

创建方法非常简单,只需要设置名称,就可以完成创建了。

image

智能体创建完成后,接下来需要针对自己创建的智能体进行编排设计

image

设置完成后,智能体就具备了工作能力。但是这里的设置,是整个智能体工作的核心,这里先简单的做个介绍,具体的设置方法和注意事项,会在文章的后半部分进行详细介绍。如果大家感兴趣,可以直接跳到后面进行查看。

应用

扣子中的应用,是指利用大模型技术开发的应用程序,这些应用程序能够使用大模型,执行复杂任务,分析数据,并作出决策。例如 AI 搜索和 AI 翻译等。

通过扣子平台构建的 AI 应用具备强大的可扩展性,支持与个性化的用户界面绑定,依托于先进的大模型技术,形成一个独立的 AI 解决方案。扣子应用通过工作流或对话流处理复杂的业务逻辑与编排,其内置的丰富节点库提供了逻辑处理、知识写入与检索、大模型服务、会话管理等多种能力,帮助开发者灵活编排自动化流程、构建各种智能服务。

image

扣子应用不仅能够适配移动端和网页端的各种框架,还能兼容广泛的终端设备,还支持导出小程序源代码以进行进一步的定制开发。扣子应用的灵活性体现在多个方面:它能够以 API 服务或 Chat SDK 的形式轻松集成到现有的应用程序或网站中;你还可以将扣子应用发布为微信小程序、抖音小程序,或者发布到其他常用的社交平台上,甚至可以将其部署为 Web 页面,以便更广泛的用户群体能够访问和体验。

image

这个厉害了。网上到处都是三分钟开发出一个小程序的教程,通过扣子,我们可能会更容易实现。

同智能体一样,这里只是做一个概括性的介绍,让大家对扣子平台有一个认识。如果大家感兴趣,想知道具体的实现方法,还请继续看下去。

资源库

接下来,在看一下工作空间中的资源库。
image

从图中可以看出,扣子的资源库里,支持这多种资源形式。

资源库是存储和管理可复用组件的中心,支持跨项目共享资源,提升开发效率。资源库中所创建的各类资源,是可以被智能体或者应用所使用。我们所发布的智能体,他们的能力,或者说是工作质量,很大程度上会依赖这里所创建的资源。

通过示意图,我们发现,这里面有很多资源。但是这些资源,分别有什么作用,又应该如何使用,我们还不太清楚。接下来,就是这部分内容的介绍。

工作流

工作流是一系列可执行指令的集合,用于实现业务逻辑或完成特定任务。它为应用/智能体的数据流动和任务处理提供了一个结构化框架。工作流的核心在于将大模型的强大能力与特定的业务逻辑相结合,通过系统化、流程化的方法来实现高效、可扩展的 AI 应用开发。

image

扣子提供了一个可视化画布,你可以通过拖拽节点迅速搭建工作流。同时,支持在画布实时调试工作流。在工作流画布中,你可以清晰地看到数据的流转过程和任务的执行顺序。

image

图中的开始和结束就是工作流中的节点。要想让整个工作流真正的工作起来,我们需要添加和设置不同的节点,让整个链条联通起来。

工作流的核心在于节点,每个节点是一个具有特定功能的独立组件,代表一个独立的步骤或逻辑。这些节点负责处理数据、执行任务和运行算法,并且它们都具备输入和输出。每个工作流都默认包含一个开始节点和一个结束节点。

  • 开始节点是工作流的起始节点,定义启动工作流需要的输入参数。
  • 结束节点用于返回工作流的运行结果。

通过引用节点输出,你可以将节点连接在一起,形成一个无缝的操作链。例如,你可以在代码节点的输入中引用大模型节点的输出,这样代码节点就可以使用大模型节点的输出。在工作流画布中,你可以看到这两个节点是连接在一起的。

在使用节点编排工作流时,灵活性和扩展性是实现高效编排的关键。工作流的开始节点、结束节点、输出节点、插件节点、子工作流节点、代码节点、SQL 自定义节点、新增数据节点、查询数据节点、更新数据节点、删除数据节点、问答节点、批处理节点、循环节点、变量聚合节点、变量节点、选择器节点均支持多种变量类型,包括 String、Integer、Number、Boolean、Object、File 和 Array等。你可以根据实际需求灵活选择合适的数据类型,而无需额外的数据转换,从而提升工作流编排的灵活性和扩展性。

对话流

扣子平台提供两种类型的工作流,工作流和对话流。

工作流,用于处理功能类的请求,可通过顺序执行一系列节点实现某个功能。适合数据的自动化处理场景,例如生成行业调研报告、生成一张海报、制作绘本等。

对话流,是基于对话场景的特殊工作流,更适合处理对话类请求。对话流通过对话的方式和用户交互,并完成复杂的业务逻辑。对话流适用于 Chatbot 等需要在响应请求时进行复杂逻辑处理的对话式应用程序,例如个人助手、智能客服、虚拟伴侣等。

上面已经介绍了工作流的简单实用方法,现在来看看对话流如何使用。

image

创建好对话流后,会进入到对话流的设置页面。具体的方法与上面描述的工作流相似

image

也是需要我们设置不同的节点,给每个节点设置上相应的处理能力,通过编辑每个节点的输入和输出,让整个链条完整的连接到一起。

插件

扣子中的插件是一个工具集,一个插件内可以包含一个或多个工具(API)。

目前,扣子集成了类型丰富的插件,包括资讯阅读、旅游出行、效率办公、图片理解等 API 及多模态模型。使用这些插件,可以帮助你拓展智能体能力边界。例如,在你的智能体内添加新闻搜索插件,那么你的智能体将拥有搜索新闻资讯的能力。

image

如果扣子集成的插件不满足你的使用需求,你还可以创建自定义插件来集成需要使用的 API。

image

知识库

扣子的知识库功能支持上传和存储外部知识内容,并提供了多种检索能力。扣子的知识能力可以解决大模型幻觉、专业领域知识不足的问题,提升大模型回复的准确率。

扣子的知识库功能包含两个能力,一是存储和管理外部数据的能力,二是增强检索的能力。

数据管理与存储

扣子支持从多种数据源例如本地文档、在线数据、Notion、飞书文档等渠道上传文本和表格数据。上传后,扣子可将知识内容自动切分为一个个内容片段进行存储,同时支持用户自定义内容分片规则,例如通过分段标识符、字符长度等方式进行内容分割。

增强检索

扣子的知识功能还提供了多种检索方式来对存储的内容片段进行检索,例如使用全文检索通过关键词进行内容片段检索和召回。

大模型会根据召回的内容片段生成最终的回复内容。

知识库的创建非常简单,只要填写对应的名称就能完成创建

image

知识库中的内容,也有很多方式可以导入。可以通过本地上传、在线编辑、飞书、公众号以及notion进行导入。

卡片

扣子平台支持在豆包飞书平台上使用自定义卡片来回复用户消息,让回复内容更加美观和个性化。

这个消息卡片,是一个图文形式的富文本内容。我们可以通过设置变量,让其动态获取工作流、插件中的信息,生成卡片内容,并对卡片绑定上相关事件,完成我们的工作。

image

提示词

说到提示词,大家一定不会陌生。

我们在使用各种大模型产品,用的最多的应该就是提示词了。

提示词是一种自然语言指令,它为大语言模型(LLM)提供任务指导。搭建智能体的第一步就是编写提示词,为智能体设定身份和目标。智能体会根据大语言模型对人物设定和回复逻辑的理解,来响应用户问题。因此提示词编写得越清晰明确,智能体的回复也会越符合预期。

扣子资源库中的提示词模块,允许我们自己创建提示词模版

image

当然我们也可以使用官方提供的,或者是别人分享的提示词模版

数据库

扣子的数据库功能提供了一种简单、高效的方式来管理和处理结构化数据,开发者和用户可通过自然语言插入、查询、修改或删除数据库中的数据。同时,也支持开发者开启多用户模式,支持更灵活的读写控制。

image

扣子提供了类似传统软件开发中数据库的功能,允许用户以表格结构存储数据。这种数据存储方式非常适合组织和管理结构化数据,例如客户信息、产品列表、订单记录等。

image

扣子数据表支持单用户和多用户两种查询模式。

image

发布管理

在工作空间中,我们还可以看到一个发布管理的版块

image

这个版块允许我们将自己搭建好的智能体、应用以及工作流发布到其他的成熟平台中,供大家使用

通过上图可以看到,目前已经支持了非常多的平台和应用场景。

现在的大模型产品,其实还没有比较成熟的商业模式,但是扣子给我们提供了渠道。所以,我非常推荐大家都去熟悉使用扣子平台,在这里,我们不仅能够的搭建自己的大模型工具,还能将其发布到其他平台中,真正的提高大家的生产力。

具体的实现一个智能体

通过以上内容,我们应该已经对扣子平台有了比较详细的认识了。

那么接下来,就可以通过扣子平台,真正的搭建一个智能体来解决我们实际的问题了。

在扣子平台上,要想制作一个智能体,有三种方法。

复制一个已有的智能体

在平台提供的【模板】页面中,选择一个目标智能体

image

点击进入到详情中,点击复制按钮

image

将其添加到自己的智能体或者空间中,我们就拥有了同款的智能体了

借助官方助手完成搭建

在扣子平台中,打开扣子官方助手,位置在页面右下角,大家看到的那个拇指图案就是助手标志。image

点击后,可以打开扣子小助手

在小助手中,直接告诉它,我想做一个智能体

image

系统会给出相应的操作提示,我们按照要求填写,就可以生成一个智能体。

通过这种方式创建的智能体,会放置在我们的个人空间中

手动创建一个智能体

根据上面所介绍的内容,自己从零创建一个智能体或者工作流。

image

根据系统提示,添加节点,设置节点,最终完成一个自己想要的智能体应用。

操作实例:实现一个图文创作智能体

大家知道我一直在研究一套图文内容创作工具。

主要实现的能力是,在笔记系统中进行图文内容的编辑,然后同步发布到公众号、知乎、小红书等不同的内容平台上。

以前是借助开源程序来搭建这个系统,现在是不是可以借助扣子的智能体平台来实现呢。

我们来尝试一下

在【模板】中,有一个【图文创作助手】的工作流,其实是可以做到我所提到的这些功能。我们可以在此基础上进行些调整,让其更加适合我的要求。

image

点击这个卡片,进入到详情中,点击复制

image

选择工作区间,然后点击【复制并继续编辑】

image

这时候,会进入到工作流的编辑页面

image

接下来,就是修改这个工作流的内容。

官方提供的这个模板以小红书风格为例,复制此模板之后,我们可以将其改造为适合其他社交媒体风格的图文创作工作流,也可以为工作流添加一些风格或主题限制,将其改造为指定领域的内容创作助手。

整个工作流中,以下两项内容是比较重要的节点

生成文案内容

该节点主要对用户提交的提示词内容进行分析处理,该节点配置了大模型,并内置了提示词。

image 提示词提示词决定了最终生成的文案风格。你可以根据预计投放的目标社交媒体的文案风格,调整模型节点的提示词。你需要自行分析目标渠道的文案风格,设计合适的提示词。修改提示词后,可以测试当前节点,确保最终生成的文案符合你的需求。

你也可以根据社交媒体账号的个人形象,在提示词中规定生成的文案语气或常用词,使生成的文案更具备个性化的风格。

生成配图

生成图片部分比较复杂,大致分成两个环节

根据用户输入的内容生成提示词,将其输入给图片大模型

图片大模型,根据收到的提示词内容,生成图片

image

修改调试完成后,可以点击试运行,查看下效果

image

可以看到运行结果

image

如果不满意的话,就可以回到设置中,对各个节点的配置进行调整

如果不需要再次调整了,就可以进行发布了。

发布完成后,我们就在自己的智能体中使用这个工作流了。

在使用这个工作流之前,首先要创建一个智能体。

然后在这个智能体的编排页面中,进行设置

进入编排页面,默认的模式是单Agent,默认模型是豆包Function call,先保持默认值,后续可以根据需要调整。

在左边“人设与回复逻辑”下面,输入你想让大模型扮演的角色和完成的任务,点优化,AI会自动帮你完善提示词,不满意还可以重试,当然你也可以自己手写。如果满意,点“使用”即可。image

如果我们不会写提示词,可以使用官方提供的提示词库,在其中找到可用的提示词模版。选中后,这段提示词会被插入到左侧的文本框中,我们根据自己的实际情况进行修改。

在中间的“对话体验-开场白”下面,我们可以输入开场白文案和预置问题,这是用户打开Bot后,第一眼看到的Bot欢迎信息。同样,我们让AI自动生成即可,不满意可以重试或自己修改。

现在,在右边的“预览与调试”窗口可以看到开场白了,可以输入或随便点个预置问题测试一下效果。image

现在,在右边的“预览与调试”窗口可以看到开场白了,可以输入或随便点个预置问题测试一下效果。

image

现在的智能体已经能够解决我们的很多问题。但是效果可能差强人意。为了让其有着更加出色的能力,我们就可以借助平台的扩展能力来增强我们的智能体。

image

中间部分的这些技能,都是能够增强效果的方法,要想自己的智能体有着更强大的处理能力,我们就需要学会使用这些技能。

使用搜索插件

由于大模型的知识是静态的,很多数据或者是最新的信息,它并不知道。为了解决这个问题,接着我们给它增加一个搜索插件。点插件后面的+号,在弹出的窗口中选择必应搜索并添加。

image

选用了必应搜索插件,但是这时候,智能体在处理问题的时候,还没有使用它。如果要应用它,还需要再做一步:在提示词中指明使用这个插件

image

如图中的提示词示例,该智能体再解决问题的时候,就会将我们输入的内容提交给必应搜索,并对返回的结果进行处理返回。

在提示词中,我们要求大模型在调用插件接口时,将用户输入加上固定的“大模型”前缀作为搜索query,以便搜索结果跟“大模型”相关。其中,${{user
_input}}代表用户输入的问题,大模型在调用插件时会自动将它替换成实际值。

再重新问一次刚才的问题。可以发现这次它的回答中,调用了必应搜索,返回了搜索结果。

使用工作流

另外一个常用的技能其实是工作流。

通过上面的介绍,我们也知道,工作流是可以处理复杂问题的。而且官方也给出了很多工作流模版,我们都可以复制到自己的空间中进行使用。

就像文章介绍的那样。

我先在其实已经有了可用的工作流了,但是如何在智能体中使用呢。

与插件的使用的方法一样,也需要在提示词中进行关联

image

体验一下效果

image

现在的这个智能体,就已经能够实现素材整理-文章生成-配图生成等能力了。

虽然效果一般,但是经过参数调整,一定能够给我们带来非常大的惊喜。

如果已经对效果满意了,就可以点击右上角的发布按钮了。

点右上角的“发布”按钮,选择发布平台,默认可以直接发布到扣子商店和豆包,其它支持的平台包括:飞书、抖音、微信、掘金等,需要授权。另外,扣子还支持发布成Web API,这样我们在任何系统中都可以通过API来调用Bot了。API的发布方式,可以参考官方文档。

总结

扣子(Coze)是一个强大的 AI 应用开发平台,适合从初学者到专业开发者。通过简单的操作,用户可以快速搭建和发布 AI 应用,满足各种个性化需求。

本文对扣子(Coze)智能体平台进行了简单介绍,包括扣子的基本概况、Bot的应用场景、扣子平台的基本能力、在扣子上搭建智能体的方法和步骤,后续会逐步分享扣子的其它玩法。个人感觉目前大模型智能体生态还处于蛮荒的起步阶段,相对于移动App、微信小程序等生态所要求的开发能力及复杂审核机制,在扣子上搭建一个智能体门槛还是比较低的,扣子的基础能力和体验相对还不错,大家有兴趣可以尝试一下。

Leave a Reply

您的电子邮箱地址不会被公开。 必填项已用 * 标注