智能体介绍#

数据处理智能体#

负责与 Data-Juicer 交互，执行实际的数据处理任务。支持从自然语言描述自动推荐算子、生成配置并执行。

工作流程：

当用户说："我的数据保存在 xxx，请清理其中文本长度小于5、图片大小小于10MB的条目"，Agent 并不会盲目执行，而是按步骤推进：

整个过程既自动化，又具备可解释性。用户可以在任何环节介入干预，确保结果符合预期。

典型用途：

查看完整示例日志（from AgentScope Studio）

示例执行流程：

用户输入："The data in ./data/demo-dataset-images.jsonl, remove samples with text field length less than 5 and image size less than 100Kb..."

路由：调用 query_dj_operators，精准返回两个算子 text_length_filter 和 image_size_filter

数据处理 Agent 执行步骤：

整个过程没有人工干预，但每一步都可追溯、可验证。这正是我们追求的"自动化但不失控"的数据处理体验。

当内置算子无法满足需求时，传统做法是：查文档、抄代码、调参数、写测试——整个过程可能耗时数小时。

Operator Development Agent 的目标，是将这个过程压缩到几分钟，并保证代码质量。默认使用 qwen3-coder-480b-a35b-instruct 模型驱动。

工作流程：

当用户提出："帮我创建一个将单词倒序排列的算子，并生成单元测试文件"，Router 会将其路由至 DJ Dev Agent。

该 Agent 的执行流程分为四步：

整个过程将模糊需求转化为可运行、可测试、可复用的模块。

生成内容：

典型用途：

查看完整示例日志（from AgentScope Studio）