OpenAI发布 Responses API 和 Agents SDK,增强智能体的开发流程
Openai于2025年3月11日发布了Agent SDK和Responses API,OpenAI 推出的 Agent SDK 和 Responses API 是为了解决传统智能体开发中的痛点,比如复杂的提示工程(Prompt Engineering)、协调逻辑复杂等问题。这两个工具可以让开发者和企业能够轻松构建实用且可靠的AI智能体。
Responses API是什么
Responses API 是一个强大的 API,结合了 Chat Completions API 的简洁性和 Assistants API 的工具使用能力。它允许开发者通过单次 API 调用,集成多种工具和功能,从而简化复杂任务的处理。
Responses API主要功能:
多工具集成:支持网络搜索、文件搜索、计算机操作等功能,开发者可以在单次调用中完成多种操作。
实时数据交互:通过网络搜索工具,AI 可以获取最新信息并提供引用,适用于需要实时数据的场景。
多轮对话支持:通过响应链将多个交互串联起来,保持对话的连贯性。
企业级数据隐私:基于 Azure 的安全和合规标准,确保数据保护。
Responses API应用
网页搜索:基于 ChatGPT 同款搜索引擎,准确率高达 90%,支持信息溯源和引用标注。
文件搜索:支持多种文件格式,快速检索海量文档,适合企业知识库管理。
电脑控制:允许智能体直接操作电脑,完成网页自动化和数据录入等任务。
Responses API使用代码
// 网页搜索示例 const response = await openai.responses.create({ model: "gpt-4o", tools: [{ type: "web_search_preview" }], input: "今天发生了什么积极的新闻?" }); console.log(response.output_text); // 文件搜索示例 const productDocs = await openai.vectorStores.create({ name: "产品文档", file_ids: [file1.id, file2.id, file3.id], }); const response = await openai.responses.create({ model: "gpt-4o-mini", tools: [{ type: "file_search", vector_store_ids: [productDocs.id], }], input: "OpenAI的深度研究是什么?" }); console.log(response.output_text); // 电脑控制示例 const response = await openai.responses.create({ model: "computer-use-preview", tools: [{ type: "computer_use_preview", display_width: 1024, display_height: 768, environment: "browser", }], truncation: "auto", input: "我想买个新相机,帮我找到最好的。", }); console.log(response.output);
Agents SDK是什么?
Agents SDK 是一个开源框架,用于管理和协调多个 AI 智能体的工作流程。它基于 Swarm 框架升级,支持多智能体协作和复杂任务的编排。
Agents SDK主要功能:
配置化 Agent:轻松定义 Agent 的角色和工具。
智能交接(Handoff):Agent 之间可以无缝交接任务,协作更高效。
安全检查(Guardrails):确保 Agent 的行为符合预期。
追踪与可观测性(Tracing & Observability):实时监控 Agent 的运行状态,便于调试和优化。
Agents SDK使用代码
from openai_agent import Agent, function_tool @function_tool def submit_refund_request(refund_amount: float, reason: str): """提交退款申请""" print(f"提交退款申请,金额:{refund_amount},原因:{reason}") return {"success": True} # 定义 Agent shopping_agent = Agent( name="Shopping Assistant", instructions="你是一个购物助手,可以搜索网络商品信息。", tools=[WebSearchTool()], ) triage_agent = Agent( name="Triage Agent", instructions="引导用户到正确的客服 Agent。", ) support_agent = Agent( name="Support Agent", instructions="你是一个客服 Agent,可以提交退款。", tools=[submit_refund_request], )
应用场景
企业自动化:通过 Responses API 和 Agents SDK,企业可以构建自动化的 AI 工作流,例如处理订单、客户服务、数据处理等。
复杂任务处理:在需要多步骤操作的场景中,如电商购物助手、法律研究或金融建模,这些工具可以显著提高效率。
多模态交互:支持智能体通过计算机操作工具执行任务,例如在浏览器中自动完成搜索或填写表单。
GitHub代码库:https://github.com/openai/openai-agents-python
OpenAI Agents SDK 是一个轻量级但功能强大的框架,用于构建多智能体工作流。它支持任务交接、安全检查、工具调用和内置跟踪功能,非常适合需要复杂智能体协作的企业自动化场景。