Deep Research:OpenAI推出的深入信息挖掘和分析智能体
Openai 最新推出的 Deep Research 是一款面向深度研究领域的智能体产品,旨在帮助用户进行复杂的信息查询与分析,Deep Research能够独立发现、推理并整合来自网络的见解,提供全面的研究报告和关键发现。
Deep Research功能与应用
信息整合:能够从多个来源收集信息,并将其整合成易于理解的报告。
实时分析:用户可以进行实时的主题研究,获取最新的信息和数据。
多领域适用性:该工具适用于金融、科学、政策和工程等多个领域,特别适合需要进行深入知识工作的专业人士。
Deep Research技术特点
端到端强化学习
Deep Research 使用端到端强化学习技术,允许模型从输入到输出进行整体优化。
通过与环境交互,模型能够规划和执行多步骤的研究轨迹,并在发现偏差时回溯调整策略,确保结果的准确性。
多步骤推理与动态调整
Deep Research 能够像人类研究者一样制定研究计划,逐步分解复杂任务。
例如,在处理市场趋势分析时,模型会通过关键词搜索获取初步信息,进一步查找行业报告、统计数据等,并对不同来源的信息进行对比分析,最终生成综合性报告。
随着发现更多信息,模型会调整自己的计划,以确保结果的全面性和准确性。
打破响应时间限制
与传统模型追求快速响应不同,Deep Research 允许模型花费 5 至 30 分钟甚至更长时间处理问题。
这种延迟并非缺点,而是模型走向成熟的标志。通过深入分析海量信息,模型能够输出更加全面、准确的研究成果。
模块化设计
Deep Research 由多个模块组成,包括信息发现、信息综合、推理和输出模块。
信息发现模块能够快速定位学术数据库、科研机构网站等,为后续分析提供丰富素材。
信息综合模块负责整合信息,推理模块进行逻辑推理,输出模块生成报告。
Deep Research应用场景
市场研究与学术研究
Deep Research 在市场调研和学术研究领域表现出色。
例如,它可以收集不同地区和时间段的市场数据,预测市场趋势;在学术研究中,它能深入研读文献,挖掘不同研究之间的潜在联系,为科研工作者提供有价值的研究思路。
消费决策与个性化推荐
对于需要仔细研究的商品(如汽车、家电、家具等),Deep Research 能够生成高度个性化的推荐报告。
它通过分析用户需求和市场数据,提供详细的购买建议。
复杂任务的自动化处理
用户只需提供一个提示,Deep Research 即可查找、分析并整合数百个在线资源,生成达到研究分析师水平的综合报告。
例如,它可以生成竞争对手和市场研究报告,或者帮助用户找到忘记名字但记得某集内容的电视剧。
性能与测试结果
“人类终极考试”表现
在 AI 安全与规模中心发布的“人类终极考试”中,Deep Research 达到了 26.6% 的准确率,远超其他知名模型(如 DeepSeek-R1 的 9.4% 和 o3-mini high 的 13%)。
这个测试包含 3000 多个多项选择题和简答题,涵盖从语言学到火箭科学、古典学到生态学的 100 多个学科。
GAIA 基准测试成绩
在 GAIA 基准测试中,Deep Research 在三个难度级别上均达到了新的高度,成绩为 72.57,超过之前最好的方法(63.64)。
这些任务要求模型具备推理、多模态流畅性、网页浏览和工具使用等能力。
内部基准测试与专家评价
OpenAI 的内部测试显示,Deep Research 能够完成专家需数小时才能完成的任务。
例如,在金融、科学和工程领域,模型的表现得到了领域专家的高度评价。
Deep Research如何使用?
用户权限
目前,Deep Research 只对 ChatGPT Pro 用户开放,每月最多可进行 100 次查询。
接下来,Plus 和 Team 用户将获得访问权限,随后是企业用户。
操作步骤
在 ChatGPT 中,选择「message composer」中的 Deep Research 并输入查询。
告诉 ChatGPT 你需要什么,无论是关于流媒体平台的竞争分析,还是关于最佳通勤的个性化报告。
甚至可以附加文件或电子表格,为问题添加上下文。
一旦开始运行,侧边栏将显示所采取的步骤和使用的来源摘要。
Deep Research 可能需要 5 到 30 分钟的时间来完成其工作,用户可以离开或处理其他任务,任务完成后会收到通知。
最终结果将以报告的形式出现在聊天中,未来几周内,OpenAI 还将为这些报告添加嵌入的图像、数据可视化和其他分析输出,以提供更清晰的说明和上下文。
与 GPT-4o 的对比
实时性
GPT-4o 更适合实时的多模态对话,而 Deep Research 则需要较长时间来完成深度和细节的多步骤研究任务。
综合能力
Deep Research 能够进行广泛的探索并引用每个声明,适合需要深度和细节的各个方面、特定领域的查询。
GPT-4o 在编码、数学和其他技术领域表现出令人印象深刻的能力,但许多现实世界的挑战需要从各种在线来源收集广泛的背景和信息,这是 Deep Research 的强项。
详细:https://openai.com/index/introducing-deep-research/