智东西3月12日消息,刚刚,OpenAI放出打造AI智能体的新大招——推出一套专为简化AI agent应用开发的全新工具包,包括新Responses API、其首个开源Agents SDK、多款内置工具、可观察性工具。
简单来说,这个API集成度更高、更简洁、更好用,它融合了Chat Completions API的简洁性和Assistants API的工具使用能力。
OpenAI CEO萨姆·阿尔特曼(Sam Altman)亲自发文称,这是“有史以来设计最完善、最实用的API之一。”
值得一提的是,阿尔特曼今天还发文预告了OpenAI即将发布的新创意写作模型,他提到这是他第一次被AI所写的内容打动。
这些新工具有什么用?它们可以简化核心agent的逻辑、编排及交互流程,降低开发者构建agent的入门门槛。
今天OpenAI发布的是这套新工具的首套构建模块,后续他们还会发布更多新工具。
首批公布的新的API包括4个主要升级:
1、全新的Responses API,融合了Chat Completions API的简洁性和Assistants API的工具使用能力,专为构建agent而设计。
2、内置工具包括网络搜索、文件搜索和计算机使用(compute use)。
3、全新Agents SDK,用于编排单agent及多agent工作流程。
4、集成的可观测性工具(observability tools),用于追踪和检查agent工作流执行情况。
一、一次调用就能解决复杂AI任务,API不会单独收费
在OpenAI看来,随着模型能力的持续进化,Responses API会为开发者构建agent应用提供更灵活的基础。通过一次Responses API调用,开发者就可以借助多种工具和模型轮转,解决日益复杂的任务。
首先,Responses API支持新的内置工具,比如网络搜索、文件搜索和计算机使用。这些工具可以协同工作,将模型与现实世界连接起来,使其在完成任务时更加实用。
1、网络搜索
开发者现在能够通过网页搜索工具获取快速、最新的答案,并附有清晰且相关的引用。在Responses API中,当开发者使用gpt-4o和gpt-4o-mini时,网页搜索会作为一项工具可供使用,并可与其他工具或函数调用相结合。
开发者可以利用网络搜索构建多种应用场景,比如购物agent、研究agent和旅行预订agent。
API中的网络搜索功能采用了与ChatGPT搜索相同的模型。在SimpleQA这一评估大型语言模型回答简短事实性问题准确性的基准测试中,GPT-4o搜索预览版和GPT-4o mini搜索预览版分别取得了90%和88%的得分。
网络搜索工具向所有开发者开放预览,集成于Responses API中。
此外,OpenAI通过Chat Completions API为开发者提供了直接访问精调搜索模型的机会,包括gpt-4o-search-preview和gpt-4o-mini-search-preview,以下是产品定价:
网络搜索文档链接:
https://platform.openai.com/docs/guides/tools-web-search
2、文件搜索
文件搜索工具可以从大量文档中检索相关信息。该工具支持多种文件类型,具备查询优化、元数据过滤及自定义重排序功能,能够提供快速而准确的搜索结果。借助Responses API,该工具仅需几行代码即可实现集成。
[免责声明]如需转载请注明原创来源;本站部分文章和图片来源网络编辑,如存在版权问题请发送邮件至398879136@qq.com,我们会在3个工作日内处理。非原创标注的文章,观点仅代表作者本人,不代表炎黄立场。