1. 产品定位与核心能力
定位:广告分析与策略建议的智能助手。
它不仅是数据查询的工具,更是能够辅助用户进行诊断归因,并提供高质量决策建议的运营伙伴。其核心特点是:
广泛而自然的意图理解
更可靠的数据查询能力
流畅的多轮对话体验
只需直接用自然语言提出问题,就可以持续追问、逐层下钻,把问题越问越清楚。当前支持数据覆盖范围:Amazon Sponsored Ads。
2. 核心场景
2.1 当前核心场景:
场景大类 | 难度级别 | 内容 | 问题类型 |
简单查询 | D1 | 根据用户指令,快速、准确地提供特定实体或指标的当前数据。 | What |
概览分析 | D2 | 整体概览分析,找表现最好和最差的对象。 | What |
深度归因 | D3 | 诊断原因:针对一个具体问题(如ACOS飙升),结合多维数据和操作历史进行根源分析。 | Why |
策略建议 | D3 | 寻找机会:针对一个具体目标(如增投),主动发现增长点并提供明确、可执行的优化建议。 | How |
//未来我们会持续拓展更多场景如:复盘/综合价值评估,未来规划/推演(依赖大量场外信息与长期视角(选品、定价、优惠、库存、站外、市场等))
目前,如果询问Insight这些场景,产出质量会不稳定。
2.2 典型问法举例:
场景一:简单查询(D1)
"问什么答什么"——快速、准确地查询特定实体或指标的数据
典型问法举例:
"列出过去一个月里,TACOS 低于 8% 的所有ASIN清单"
"现在我的店铺哪些广告活动的状态是'已超出预算'?"
"上个月为我带来超过 10 个订单的关键词有哪些?"
"找出所有在广告活动中,过去 7 天产生超过 5 个订单的广告组"
场景二:概览分析(D2)
整体健康度扫描,找最好最差,做表现对比
典型问法举例:
"扫描一下我的账户,找出那些需要关注的问题 ASIN"
"扫描一下我的账户,找出那些需要关注的问题 ASIN,主要看ACOS和TACOS"
"上个月表现最好的广告活动是哪个?综合看转化率和ROAS"
"对比 4 月和 5 月的广告表现,突出显示效果最好和最差的广告活动"
"分析一下广告活动 Campaign-X 最近30天的健康度如何"
场景三:深度归因(D3)
针对具体问题,结合多维数据和操作日志进行根源分析
典型问法举例:
"广告活动 SP-Auto-New-Launch 的 ACOS 从上周 20% 飙升到本周 50%,请诊断原因"
"请找出环比四月下滑最明显的广告活动,分析原因并给出优化建议"
"我注意到整个账户的转化率都在缓慢下降,请分析是否由少数几个问题 ASIN 拖累的"
"昨天为什么AI把我的关键词 'running shoes' 的出价从 $1.0 提高到了 $1.5?算法优化的原理是什么"(Xnurta算法原理解释)
场景四:策略建议(D3)
基于数据分析,提供可落地的优化方向
典型问法举例:
"产品线A 我的月度广告总预算是 $20,000,请为我制定一个详细的预算分配计划,以最大化整体 ROAS"
“CampaignA最近14天的表现很好,有哪些其他campaign的预算可以分一点给它?”
"请找出销售额最高的 10 个 ASIN 中需要立即调整竞价的关键词,并明确调高还是调低"
"针对 HKKay 品牌,识别应否定的词,帮我构建否定关键词库"
"请分析昨天未花完预算的广告活动及主要原因"
场景五:AI 托管解释与复盘
解释 AI 的行为逻辑,评估 AI 托管效果
典型问法举例:
"复盘一下这个托管组近 14 天的表现,开 AI 前后对比如何?"
"1月1日AI 暂停了词组 Summer-Pro,依据是什么?"
"你们的 AI 分时调价逻辑是怎样的?"
“给我总结一下上一周这个托管组 所有的AI操作,尤其重点看加词和否词的情况,结合广告表现分析”
“给我复盘一下上个月所有托管组的情况,按照不同的托管组目标分析。”
3. 当前数据范围
Insight Agent 当前支持 SA 广告(含 SP / SB / SD) 全链路数据,覆盖以下维度:
##实体维度
实体 | 说明 |
店铺(Profile) | 账户级别分析入口 |
AI 托管组(aiGroup) | 托管组整体表现及 AI 行为 |
广告组合(Portfolio) | 组合维度的预算与表现 |
广告活动(Campaign) | 活动级别深度分析 |
广告组(Ad Group) | 广告组维度 |
推广商品(productAd) | 商品推广维度 |
投放(Target) | 含关键词、商品投放、受众、自动定向 |
搜索词(Search Term) | 关键词和商品定向来源两种 |
产品线 / ParentASIN / ASIN / SKU | 商品层级分析 |
*暂不支持标签维度
##支持以上所有实体的 表现数据、(属性)设置数据、全部操作日志
4. 质量与评估(Eval)
我们主要从两个维度评估 Insight Agent 的能力:
1. 数据准确性
评估底层数据、指标计算和关键数字是否准确。
2. 分析内容质量
评估分析覆盖范围、归因推理能力,以及策略建议的专业性与可执行性。
在基于真实广告主场景的内部评测中,我们将 Insight Agent 的输出结果与多个「通用大模型 + Amazon MCP」工作流进行了横向对比。结果显示,Insight Agent 在多个方面均表现出明显优势。
您可以联系客户经理,获取最新的 Eval 评测结果。
需要说明的是,与任何 AI 产品一样,Insight Agent 的准确性并非 100%。它更适合作为广告运营与决策支持工具,而不是在未经人工复核的情况下完全替代人工判断。我们也将持续通过评测体系、产品迭代和客户反馈,不断提升 Insight Agent 的稳定性、准确性和实用价值。
5. 未来即将上线的功能
这些需求还在设计或规划中,欢迎联系我们聊聊你的建议和反馈。
1. 从 Insight 到 Take Action
未来,Insight Agent 将不仅提供分析和建议,还将支持在同一次会话中直接完成广告调整。用户可以通过自然语言完成从问题提出、洞察分析到策略执行的完整流程。
2. 进一步提升分析与建议质量
Insight Agent 将进一步调用 Xnurta 的优化算法能力,持续提升分析结果、归因判断和策略建议的质量,与通用模型方案拉开更明显的差距。
3. Agent 记忆能力
未来将支持跨会话记忆。Agent 可以长期记住账户上下文、历史分析结果和用户偏好,从而提供更连续、更个性化的分析体验。
4. 更多数据源集成
我们将逐步接入更多广告与经营数据源,包括 AMC、DSP、SQP 等,以及更多非广告的外部信号,帮助用户获得更完整的业务视角。
5. 上传表格/文件并结合 Insight 分析
未来将支持用户上传表格或文件,并与 Insight Agent 的数据洞察能力结合,完成更灵活、更深入的自定义分析。
6. 更强的可视化能力
Insight Agent 将持续增强数据可视化效果,使复杂数据、趋势变化和关键结论更直观、更易理解。
6. 常见问题
Q1. Insight Agent 与 Reporting Agent 有什么区别?
Reporting Agent 更适合标准化报告场景:用户选择设置项、确认大纲,然后生成一份结构化报告。
Insight Agent 更适合开放式分析场景。用户可以像和分析师对话一样自然提问、连续追问、逐步深入,从数据查询延展到原因诊断、机会识别和行动建议,而不受固定模板或固定 workflow 限制。
简单来说,Reporting Agent 偏“按模板生成报告”;Insight Agent 偏“围绕问题自主分析”。它结合了数据查询能力与行业知识能力,提供更接近 GPT 式对话的分析体验。
同时,Reporting Agent 也具备 text-to-SQL 能力,但在复杂开放问题上的稳定性有限。Insight Agent 的设计目标,是在“灵活广泛”和“准确可靠”之间取得更好的平衡。
Q2. 为什么不直接用通用 LLM 搭配 Amazon MCP?
通用 LLM + Amazon MCP 在部分技术场景中有价值,但并不一定适合作为广告主日常分析工作的主方案。
主要原因包括准确性、成本、稳定性和易用性。
在我们的真实广告主问题测试集中,Insight Agent 的数据准确性通过率约为 70%–80%,高于通用模型 + Amazon MCP 约 50% 左右的表现。
除准确率外,实际落地还需要考虑使用成本和稳定性。MCP 方案通常依赖较长上下文和多次工具调用,因此更容易带来延迟、超时、报错和额外成本。在我们的测试中,Insight Agent 单次查询成本约为 0.20 美元,而 LLM + MCP 方案平均接近 5 美元,成本约为 25 倍。
此外,MCP 方案通常需要一定技术配置,不适合大多数广告主直接使用。Insight Agent 已经封装并集成在 Xnurta 中,无需额外配置,更适合日常业务分析场景。
简单来说,Insight Agent 的价值不只是“模型回答”,而是把数据检索、分析逻辑、行业知识和产品体验整合成一个可直接使用的分析工具。
Q3. 为什么准确率不是 100%?
因为 Insight Agent 处理的是开放式自然语言分析问题,而非固定菜单或预设报表。
真实用户的问题空间几乎是无限的,任何有限的测试集都无法覆盖所有可能的提问。若有供应商声称准确率达到 100%,通常意味着测试集过于狭窄,或质量评估标准不够严格。
需要说明的是:我们目前的评估分数,反映的是当前测试集范围内的表现。在此范围内,Insight Agent 相比"通用模型 + MCP"方案具有显著优势。但在实际使用中,您仍可能遇到一些不符合预期的情况——这是 Agent 类产品固有的开放性和不确定性所致。
我们将持续扩充评测集的问题覆盖范围,不断完善 Agent harness 的建设,使评测分数更真实地反映您的实际使用体验。
Q4. Insight Agent 现在可以直接在账户里执行操作吗?
目前还不能。当前产品重点聚焦在分析、诊断、解释与建议,直接执行操作能力正在开发中。
Q5. Insight Agent 会记住跨会话的账户上下文吗?
目前还没有。跨会话的长期上下文能力正在规划中。当前体验在单次活跃会话内最强,后续会逐步增强跨会话的持续上下文记忆。