尽管大型语言模型(LLMs)和大型视觉 - 语言模型(VLMs)在视频分析和长语境处理方面取得了显著进展,但它们在处理信息密集的数小时长视频时仍显示出局限性。 本文提出了一种新颖的智能体 Deep Video Discovery (DVD),通过将长视频分割为更短的片段并将其视作环境,利用 LLM 先进的推理能力来思考问题并自主规划,选择具有适当参数的工具来从环境中逐步获取信息,最终回答问题。在最新的推理模型OpenAI o3的帮助下, DVD以这一简洁有效的 agentic 框架在非常具有挑战性的LVBench上以74.2%的准确率大幅超越了之前的工作。这一工作将以MCP Server的形式开源。 不同于之前的视频智能体框架依赖于手动设计的固定工作流程,DVD 强调其作为智能体的自主性,即通过自主规划,决策和行动来解决问题。 为了充分利用这一自主性,我们将原始的长视频转换为多粒度视频数据库,并提供了一套以搜索为中心的工具使得智能体在不同阶段搜集不同粒度的信息。具体来说该系统主要由三个核心组件构成:多粒度视频数据库、以搜索为中心的工具集以及作为智能体协调器的 LLM。 在 “多粒度视频数据库构建” 阶段,系统将超长视频转换为一个结构化数据库,通过统一将视频分割成短片段(例如 5 秒),并提取全局、片段和帧级别的多粒度信息,包括主题中心化摘要、片段字幕及其嵌入向量,以及原始解码帧...。 (2)片段搜索(Clip Search)工具,实现通过片段描述 Embedding 对视频内容进行高效语义检索,并返回排名靠前的相关视频片段及其字幕和时间范围。 LLM 作为核心认知驱动器,在迭代的 “观察 - 推理 - 行动” 循环中,根据累积的知识和推理证据采取行动,从而赋予智能体自主、证据引导和灵活的行动机制,有效地将原始查询分解为逐步细化的子查询来解答问题。 该系统在多个长视频基准测试上进行了全面评估,展现了其卓越的效率和强大的性能。在极具挑战性的 LVBench 数据集上,DVD 智能体取得了 74.2% 的最新准确率,大幅超越了所有现有工作,包括先前的最先进模型 MR. Video(13.4% 的提升)和 VCA(32.9% 的提升)。在辅助转录的帮助下,准确率进一步提高到 76.0%。在 LongVideoBench、Video MME Long 子集和 EgoSchema 等其他长视频基准测试中,DVD 也持续超越了先前的最先进性能。 图 3:不同基础模型在智能体中的行为分析。图中可以明显看出不同基础模型表现出显著的行为模式差异,不具有推理能力 GPT-4o 表现出非常单一的行为模型。 消融研究证实了工具设计的有效性,并强调了推理模型在整个智能体系统中的关键作用:更换推理模型(如使用 OpenAI o4-mini 或 GPT-4o)会导致性能下降,这表明 LLM 推理能力的缺失会导致智能体行为崩溃。对智能体推理行为的分析也揭示了不同模型在工具调用模式、推理深度和准确性之间的关联,例如 GPT-4o 表现出过度自信和行为崩溃,倾向于过早结束推理。这些行为模式的分析进一步为未来的智能体设计以及基础语言模型的发展提供了实践参考。
《夫妻快乐宝典》完整版“随着比赛的临近,每一天的训练都变得越来越激动人心,因为我知道我能在这个比赛中为球队作出贡献。皇马的目标一直都是赢得胜利,这一点非常明确。我们会在这项赛事中倾尽全力,同时创造历史,成为首支赢得这届世俱杯冠军的球队。”"我浑身发抖,双腿发软。"乔汗描述道。这架载有242人的波音787客机于当地时间下午1点40分(伦敦时间上午8点10分)起飞后不久坠毁在古吉拉特邦一个居民区附近,并撞上一栋建筑物后爆炸起火。《夫妻快乐宝典》完整版宝宝下面湿透了还嘴硬的原因Agentic AI 不仅在消费领域展现了巨大潜力,更在企业应用中显示出其独特的价值,同时也让众多企业面临前所未有的机遇和挑战。如何在 Agentic AI 的浪潮中找准方向、乘风破浪,也成为行业中备受关注的话题。说到这,刚刚落幕的 2025 火山引擎 Force 源动力大会或许能给我们带来一些启发。海伍德:当我在夏洛特的时候,安东尼在我们头上拿了60分。我忘了还有麦迪,安东尼或者麦迪吧,麦迪在魔术的时候,他也拿下了60分。
20250818 🔞 《夫妻快乐宝典》完整版两人上周末(15日)在纽约长岛地区的豪宅中举办的婚礼,被美媒称为“民主党权力和财富的巅峰结合”——美国前总统克林顿、前众议长佩洛西、前总统候选人哈里斯都到场庆贺。年事已高的乔治·索罗斯也提前一天为两人举办了祝福仪式。无人区一区二区区别是什么呢感觉娱乐圈的事情也不是观众能弄得清的,里面关系利益错综复杂,不能轻易的去评价一个人和一件事。还是应该多关注作品本身好不好
📸 袁殿松记者 赵帅 摄
20250818 🔞 《夫妻快乐宝典》完整版当地时间本周六,罗马官方推特表示,经过球迷们投票,从五个候选进球中选出苏莱的进球作为2024-25赛季的罗马最佳进球。这个进球发生在今年4月的罗马德比,苏莱在禁区外不停球直接远射,足球击中横梁后弹地,整体越过了门线。看日韩大片ppt免费ppt张弛表示,在行动上,上合组织防长会将坚定捍卫公平正义,共同应对安全挑战,以具体的规划和实际的行动来推动防务安全合作行稳致远,为变乱交织的世界注入稳定性。
📸 杜利民记者 孙国强 摄
💣 即使是小米,首年交出13.7万辆的“不错”成绩单,背后也付出了1050亿天文数字的研发成本。更严峻的是,价格战将利润空间压缩到极限,新品牌缺乏规模和成本优势,几乎没有溢价能力,生存概率渺茫。什么是鉴黄师