【新智元导读】最近,来自NUS、UT Austin等机构的研究人员创新性地提出了一种「拖拽式大语言模型」(DnD),它可以基于提示词快速生成模型参数,无需微调就能适应任务。不仅效率最高提升12000倍,而且具备出色的零样本泛化能力。 刚刚,包括尤洋教授在内的来自新加坡国立大学、得克萨斯大学奥斯汀分校等机构的研究人员,提出了一种全新的「拖拽式大语言模型」——Drag-and-Drop LLMs! 通过一个轻量级文本编码器与一个级联超卷积解码器的组合,DnD能在数秒内,仅根据无标签的任务提示词,生成针对该任务的LoRA权重矩阵。 通过观察,研究人员发现,LoRA适配器无非是其训练数据的一个函数:梯度下降会将基础权重「拖拽」至一个特定任务的最优状态。 为了赋予模型「拖拽」的能力,团队将这些数据集的提示词与收集到的LoRA权重进行随机配对,构成DnD模型的训练数据——即「提示词-参数」对。 在推理阶段,团队只需将来自全新数据集(训练中未见过)的提示词输入DnD,仅需一次前向传播,即可获得为该任务量身定制的参数。 实验结果表明,在零样本测试集上,团队的方法相较于训练所用的LoRA模型的平均性能,取得了惊人的提升,并且能够很好地泛化到多种真实世界任务和不同尺寸的LLM。 此前,他在中国科学技术大学获得人工智能学士学位。并曾在北卡罗来纳大学教堂山分校Huaxiu Yao教授的指导下进行实习,以及在中国科学技术大学数据科学实验室跟着导师Xiang Wang度过了两年的时光。 Zhangyang Wang目前是德克萨斯大学奥斯汀分校钱德拉家族电气与计算机工程系的终身副教授,并荣膺坦普尔顿基金会第7号捐赠教席。 他于2016年获伊利诺伊大学厄巴纳-香槟分校电气与计算机工程博士学位,师从计算机视觉泰斗黄煦涛(Thomas S.Huang)教授;并于2012年获中国科学技术大学电子工程与信息科学学士学位。 核心目标是创建结构化、模块化的模型表示:1)在过参数化模型空间中实现高效、鲁棒的学习;2)与符号知识及推理进行无缝连接。 此前,他在新加坡国立大学获得数据科学与机器学习博士学位,在中国科学院深圳先进技术研究院获得计算机技术硕士学位,在北京师范大学珠海校区获得学士学位。
ae做片段视频报道指出,泽连斯基反对强制征召18岁人员入伍,尽管他的西方支持者希望这样做。“重要的不是人数,而是武器和技术、金钱和施加压力。制裁将针对俄罗斯用于资助战争的资金。”6月27日消息,今天上午举行的全球人工智能开发与应用大会上,腾讯云大数据基础产品中心总经理程彬透露,腾讯云已经构建完善的“Data+AI”能力,今年下半年将发布数据智能体产品。ae做片段视频两个男人搞一个女人的心理叫什么尸但话说回来,作为一名出生于南非格克贝哈(原名伊丽莎白港)的黑人球员,他的出现和成功对于改变黑人守门员代表性不足的局面具有重大意义——这与美式橄榄球历史上黑人四分卫的缺乏颇为相似。第二天早上8点21分,接到该名男性游客以及同行的一名女士,“我看到那位男士被搀扶着出来,同行女士说是高反。”该名司机意识到情况危急,据他多年的高原经验,这位男士可能出现了高原肺水肿,“所以我告诉那位女士这种情况不能往成都走,途经巴朗山海拔高,往上爬巴朗山只会让他更严重,这种情况应立即就医。”
20250819 🍌 ae做片段视频“我们有不同的信念。他们有一种接近权力的感觉,而我们拥有自由的感觉,各为其志。我们在尊重制度的基础上通过竞争相互促进。我们的根基在于青训足球并培养人才。这让我们为自己感到自豪。我们不仅仅是一家俱乐部。”17.c.cow起草“我们有个厨师微信群,有人发过二维码,想回国就扫码填写个人信息和联系方式,大使馆会直接联系要回国的人。”面对持续的冲突,王先生依然选择留在以色列。
📸 高建文记者 田浩汉 摄
20250819 💫 ae做片段视频当地时间6月15日,伊朗首都德黑兰市区传出一连串爆炸声,部分地区启动防空系统。14日晚至15日,伊朗和以色列各自发动新一轮袭击。免费观看已满十八岁播放电视剧此前,OceanBase在4月发布会上,对外宣布全面其拥抱AI时代的战略,将致力于构建Data x AI能力,面向AI时代推动一体化数据库向一体化数据底座演进。其中,OB Cloud作为其自研的原生分布式数据库,将全面拥抱向量检索、PowerRAG 等 AI 能力并提供一站式数据服务。
📸 赵立勇记者 薛云香 摄
💃 受尾矿库堆放区因暴雨冲刷排洪沟出现局部塌陷等因素影响,广西柳州市柳江上游出现锑浓度异常,沿线融安县、融水县、柳城县及市区群众饮水安全一度受到影响。满18岁免费观看高清电视剧