常用工具 医生入驻 免费问医生

用魔法打败魔法,南开大学最新成果让AI“识破”AI—新闻—科学网

2025-08-27 16:38:06 来源:揽名责实网   

“超车道”上的中国汽车:中国车企步入由大变强的机遇期

作者:孙玲玲 来源:中国新闻网 发布时间:2025/8/14 13:10:20 选择字号:小 中 大
用魔法打败魔法,识破南开大学最新成果让AI“识破”AI

 

中新网天津8月14日电(记者 孙玲玲)记者13日从南开大学获悉,用魔近日,法打法南南开大学计算机学院媒体计算实验室取得最新研究成果,败魔不仅从评估的开大科学角度揭示了现有AI检测方法的性能不足,并创新性地提出了“直接差异学习”(Direct Discrepancy Learning,学最新成新闻DDL)优化策略,果让教会AI用“火眼金睛”辨别人机不同,识破实现AI检测性能的用魔巨大突破。相关成果论文已被计算机多媒体领域国际顶级会议ACM MM2025(ACM International Conference on Multimedia)接收。法打法南

图为南开大学研究团队提出的败魔DetectAnyLLM检测框架以及MIRAGE基准数据集亮点全析。(南开大学 供图)

  ?开大科学

近日,OpenAI发布新一代人工智能模型GPT-5,学最新成新闻再次引发全球关注。果让随着DeepSeek、识破ChatGPT、通义千问、豆包等AIGC大模型逐渐从“新奇玩具”变成学习、工作中不可或缺的“生产力工具”,其伴生问题也日益凸显:AI经常会“一本正经地胡说八道”,生成看似合理的虚假信息,造成“AI幻觉”;依赖AI工具代写作业甚至毕业论文,极大冲击着学术诚信和规范;论文AI率检测系统有待完善,论文被误判的问题时有发生……如何精准识别AI生成内容,成为亟待解决的热点问题。

据了解,目前AI生成内容检测主要有两种路线,一种是“基于训练的检测方法”,使用特定数据训练一个专用的分类模型;另一种是“零样本检测方法”,直接使用一个预训练的语言模型并设计某种分类标准进行分类。

图为AI生成内容检测示意图。(南开大学 供图)

  ?

多项研究表明,现有检测方法在应对复杂的现实场景时常显不足。此前也曾有权威媒体报道,《荷塘月色》《流浪地球》等经典作品被某常用论文AI率检测系统检出高AI率。

为何现有的AI检测工具会“误判”?论文第一作者、南开大学计算机学院计算机科学卓越班2023级本科生付嘉晨解释道:“如果把AI文本检测比作一场考试,检测器的训练数据等同于日常练习题,现有检测方法是机械刷题、死记硬背答题的固定套路,难以学会答题逻辑,一旦遇到全新难题,准确率就会显著下降。”

“要想实现通用检测,理论上需收集所有大模型的数据进行训练,但在大模型迭代飞速的今天几乎不可能。”付嘉晨说,让检测器真正学会举一反三,即提升检测器的泛化性能,是提升AI文本检测性能的关键。

为此,研究团队提出了DDL方法另辟蹊径,通过直接优化模型预测的文本条件概率差异与人为设定的目标值之间的差距,帮助模型学习AI文本检测的内在知识,可以精准捕捉人机文本间的深层语义差异,从而大幅提升检测器的泛化能力与鲁棒性。

“使用DDL训练得到的检测器如同有了‘火眼金睛’,即便只‘学习’过DeepSeek-R1的文本,也能精准识别像GPT-5这样最新大模型生成的内容。”付嘉晨说。

团队还提出了一个全面的测试基准数据集MIRAGE,使用13种主流的商用大模型(如豆包、DeepSeek、Kimi等)以及4种先进的开源大模型(如Qwen等),从AI生成、润色、重写三个角度构造了接近十万条人类-AI文本对。

“MIRAGE是目前唯一聚焦于对商用大语言模型检测的基准数据集。直观地说,之前的基准数据集是由少而且能力简单的大模型命题出卷,而MIRAGE是17个能力强大的大模型联合命题,形成一套高难度、又有代表性的检测试卷。”论文通讯作者、南开大学计算机学院副教授郭春乐说。

在MIRAGE的测试结果显示,现有检测器的准确率从在简单数据集上的90%骤降至约60%;而使用DDL训练的检测器仍保持85%以上的准确率。与斯坦福大学提出的DetectGPT相比,性能相对提升71.62%;与马里兰大学、卡内基梅隆大学等共同提出的Binoculars方法相比,性能相对提升68.03%。

“AIGC发展日新月异,我们将持续迭代升级评估基准和技术,致力于实现更快、更准、更低成本的AI生成文本检测,以AI之力,让每一篇成果更出彩。”研究团队负责人、南开大学计算机学院教授李重仪说。

(原标题:“用魔法打败魔法” 南开大学最新研究成果让AI“识破”AI)

 特别声明:本文转载仅仅是出于传播信息的需要,并不意味着代表本网站观点或证实其内容的真实性;如其他媒体、网站或个人从本网站转载使用,须保留本网站注明的“来源”,并自负版权等法律责任;作者如果不希望被转载或者联系转载稿费等事宜,请与我们接洽。

希望以上内容对您有帮助。

阅读全文
相关推荐
娱乐视频推荐精选问答
养生文章推荐
五金应用极简设计分享会在东莞厚街举行

挑选优质橱柜 不容小觑的一些细节

五金应用极简设计分享会在东莞厚街举行
9月7日,五金应用极简设计分享会在东莞市厚街镇举行。炬森五金董事长戚志、中国香港设计师陈飞杰、深圳优舍住研院院长关永康、家居设计师Matthew Arquette马修·阿凯特等出席并作分享,探讨最前沿
灿烈拖鞋被粉丝踩坏照片曝光 发长文呼吁粉丝要注意安全

品质蓄势,益客堂杯装果汁高颜值、多口味,领跑市场!

灿烈拖鞋被粉丝踩坏照片曝光 发长文呼吁粉丝要注意安全
灿烈现身机场拖鞋被粉丝踩坏损坏的拖鞋EXO 成员朴灿烈社交账号晒出损坏的拖鞋照片,并发文呼吁粉丝能够遵守秩序,不要在公共场合给他人造成麻烦。据悉灿烈的鞋子是因机场接机拥挤,被粉丝踩坏。朴灿烈发长文呼吁
三大厂将会为RTX 50显卡提供GDDR7显存:品质相差不大,不用担心质量

选购实木家具的朋友们注意了!这样的实木家具一定不能买!

三大厂将会为RTX 50显卡提供GDDR7显存:品质相差不大,不用担心质量
作为NVIDIA GeForce RTX 50系显卡的核心部件,GDDR7显存基本上都是被NVIDIA所独享,相比较GDDR6X显存,GDDR7显存拥有更高的带宽,从而带来更高的数据传输速度。不过考虑
助力文明建设 厦门翔安首批设置47根灭烟柱

全球四大会计师事务所齐聚郑东新区

助力文明建设 厦门翔安首批设置47根灭烟柱
翔安首批设置47根灭烟柱海西晨报讯记者 陈晓青)近日,在厦门翔安南部新城鼓岩社区内,公交车站旁新增了几个黑色和银灰色的两种不锈钢灭烟柱,让烟头不落地。居民彭先生觉得,这些“室外烟灰缸&rd
十大瓷砖品牌:抛光砖的优缺点大全

广东广州防撞车多少钱?深圳防撞缓冲车出租租赁多少钱一天?专汽家园

十大瓷砖品牌:抛光砖的优缺点大全
什么是抛光砖?抛光砖是通体砖坯体的表面经过打磨之后形成的一种光亮的砖,抛光砖的特点是坚硬耐磨,经常被使用在大厅、客厅、餐厅等地。那么,抛光砖的优缺点是什么呢?抛光砖基础知识抛光砖是通体砖坯体的表面经过
三大厂将会为RTX 50显卡提供GDDR7显存:品质相差不大,不用担心质量

火爆十六年,豪礼来相送!聪状元食品续约火爆网,携手同奋进!

三大厂将会为RTX 50显卡提供GDDR7显存:品质相差不大,不用担心质量
作为NVIDIA GeForce RTX 50系显卡的核心部件,GDDR7显存基本上都是被NVIDIA所独享,相比较GDDR6X显存,GDDR7显存拥有更高的带宽,从而带来更高的数据传输速度。不过考虑
河南省人才交流中心分析报告出炉 高学历人才占比稳步上升

实木家具的选购真的要做到是不看广告看品质!

河南省人才交流中心分析报告出炉 高学历人才占比稳步上升
河南省人才交流中心分析报告出炉 高学历人才占比稳步上升发布时间:2018-04-11 09:37 来源:豫都网 我要投稿[摘要]河南日报讯记者王冠星)1月22日,省人才交流中心发布《2017年河南省人
灿烈拖鞋被粉丝踩坏照片曝光 发长文呼吁粉丝要注意安全

青训梯队本周赛程汇总

灿烈拖鞋被粉丝踩坏照片曝光 发长文呼吁粉丝要注意安全
灿烈现身机场拖鞋被粉丝踩坏损坏的拖鞋EXO 成员朴灿烈社交账号晒出损坏的拖鞋照片,并发文呼吁粉丝能够遵守秩序,不要在公共场合给他人造成麻烦。据悉灿烈的鞋子是因机场接机拥挤,被粉丝踩坏。朴灿烈发长文呼吁
倍加福传感器在食品包装中的应用

全市14个在建交通重点项目已全面复工

倍加福传感器在食品包装中的应用
1.应用挑战在食品行业的预制餐生产过程中,塑料托盘被广泛使用,这些托盘通常被划分为多个小格。对于由多种不同成分(如肉类、意大利面或蔬菜)组成的餐食来说,正确填充这些小格至关重要。为了确保各种成分能够准
崔永元起诉黄毅清诽谤 崔永元黄毅清微博互掐原因是什么

8月15日美市更新支撑阻力:18品种支撑阻力(金银铂钯原油天然气铜及十大货币对)

崔永元起诉黄毅清诽谤 崔永元黄毅清微博互掐原因是什么
现在,崔永元、黄毅清,同上热搜了,并且还是位列热搜榜单第二,随即,我们有了解到,崔永元起诉黄毅清诽谤,并在微博上喊话、骂黄毅清,说他娘炮、躲法律传票,等等。然而,黄毅清也不怂,也在微博上回击了,一场网