“中毒”数据将使人工智能“独自学习不好”

中国经济网络保留的所有权利 中国经济网络新媒体矩阵 在线音频 - 视觉节目许可证(0107190)(北京ICP040090) [今天的视图]◎我们的记者张智辛(Zhang Jiaxin)在一个繁忙的火车站,相机监控正在监视平台状况,各个方向,乘客流动,监视监控,卫生状态...所有信息均可实时发送到中央人工智能(AI)系统。该系统的任务是帮助发送火车,以使它们安全和时间。但是,一旦一个人恶意干涉,例如使用红色激光器模仿火车尾灯,就可能会被轨道上的轨道误解。随着时间的流逝,AI学会了将这种幻觉视为真实的信号,并不断地将“跟踪”误差信号视为。最终,火车的传输不仅会中断,而且还会导致安全事故。澳大利亚的杂志最近报告说这是“中毒”数据的常见示例。在研究过程中,如果AI系统不正确或具有误导性数据,则可以逐渐形成误解并做出偏离期望的判断。与传统的黑客入侵不同,“中毒”数据不会直接破坏系统,而是会使AI“自行学习不好”。随着AI在运输,医疗保健,媒体等领域的知名度,此问题吸引了更多的关注。在火车站的一个例子中,AI的真正风险是“中毒”,他认为熟练的攻击既打断了pampunsublic运输,又收集了智能,他连续30天用红色激光欺骗了相机。如果找不到的话,攻击将逐渐调节系统,从而导致后门种植,数据盗窃甚至间谍的隐藏风险。尽管物理基础设施中的数据中毒很少Ajor隐藏风险。一个流行的“中毒”数据案例发生在2016年。在启动了Microsoft推出的聊天机器人TAY之后,它灌输了恶意用户的不适当评论,迅速模仿并发布在X平台上(在Twitter时间)。被迫关闭并道歉不到24小时。根据英国杂志“新科学家”的报道,2024年,在互联网上进行了具有里程碑意义的事件,也就是说,AI Crawler的流量首次超过了人类用户。其中,OpenAI的ChatGpt-User占全球网页的6%。这本质上是一个“ chatgpt”网络代理,它在需要实时信息时访问用户网站。拟人化的Claudebot具有长期的Web内容爬行,占流量的13%。 AI模型继续收集和吸收互联网上的大量内容,以进行持续的培训。当一个人故意分发有毒数据时,例如篡改版权材料和伪造的新闻不可思议的是,这些大型爬行者可以将它们带入模型,从而造成版权违反,传播错误信息,甚至导致主要领域的安全性。在大规模的AI爬行者爬行者上,对版权误解的“中毒”反击,许多创作者关心未经许可就调用该产品。为了保护版权,创作者采用了法律和技术方式。例如,《纽约时报》指责Openai,称该新闻报道再次被模型使用,并在版权中侵犯了。面对版权战争,一些创作者转向技术“自卫”。美国芝加哥大学团队开发了两种工具。一种称为釉料的工具可以为艺术品增加一些像素水平,这使AI型号错误地认为油是油画。另一个工具,夜幕降临是更激进的。 Mait拥有看似正常猫的图片中的隐藏特征,使模型知道错误的字母是“猫=狗”。这样,艺术家在培训数据中进行了“毒药”的作品,从而保护原始样式免于复制。这种反击方法曾经在创作者中受欢迎。自夜影业发行以来不到一年,下载了超过1000万次。同时,Cloudflare基础架构公司还推出了“ AI迷宫”,该公司通过创建大量毫无意义的假网页,消耗其计算和时间的力量,使AI爬行者捕捉到伪造数据的循环。可以说,数据中毒已经从反攻击的方式变为版权和兴趣之间争议的防御性武器的某些地方。权力下放的情况成为AI的保护屏蔽层是机敏的。 “中毒”创作者是为了保护创意,但是一旦使用相同的技术来大规模创建虚假信息,后果就会比版权误解更为严重。面对这个隐藏的tHreat,研究人员正在探索新的防御方法。在佛罗里达国际大学的扎实实验室中,研究人员正在努力使用分散技术来防御中毒数据的攻击。这些方法之一称为联合学习。与传统的集中式实践不同,联合学习允许模型在共享设备或机构上本地学习,这仅总结参数而不是原始数据。此方法降低了单点中毒的风险,因为特定设备的“不良数据”不会立即污染整个模型。但是,如果在合并过程中遇到攻击 - 包括数据,则可能仍会造成损害。到目前为止,将另一个工具 - 区块链引入了AI防御系统。区块链的时间戳和不变的属性放弃了更新模型进行监视的过程。当发现异常数据时,可以监控资源并找到中毒的根源。同样时间,许多区块链网络也可以相互通知,并且当系统识别弱模式时,它可以立即提醒其他系统。任何依赖实际世界数据的AI系统都可以是nutspulahin。借助联合学习和区块链等辩护工具,研究人员和开发人员创建了一个更具弹性,可追溯的AI系统,在遇到欺诈行为时可以发出警报,提醒系统管理员时间进行干预并降低潜在风险。

Related Posts

Comments are closed.