Midjourney太逼真？自动检测工具来了

创业邦的创作者·2023-03-28

3月16日，Midjourney V5正式发布

3月16日，Midjourney V5正式发布，逼真性、细节性震动业内外，网友们玩儿的不亦乐乎，设计师Adam fard在Twitter留下一道“无奖竞猜”：下面四张图，只有一张是真人，其它都是Midjourney 画的，你能猜出是哪张吗？

人类的肉眼凡胎已经无法抵御AI的魔法攻击，广大网友们摆烂式回复“稍等，我先预约下眼科”“Midjourney顺便帮我生成一双眼睛吧”...

而国内下一代人工智能安全企业中科睿鉴率先公布了答案——只有小女孩是真人！古语有云，打败魔法还得是魔法本身，反制AI还得靠AI。经Adam fard本人确认，中科睿鉴喜提“标答”。

（图像生成内容检测工具“睿图”针对Midjourney生成内容检测结果)

不仅图像，在Chatgpt 4发布一周内，睿鉴团队迅速上线了针对Chatgpt 4生成文本内容的检测工具“睿鉴图灵”。事实上，睿鉴已经完成面向文本、图像、音视频伪造检测全技术栈技术布局。

(文本生成内容检测工具“睿鉴图灵”针对Chatgpt 4检测结果)

(音视频生成内容检测工具“睿安”针对各类型深度伪造数据检测结果)

之所以具备如此高效的模型演化迭代效率，得益于睿鉴打造的伪造检测行业基础大模型。历经三年，面向公共安全、金融安全、互联网内容安全等重点行业，睿鉴逐步积累了分行业、分场景的伪造检测能力，形成了核心技术——AI基础设施——行业基础大模型的体系化能力底座，参数量级达到60亿。因此，新的伪造生成技术一经面世，通过微调，就可在基座模型基础上针对性地迅速分化出相应的检测模型。

(行业基础大模型框架)

数据的生成与检测互为对抗，也互相促进。如何精确、高效地“喂饱”模型、“喂好”模型，是让模型“成长为专家”的另一个关键。睿鉴将数据生成的过程进行集成，研发了一个全自动化的数字内容生成平台。内置百余种深度合成、diffusion类生成算法可快速调用，支持多人、多目标、复杂场景下的高逼真生成。

(睿鉴数字内容生成一站式平台)

此次针对MidJourney V5的对抗式AIGC内容检测模型训练框架，在历时数月的训练数据准备阶段，基于三年形成的多模态生成模型底座复现了十余种diffusion模型，最终生成了TB级的高质量生成数据。结合在多领域应用场景中积累的人工数据，输入包含多种检测算法的多模态检测模型底座，产生的内容检测模型可以即插式快速加入检测模型族。针对新型伪造算法，可以快速生成、快速调优训练，快速部署应用，大大缩短整体流程。

在模型训练时，我们采用fp64高精度模型，以模型判断、传统图像处理、多模态逻辑判断相结合的方式突破传统方法局限，训练任务以多模型、多模态方式进行，模型间损失函数误差每隔特定迭代次数同步一次，并随时调整相关模型的学习率，在海量参数模型基础上进行多个鉴伪模型分布式联合训练，以使模型检测实现最高效率与最佳效果，当前整体使用的训练算力，相当于100张英伟达A100训练3个月。

据悉，中科睿鉴长期深耕虚假伪造检测技术的研发，核心成员来自中科院计算所数字内容合成与伪造检测实验室，是伪造检测领域的“国家队”，未来，中科睿鉴将通过算法突破、产品创新、系统搭建实现更多“必杀技”，织密筑牢全栈式伪造检测防线，打造新时代互联网数字内容安全基础设施，用技术让世界更可信。

来源：砍柴网