2025年3月31日,北京知识产权法院就某平台公司(以下简称“原告”)和某信息技术公司(以下简称“被告”)就AI模型结构和参数的侵害著作权及不正当竞争纠纷案[1]作出二审宣判。本案是国内在AI模型结构与参数保护领域的首例判决,具有里程碑意义,标志着AI模型在不正当竞争法框架下的可保护性。案件围绕建模方法和过程的举证和辩论,突出显示了模型方法论将成为AI应用产品交易、责任划分和相应侵权纠纷解决的一个关键内容,值得引起AI行业和立法、司法部门的高度关注。
一、基本案情
原告基于基础Cyclegan模型[2],利用所聘用手绘师绘制的漫画数据与相对应的真人数据进行训练,并不断调整模型结构与参数,最终得到变身漫画特效模型。该模型被用于抖音app中的“变身漫画特效”功能,2020年6月15日上线,可以将用户实时拍摄的照片、视频转换为漫画风格。截至2021年3月12日,变身漫画特效有1717.6万人使用,2.9亿次播放。被告运营的B612咔叽应用程序晚于原告上线了“少女漫画特效”功能,2020年8月4日上线,同样可实现对照片、视频的漫画风格的实时转换。
原告主张,被告复制、传播少女漫画成像的行为侵害了原告对用户使用其变身漫画特效模型生成作品的复制权、信息网络传播权;并且,被告以抄袭模型结构和参数的方式使得少女漫画成像与变身漫画成像高度近似,该行为攫取了属于原告的用户流量和影响力,构成不正当竞争。
北京市朝阳区人民法院(以下简称“一审法院”)认定,变身漫画成像不属于著作权法保护的客体,对被告构成著作权侵权的主张不予支持;被告通过使用与变身漫画特效高度相似的模型使少女漫画特效能够起到替代变身漫画的效果,损害了原告的竞争利益,构成不正当竞争;被告为少女漫画特效以及B612咔叽手机应用程序的经营者,应当为其不正当竞争行为承担民事责任。
由于原被告均未针对著作权侵权问题提出上诉,北京知识产权法院(以下简称“二审法院”)主要围绕不正当竞争认定问题,纠正了一审法院仅基于变身漫画特效本身论述原告是否具备竞争利益的方法,确认了原告就其开发的模型享有受《反不正当竞争法》保护的竞争利益的主张。二审法院在围绕模型建模方法论述后,维持了一审法院对被告违反《反不正当竞争法》第二条的认定,最终判决驳回上诉,维持原判。
二、对AI建模方法和过程的举证成为证明原告合法权益的关键
原告主张其通过真人照片和手绘师绘制漫画作品训练形成的模型,包括模型结构和参数,属于竞争优势,受到《反不正当竞争法》的保护。二审法院经分析后认为原告对其变身漫画特效模型享有受《反不正当竞争法》保护的竞争利益。围绕建模的过程,原告组织的证据和说理是其胜诉的核心。原告通过举证,证明其建模过程中使用了不少于5人的模型研发人员,并委托外包手绘师参与涉案变身漫画特效的研发;模型形成过程包括风格设定、对照真人照片绘制50696张漫画作为模型训练数据、模型训练、调整和最终定型等步骤。其中训练涉及的数据扩充、画法调整、算法优化等过程均成为原告证明其竞争利益的核心证据。
原告提供的某高校专家对比意见显示,变身漫画特效模型的结构与参数与已公开的其他模型明显不同。而比对从公开渠道提取的原告变身漫画特效模型与被告少女漫画特效模型,可以确认从技术实现角度,两模型具备高度同一性。
被告未能提交独立研发和两个模型实质性差异的证据。具体来说,其未提交证据形式的模型训练及数据集数据。因此,一审法院认定其辩称少女漫画特效模型系独立研发的意见无事实依据,不予采纳。
三、对模型结构和参数的细节分析也成为重要证据
原告公司变身漫画特效模型的结构和参数细节,主要被用于比对两个模型的相似性,成为有力证据,证明被告直接使用了原告开发的模型的结构和参数,为一审和二审法院均予认可。被告无法对两个模型的高相似度作出合理解释,也没有提出有效证据证明其模型的自主研发过程。
根据判决书文件,被告也指出了两个涉案模型的差异,但法院认定该差异对于模型的网络结构、网络性能以及最终漫画效果的影响微小,不足以否定两个模型在技术方面的高度同一性。最终法院认定被告实际使用了原告模型的结构和参数。
在证明被告使用原告模型结构和参数的可行性问题上,原告还使用鉴定机构鉴定意见和专家证人意见的方式,证明在模型随原告公司APP发送至用户终端后,技术人员可以在本地运行的过程中通过技术手段提取模型进行解密,获得模型的结构和参数。
模型结构和参数的接触可能性和高度相似性两个方面的证据成为证明被诉行为不正当性的基础。一审法院认为,由于原告基于该模型上线的AI产品的发布时间早于被告,被告有接触AI产品的可能性。虽然模型开发存在参考相同研究成果、使用相同结构的可能,但模型参数的设置较为细节,出现高度一致性的可能性较小。认定被告模型抄袭原告模型具有较高的可能性。
二审法院则认为,原告投入大量人力、物力、财力,通过手绘训练数据,形成其人工智能模型的结构和参数,从而获得其竞争优势和技术壁垒。基于相关证据可认定被告直接使用原告的人工智能模型的结构和参数,是对该壁垒的突破。被告在原告的AI产品上线后不久与其竞争流量和用户,应被视为违反人工智能研发、经营领域公认的商业道德。被诉行为具有不正当性,且扰乱、影响市场竞争秩序,并影响消费者未来的选择空间,最终损害了消费者长远利益。
四、本案为AI和算法模型受《反不正当竞争法》保护创设先例
二审法院对于AI模型研发及经营场景适用《反不正当竞争法》的条件和理由进行了全面的分析。从原告是否享有应受反不正当竞争法保护的合法利益、被诉行为是否具有不正当性、被诉行为是否侵害原告的合法权益、被诉行为是否扰乱市场竞争秩序并损害消费者长远利益四个方面,充分论证了被诉行为构成《反不正当竞争法》第二条规定的不正当竞争行为。
在我国AI专项立法尚缺、著作权法尚未跟上人工智能行业飞速发展的情况下,本案为通过《反不正当竞争法》遏制AI领域的技术侵权提供了裁判首例。这意味着在未来的AI模型侵权案件中,即便AI未注册为专利或未被纳入作品范畴,若能证明AI模型为企业通过正当投入取得,并具备差异化的市场竞争效果,亦有可能获得反不正当竞争法领域的司法保护。本案判例为相关企业在AI开发及应用成果保护方面提供了更多的诉讼策略选择。
同时,本案也引发了一些问题思考,需等待未来司法实践和竞争法政策制定者进一步关注。最显著的一个担忧就是过度适用反不正当竞争法可能抑制技术创新的问题,即如何区分“合理模仿”与“不正当竞争”行为。在AI模型大量基于开源模型或算法的情况下,若涉及更复杂的技术细节(如模型微调、蒸馏等),创新或侵权行为存在更多的模糊地带,行为认定和责任划分则可能更为复杂。
另外,本案在被诉行为不正当性的认定上,对AI模型采用了“高度相似”的标准。相似程度的判断既是一个技术性的问题,在司法实践中也将成为一个核心的侵权标准问题。通常来说,一个AI模型被视作由三部分组成:输入层、输出层和隐含层,在针对具体案情进行相似程度的判断时,如何对上述各个层面(特别是具有“黑匣子”特性的隐含层)进行客观合理的判断,进而提高该标准的适用合理性仍有待司法实践的探索和完善。
五、个人信息保护的合规程度是否影响企业的竞争利益认定
本案被告提出了原告模型在个人信息保护合法性方面的上诉主张,认为原告使用非法获取的人脸照片数据,违反个人信息保护法的规定,故其不应受到反不正当竞争法保护。二审法院认为原告使用非法获取的人脸照片数据与原告选择并使用何种人工智能模型的结构和参数无关,未予支持被告主张。
然而,笔者认为,使用个人数据构建模型的合法性实质上决定了原告是否对其为开发AI模型而收集的数据集享有竞争性利益。数据收集和利用是本案人工智能模型及其应用的重要组成部分。法院有必要进一步说明数据收集和使用与AI模型是相对独立的,数据合规的问题可以不影响原告因开发模型而享有的竞争性利益。当然,法院也可能采取另一种截然相反的规定,认定数据收集和AI模型建模是密切相关的,进而根据被告的主张去审理数据合规问题对模型的竞争性利益的影响。国内已有判例对数据集的合规性问题是否影响竞争性利益进行过分析和讨论。在原告北京淘某有限公司与被告深圳小某本有限公司不正当竞争纠纷一案中,深圳市中级人民法院将“被告未提交证据证明原告收集、使用涉案数据存在不合法或不合规的情况”作为理由之一,认定无法排除“原告对其经营平台收集的个人数据集合享有竞争性利益”[3]。
可以看出,AI开发及部署过程确实存在很多复杂问题。法院目前采用的处理方式更倾向“整体视角”,而非单一就模型某一层面比对进而认定当事人权利。笔者认为这种综合评判标准更能适应AI实际研发运营中的复杂情况。
六、有关AI或者模型算法著作权的诉求未能获得认可
本案中,对于用户使用变身漫画特效形成的漫画形象、视频,原告主张其构成美术作品、视听作品,且原告对其享有著作权。一审法院认为,原告在模型生成过程的四个阶段(风格设定、风格化量产、模型训练、用户生成)的行为均非著作权意义上的创作行为,原告模型不属于著作权法保护的客体,故未支持原告关于侵害其著作权的主张。二审法院未再评价这一主张。就原告行为是否能被认定为创作而言,一审法院认为,原告投入大量成本的模型训练属于为创造生成工具的行为,总体上原告的控制力体现为对模型以及模型训练数据的控制,原告只能设定其模型生成的风格。因此,并不能因为原告研发了AI模型,就当然地认为其通过AI模型完成了创作。
另一方面,AI模型生成图片或视频的过程并无法模拟自然人的选择和判断,其高度重复并在每一次创作过程中精准表现同一性的过程无法体现自然人的思想、情感和个性,其生成过程的无法选择性决定了其无法被认定为著作权法保护的作品。
该裁判观点沿用了北京互联网法院在全国首例“AI文生图”著作权案[4]使用的立场。按照北京互联网法院的观点,人工智能模型本身无法成为我国著作权法规定的作者,使用AI模型生成受著作权法保护作品的用户才享有著作权。但争议仍然存在,若用户与AI开发者甚至部署者均对生成内容存在显著控制,如何区分著作权,是否可能构成合作创作,是否可以类比计算机程序对AI模型进行著作权保护等问题仍然有待司法实践的回答。
七、小结
在AI、机器学习等领域,由于模型的训练、生成过程通常具有一定的不透明性,“黑匣子”问题使得企业较难获得明确的“抄袭证据”。本案原告通过灵活应用技术比对方法,依托建模方法论的基本逻辑,为黑箱环境下的技术壁垒举证提供了可行路径。二审法院则在技术抄袭的认定方面确立了关键标准,即模型结构及参数的高度一致性可作为直接证据,被告在此情况下应承担证明独立研发的举证责任。此案的启发意义在于相关企业需要重视AI与算法模型工作的基础工作,关注模型风险管理和内部控制。这不仅是企业技术创新和发展的基石,也是企业维护自身权益、必要时采取法律手段保护自身成果的重要工具。
本案确认了通过竞争法实现AI模型司法保护的路径。随着“竞争利益”保护进入AI相关行业的视野,企业对于侵权纠纷维权的举证逻辑将从“技术上是否相似”进一步拓展为“是否形成差异化市场竞争优势”,证据链结构将趋于复杂,可能面临举证标准趋严、甚至标准本身成为争议焦点的趋势。如何打造知识产权保护体系、系统化管理AI建模方法和证据将成为AI行业创新发展过程中必须要关注的问题。
注释:
[1] 一审:北京市朝阳区人民法院(2023)京0105民初71391号民事判决书;二审:北京知识产权法院(2023)京73民终3802号民事判决书。
[2] CycleGAN是一种常见的开源GAN模型,常用于图像转换领域。
生成对抗网络(Generative Adversarial Network,简称“GAN”)是一种生成式机器学习模型,它被广泛应用于广告、游戏、娱乐、媒体、制药等行业,可以用来创造虚构的人物、场景,模拟人脸老化,图像风格变换,以及产生化学分子式等等。
按照原告申请到庭陈述的有专门知识的人北京邮电大学马占宇教授的证言:GAN是一类模型,开源的模型仅开源了GAN模型的原理结构,GAN模型的基本框架相同,但深度训练后呈现的模型会有所不同。
[3] 广东省深圳市中级人民法院(2021)粤03民初5302号民事判决书。
[4] 《“AI文生图”著作权案一审生效》,载微信公众号“北京互联网法院”,2023年12月27日发布,https://mp.weixin.qq.com/s/AzhPYHqLCCXiWwL2AuKjnw。