本文通过分析《人工智能相关发明专利申请指引(试行)》的逻辑框架,结合最近《专利审查指引》修改草案征求意见稿的内容,指出中国人工智能专利申请审查指引遵循着普遍的数据建模科学方法的要求。该方法论体现在数据治理和模型治理方面的原则要求,与欧盟《人工智能法》以及美国FDA的人工智能应用治理规则具有相同的逻辑。文章通过分析解读,提出要充分重视科学方法论在人工智能治理和规则体系构建中的作用。同时,关注方法论问题对于解决人工智能发明专利申请及复审、无效、侵权纠纷等问题也具有重要的意义。
一、《人工智能相关发明专利申请指引(试行)》的背景和内容
2024年12月31日,为全面、深入诠释我国现行专利法律制度框架下人工智能领域的专利审査政策,回应创新主体普遍关切的热点问题,提升专利申请质量,助推新质生产力发展,国家知识产权局组织编写了《人工智能相关发明专利申请指引(试行)》(以下简称“《指引》”)[1]。《指引》共分为六个部分,主要涉及人工智能相关专利申请的常见类型及法律问题、发明人身份的认定、方案客体的标准、说明书的充分公开、创造性的考量以及关于人工智能伦理的指引性意见等,为相应的专利申请工作提供了具体的指引。
2025年4月30日,国家知识产权局就《专利审查指南》的最新修改草案征求公众意见(以下简称“审查指南修改稿”),其中特别增加了有关人工智能内容的审查基准和示例[2]。修改稿在人工智能审查原则部分新增“数据采集、标签管理、规则设置、推荐决策等存在违反法律,违背公平正义、存在歧视偏见等”违反专利法第五条第一款不予授予专利的要求并给出示例,并针对创造性、充分公开部分的内容新增专利申请的具体示例及分析。
二、科学方法论的提出
人工智能领域的科学方法论是指在算法、人工智能构建和应用过程中所应遵循的一系列自然科学和社会科学研究和应用的规则、方法和技术。以欧盟《人工智能法》为例,其立法体系和内容的一个基本逻辑是按照基本方法论对算法和系统的开发和应用规则进行了规定,在对数据分析、训练和模型构建过程进行解析的基础上,特别关注有效性问题、偏见(或者说误差)的可能性及纠正方法,将各个环节涉及的科学方法要求以法律规则的形式进行了明确,以期达到规范人工智能开发与应用的目的。
总结欧盟《人工智能法》第十条数据与数据治理的要求[3],人工智能开发与应用所应遵从的基本方法规范主要包括以下几个方面:
-
整体设计方法选择:针对不同类型的数据特点、样本规律、数学模型的限制,为了实现应用目标,在模型和人工智能系统的设计研究方面将采取不同的数学量化方法。研究设计和方法的选择是科学方法论的一个核心内容;
-
数据收集:在数据收集的过程明确数据是否来自特定的样本,导致数据及基于数据开发的模型仅对该特定群组具有代表性,而在扩大到一般适用的情况下可能产生相应的误差。科学方法论要求对数据特点及其相关误差采取有针对性的处理,并对应用采取适当的限制和提示;
-
数据处理:对算法和人工智能使用数据的准备和处理操作进行规范,如对原始数据标注、清洗、更新、丰富和加总合并,以及对涉及个人信息的数据进行匿名化处理等环节应遵循科学方法的要求,涉及个人信息保护的,需要满足相应的法律要求;
-
数学的函数选择:不同数据集所对应的数学处理的方法不同,所选择的模型及相应的统计学假定和推理逻辑也会有不同的要求;
-
对模型进行可证伪性验证:在研究设计方面,数据的可获得性、数据数量和质量等方面的特征将影响模型验证。相应的模型测试和进一步的精调都需要额外的测试工作,也应允许外部第三方使用独立的方式对模型的有效性进行验证;
- 误差与偏见的处理和伦理规范:检查可能存在的模型或系统上的偏见或误差,采取有针对性的处理方法也是科学方法论的重要内容。这些偏见可能对相关人员、社会、政治、法律秩序造成影响,对人的基本权利产生负面影响,导致法律所禁止的歧视。
三、对《指引》的解读和方法论示例
《指引》在人工智能专利审查的具体工作中贯穿着对上述科学方法论的遵从。举例而言,在第三章“关于方案客体的标准”情形三,“基于人工智能算法挖掘具体应用领域的大数据中符合自然规律的内在关联关系”部分明确要求:处理具体应用领域的大数据需关注数据之间符合自然规律的关联性,并获得技术效果才构成技术方案。另外,《指引》在第五章关于创造性的考量中,提出有关创造性的审查标准应将与技术特征功能上彼此相互支持、存在相互作用关系的算法特征与所述技术特征作为一个整体考虑。要求审查特定功能或领域中应用人工智能算法或模型时,应考虑算法特征对方案做出的贡献。专利申请人应明确说明实现特定功能或应用于特定领域时所要解决的技术问题,所采用的遵循自然规律的技术手段,以及由此获得的符合自然规律的技术效果。
这些审查要求中所提及的“符合自然规律”的要求,实质上就是对科学方法的遵从。我们以《指引》提供的具体案例进行说明。
示例1:一种食品安全风险预测方法[4],见图1。该示例通过分析食品安全风险时间的影响因素,以表征食品风险的数据,构建四元组据,得到添加时间戳的知识图谱,最后通过数据训练得到模型。
图1 一种食品安全风险预测方法的逻辑图
示例2:涉及一种基于多传感器信息仿人机器人跌倒状态检测方法[5],见图2。该方法申请人通过模糊化算法处理输入数据,输出隶属函数并建立预测模型,为进一步发出准确的机器人姿势调整指令提供依据。
图2 一种基于多传感器信息仿人机器人跌倒状态检测方法的逻辑图
国家知识产权局近期新发布的“审查指南修改稿”也有类似的方法要求。例如,针对人工智能专利申请,要求在确定是否授予专利的结论时,建议审查具体应用领域下的数据采集、模型构建和数据训练等内容,并分析记载模型或算法是否与具体领域或场景相结合,包括算法或模型的输入、输出数据如何设置以表明其内在关联关系等内容。这些建议要求的内容从数据采集、建模方法、数据训练、测试和验证等方面也同样遵循着方法论的要求。这与欧盟、美国等针对人工智能系统开发与应用所期待的要求是一致的。
四、与欧盟《人工智能法》、美国FDA人工智能应用治理规则的对比分析
我们进一步将国家知识产权局《指引》中提到的方法论逻辑与欧盟《人工智能法》以及美国FDA人工智能应用治理规则进行对比,可以更为清晰地发现其相似之处。
(一)与欧盟《人工智能法》的对比
表1《指引》与欧盟《人工智能法》的对比
以《指引》示例1和《欧盟人工智能法》第十条关于数据治理的要求[6]为例,从两个文本的对比(表1)可以发现,二者都强调以下数据和模型处理的关键方法要求:
-
关注数据间是否具有符合自然规律的内在关联性、代表性:训练、验证和测试所使用的数据集应与其预期用途相关、具有足够的代表性,并尽可能完整,免受误差的影响。示例1围绕历史食品安全风险事件,采集食品原料、食用物品、食品抽检毒害物及对应时间戳等数据。这些数据均与表征食品安全风险的各类危害物含量等级、风险相关。
-
数据处理:如数据的注释、标注、清洗、更新、充实和聚合等,使得数据集具有统计特性,便于模型构建。示例1涉及的数据、指标,包括时间戳,经过头部、尾部数据的抽取,与时间序列一起,被用来实施具体的分析。
- 使用处理后数据进行建模:在模型构建过程中,根据数据特征的差异性,选择适配的量化函数,从而确保所构建的算法能够准确反映实际应用场景的特征。示例1基于食品品质会随着时间而变化的自然规律,在构建知识图谱时加入时间戳,基于时间序列下的各类数据,构建四元组数据,训练预设的神经网络模型,形成对未来时间点的食品安全风险进行预测的能力。
(二)与美国FDA人工智能应用治理规则的对比[7]
美国FDA人工智能应用治理规则为申办方和其他相关方提供了有关在药品全生命周期内使用AI生成信息或数据的规范建议,其治理规则同样遵循一定的科学方法论要求。
表2 《指引》与美国FDA人工智能应用规则的对比
以《指引》示例2和美国FDA规则的文本[8]为例,通过综合对比,我们同样发现二者之间也都遵循相似的方法要求。
-
采集数据:示例2以机器人的姿态信息、ZMP点位置信息、步行阶段信息等作为基础数据,作为模型的数据输入。FDA规则要求对模型的数据输入、数据集、数据采集过程进行说明。
-
数据的处理及模型构建:根据数据特征选择合适的量化方法构建模型。例如,示例2通过对姿态传感器信息、零力矩点ZMP传感器信息等进行融合,建立分层结构的传感器信息融合模型。
- 在数据输出和应用场景上:示例2的申请通过利用前后模糊决策系统和左右模糊决策系统,判定机器人在前后方向和左右方向的稳定性,帮助其步态规划和信息反馈,可以有效提高机器人的稳定性。这与FDA规则关于模型特征描述、模型建构等相关要求对应。
五、结论
通过对国家知识产权局《指引》的内容与欧盟《人工智能法》、美国FDA人工智能应用治理规则的对比分析,我们发现这些规则都在遵循相似的方法论要求。《指引》在审理专利申请的客体、创新性等方面,要求申请人能够对模型和算法的建模方法和实际效果做出符合科学研究和应用的方法说明,并强调应符合自然规律。这与境外对人工智能开发和应用过程的方法要求是一致的。
科学方法论的价值在于,通过系统化地认知研究和开发方法要求、遵循其规范路径,人们可以实现以下双重目标:
其一,有意识地使用方法论的分析,有助于形成对数据应用过程及其潜在伦理问题、歧视和风险的系统化认知。这一认知框架不仅对专利审查实践中技术方案的客体问题判定具有指导意义,也能够在专利创新性评估和技术效果验证维度发挥重要作用。同时,也为技术伦理审查提供具有可操作性的评估架构。
其二,科学方法的遵从情况对于确定充分公开的标准至关重要。根据不同数据特征构建算法模型,选择适配的量化函数并在说明书中完整记录流程步骤,能够确保技术细节的完整传递。按照《专利法》第二十六条第三款的法定标准,本领域技术人员基于说明书披露内容,能够实现该发明的技术方案,解决其技术问题,并且产生预期的技术效果。这种标准化披露机制应覆盖方法论所涉及的关键环节和问题。
基于上述认识,我们建议相关各方对人工智能开发和应用过程中所涉及的方法论问题高度关注。
(一)主动严格遵循科学方法开发和应用人工智能
在人工智能开发到专利申请的完整过程中,技术规划与研发团队应当严格遵循科学方法论体系,确保从数据处理、模型构建到训练验证的每个环节都遵守相应的规范要求。这包括采用科学规范的流程进行数据预处理和量化函数选择,设计合理的模型架构,基于可复制的实验方法完成模型训练,并进行严格的性能验证。在专利文件撰写方面,需要特别注重权利要求书和说明书的技术方案披露质量,充分阐明算法的创新性和技术贡献并辅以必要的实验数据,以满足专利审查过程中有关客体、新颖性、创造性和充分公开等要求。
(二)以科学方法论的框架展开数据治理和人工智能治理
在合规性管理方面,应当建立贯穿人工智能开发全流程建立科学管理框架。合规义务的履行应被拆解到建模的每一个步骤,包括对误差处理方法的科学性要求、对训练数据的匿名化处理等。为此,企业需要组建具备跨学科知识的专业合规团队,做好与战略规划、技术研发团队的有效配合。
既使中国尚未有法律层面的规范要求,在不同领域,中国行业主管部门和行业协会已经发布了不少有关人工智能治理的国家标准、地方标准和行业标准。企业应从规范管理、质量控制和前瞻性合规的目的出发,做好相应的流程管控。
(三)关注争议解决和举证责任问题
在涉及人工智能专利侵权、专利无效等纠纷处理过程中,随着对人工智能认识的深入,模型开发应用的基本方法是否适当有效、输入输出数据的处理是否科学等问题都会不断浮现,成为切入和解决争议的关键。不同量化方法的差异性、数据关联性的技术论证,训练数据集的选取标准、建模参数选择等技术要素及其合规性记录文件,都可能成为专利侵权或无效程序中的重要证据。
注释:
[1] 国家知识产权局:《人工智能相关发明专利申请指引(试行)》,2024年12月31日。https://www.cnipa.gov.cn/art/2024/12/31/art_66_196988.html
[2] 国家知识产权局:《专利审查指南修改草案(征求意见稿)》,2025年4月30日。https://www.cnipa.gov.cn/art/2025/4/30/art_75_199472.html
[3] 有关科学方法论在数据治理方面的讨论,详见王可,吴颖雯:《欧盟<人工智能法>合规路径思考——数据和数据治理规则》,载环球律师事务所公众号,2024年10月28日,https://mp.weixin.qq.com/s/3aw0faBRP9E5IWSXiSlaFw ,访问时间:2025年4月29日。
[4] 国家知识产权局:《人工智能相关发明专利申请指引(试行)》,第13-14页。
[5] 国家知识产权局:《人工智能相关发明专利申请指引(试行)》,第19-20页。
[6] 《欧盟人工智能法》第十条。法律文本可在链接下载,ELI: http://data.europa.eu/eli/reg/2024/1689/oj,第57-58页。
[7] 有关FDA治理规则的内容和讨论,可参见王可,顾益宇:《美国FDA拟定药品和生物制品生产研发的AI应用治理规则》,载环球律师事务所公众号,2025年2月4日,https://www.glo.com.cn/Content/2025/02-18/1501421402.html ,访问时间:2025年4月29日。
[8] https://www.federalregister.gov/documents/2025/01/07/2024-31542/considerations-for-the-use-of-artificial-intelligence-to-support-regulatory-decision-making-for-drug