【作 者】王海霞:通化师范学院政法学院
【摘 要】人工智能时代,算法新闻的出现给新闻作品版权保护带来了前所未有的挑战。一方面,现行著作权保护机制无法为算法新闻提供有效保护;另一方面,法院裁判算法新闻版权侵权案件缺乏具体的参照标准;此外,算法新闻版权保护与人工智能技术创新之间存在冲突。为了解决这些难题,首先,立法机关修改《著作权法》时应在新闻作品部分明确算法新闻的性质、署名、法律责任等问题;其次,还应当厘清影响法院裁判算法新闻版权侵权案件的相关因素及标准;最后,借助区块链技术实现算法新闻版权保护与人工智能创新之间的利益平衡。
【关键词】人工智能;算法新闻;版权保护;法律规制
当前我国人工智能已深入运用到数据安全、电子商务、智能投顾等领域,相关立法已对具体领域进行规制。但事实上,并不存在针对人工智能的一般化法律规制,对人工智能法律规制的研究需要与具体领域相结合。[1]其中,人工智能与新闻业的结合催生了算法新闻[2],而算法新闻的出现对信息分发、接收以及姻流动都产生了重雄响,很大程度上重塑了传统新闻传播格局。2019年4月,国家互联网信息办公室会同相关部门研究起草的《数据安全管理办法(征求意见稿)》,对算法新闻中算法的透明性和合法性提出了具体要求。虽然已有学者就人工智能创作物的著作权保护问题展开论述,但传统新闻作品在著作权保护方面具有自身的核性,而算法新闻的出现使得新闻作品版权保护的情况更加复杂,因此,专门针对算法新闻版权保护展开研究,是回应人工智能技术具体应用于新闻领域的迫切需求。
一、算法新闻的出现给新闻作品版权保护带来了巨大挑战
近年来,人工智能技术和大数据被广泛应用于各个领域,新闻媒体借助于算法进行的个性化内容推荐,在很大程度上缓解了海量新闻内容与个人对具体信息的需求之间的矛盾与冲突。随着算法推荐技术日臻成熟,新闻媒体不仅有效提高了内容生产和分发效率,还使得用户黏性持续增强,流量和广告大量涌入,媒体的商业价值不断走高。但算法新闻整体上还处于发展的初级阶段,它主要表现为静态描述性的新闻,譬如天气预报、财经、体育等方面的内容。从长远来看,要生产更高层级的、动态性的事件驱动新闻,比如由事件驱动叙述的“算法新闻2.0”[3],对算法本身提出了更高的要求。在人工智能时代,探讨算法新闻的版权保护机制至少需要解决以下问题。
1.算法新闻作品由谁署名的问题
关于算法新闻作品的署名问题,在现有的研究成果中,持不同意见的学者至少提出了五种解决方案:一是由开发算法的程序员或者开发算法的公司署名;二是由数据输入者或者数据提供者署名;三是由采用算法的新闻机构署名;四是由新闻记者和算法共同署名;五是由算法署名。[4]北京互联网法院则在裁判一起算法生成文章的版权纠纷中指出,无论是软件研发者还是使用者都不是创作者,不应该以作者的身份署名,从保障公众知情权角度,应当在文章中标明系软件自动生成。[5]每种方案都具有一定合理性,对算法新闻作品的版权保护也具有积极的意义。但署名问题是直接关乎算法新闻作品的版权保护、侵权责任承担以及作品被侵权之后如何救济的前提性问题,同时还与算法透明性以及个人数据权利保护密切相关,所以,立法机关迫切需要在权衡各方利益之后明确算法新闻的署名问题,结束当前模糊不清的状态,为算法新闻版权保护后续工作的展开奠定基础。
2.算法新闻作品侵权的法律责任问题
在讨论算法新闻作品侵权的责任承担问题之前,需要先了解算法新闻的生成机制。算法新闻生成的一般步骤是先由软件通过网络收集可用数据,比如棒球比赛的比分、击球率、历史记录以及球员统计数据等;接着,算法借助统计方法识别数据中重要有趣的事件,其中可能包括不寻常的事件,比如个别球员的非凡表现;然后,算法根据重要性标准对识别的见解按照优先级分类排序;算法随后根据事先设定的规则安排有新闻价值的元素以生成叙事性文本;最后,算法新闻可自动上传至新闻出版机构的内容管理系统,该系统可以自动刊发。[6]简言之,生成算法新闻遵循“收集数据一识别重要有趣事件一对识别的见解进行分类排序一安排有新闻价值的元素生成叙事文本一发布新闻”的基本流程。
传统上讨论算法新闻作品的侵权问题,主要集中在算法新闻生成的终端阶段,目前算法新闻仍停留在发布静态描述性新闻的初级阶段,但算法新闻生成的每个步骤都蕴含着未知的技术参数和侵权风险。有调研结果显示,透明性对算法新闻的读者来说具有最高价值,[7]但对于新闻出版机构和算法软件开发公司而言,算法透明与他们之间存在利益冲突。此外,算法新闻作品侵权结果的发生,比如侮辱、诽谤他人,究竟是源于算法本身的局限还是数据收集存在错误,抑或是算法对数据的理解存在偏差,还是编程水平较低,在司法实务中很难厘清,_旦发生法律纠纷,很难通过现行的版权纠纷解决机制进行处理。
3.算法新闻版权侵权案件的法律救济问题
传统新闻作品的版权保护历程举步维艰,算法新闻作品的版权保护面临的情况更加复杂。在算法新闻作品的版权侵权案件中,侵权行为的实施主体除了人类外,还包括其他算法新闻。面临这种复杂局面,必须充分考察人工智能技术和大数据对算法新闻作品版权保护产生的影响。考虑到我国现行著作权法所认定的版权主体是人类而不包括人工智能的现实情况,不能仅寄希望于司法机关能在具体案件中发挥创造性思维为算法新闻作品的版权保护提供可供借鉴的思路。事实上,法官大多数情况下可能会根据现行法律法规直接否定算法新闻的可版权性。但数量持续增长的算法新闻仍会成为被侵权的对象,如何为其提供相应的法律救济是亟待解决的现实难题。对此,本文将从法律规制角度探讨算法新闻的版权保护问题,立足于立法、司法和技术三个面向,全面探讨算法透明性的价值、算法新闻的署名、算法新闻侵权的法律责任承担以及被侵权时如何救济等问题,同时强化对人工智能数据与公民隐私权的保护。
二、算法新闻版权保护面临的主要问题分析
不同于其他领域的人工智能创作物,一方面,算法新闻受到传统新闻理念和新闻实践的影响,对新闻的“客观性”和“公共性”提出较高的要求,[8]同时,算法新闻是否具有”客观性”,还要受到算法软件所收集的数据是否全面、重要性识别标准是否科学以及事先设定的规则是否合理等因素的影响,而算法基于商业利益和个人偏好所生成的新闻在很大程度上与新闻的“公共性”目标相冲突;另一方面,在人工智能时代,对算法新闻的客观性和公共性方面的要求,又引出了对算法新闻中算法透明性的要求,而透明性原则又与算法软件开发公司的技术创新存在利益冲突。具体分析当前算法新闻版权保护面临的问题,可以发现:
1.现行著作权保护机制无法为算法新闻提供有效保护
从我国现行立法来看,目前满足独创性要件的算法新闻在法律性质上难以被认定为作品。在司法实务中,法院对人工智能创作物性质的认定也趋于保守,明显倾向于保护算法软件的开发者和使用者的信息网络传播权而非算法新闻的版权。2019年4月25日,北京互联网法院对我国第一起涉及算法生成文章侵犯他人作品著作权的案件进行了裁决。该案的判决书确认了本案中算法生成的分析报告符合文字作品的独创性要件,指出“从分析报告生成过程看,选定相应关键词,使用‘可视化’功能自动生成的分析报告,其内容涉及对电影娱乐行业的司法分析,符合文字作品的形式要求,涉及的内容体现出针对相关数据的选择、判断、分析,具有一定的独创性”,但并不认为该分析报告构成作品,理由是“具备独创性并非构成文字作品的充分条件,根据现行法律规定,文字作品应由自然人创作完成”,但同时指出,“分析报告的产生既凝结了软件研发者(所有者)的投入,也凝结了软件使用者的投入,具备传播价值”,[9]应当对其合法权益进行保护。按照本案的逻辑,算法新闻即使满足独创性要件,根据我国现行法律的规定也不能构成作品,因为其创作者并非人类。这就意味着,无论是算法新闻作品侵权或者被侵权,都无法通过著作权保护机制寻求救济,只能依据《信息网络传播权保护条例》获得一定救济。
在前述案件中,法院还对算法生成报告的署名问题进行了分析,认为虽然在软件开发阶段和软件使用阶段都有自然人参与其中,但软件开发者显然与该分析报告无关,软件使用者也只是在操作界面提交关键词进行搜索,其搜索结果很难被认定为使用者思想、感情的独创性表达,该分析报告不应由使用者署名,应当在分析报告中标明其由软件自动生成。对于用户使用搜索引擎检索关键词所得出的结论,美国则有法院在司法裁判中将其认定为特定网站或者搜索引擎对于用户有关的某一特定检索指令的“观点”,从而援引美国宪法第一修正案进行裁判。我国目前尚无这方面的研究,但从人工智能技术在算法新闻行业的发展趋势来看,突破现行著作权保护机制的桎梏,完善算法新闻版权保护机制,是我国人工智能行业发展和新闻产业不断进步的必然选择。
2.法院裁判算法新闻版权侵权案件缺乏具体的参照标准
根据《数据安全管理办法(征求意见稿)》第24条的规定,网络运营者利用大数据、人工智能等技术自动合成新闻应以明显方式标明“合成”字样;此外,不得以谋取利益或损害他人利益为目的自动合成信息。该办法实施之后,将会成为我国司法机关裁决算法新闻版权侵权案件中要求“算法透明”的法律依据。但法院裁判算法新闻版权侵权案件仍然缺乏具体的参照标准和衡量因素。美国是采取分散式立法规制人工智能具体应用领域纠纷的典型代表,自2003年以来,美国联邦法院和州法院在不同判例中分别对算法在搜索引擎、智慧司法等领域应用所产生的纠纷进行了裁决,或将算法认定为言论,抑或是将算法认定为商业秘密。简言之,针对人工智能在不同领域的具体应用,美国法院在进行司法裁判时会尽量全面考察个案面临的情况,但宪法修正案、正当程序等内容贯穿于司法裁判始终,是法官行使自由裁量权作出最终裁判的重要参照。
我国也是以分散式立法方式规制人工智能具体应用领域纠纷的国家,但司法实践仍处于初级探索阶段,考察目前的司法实践状况,可以发现,法院主要从作品的构成要件和公众知情权的保障角度进行考察。事实上,给予符合独创性标准的新闻作品以完整且无漏洞的版权保护符合著作权保护的题中之义,而算法新闻作品是新闻作品在人工智能时代借助算法技术实现的新形式和新表达,表面上看起来是算法得出的结论,但从数据的收集、算法模式的构建以及数据使用规则等方面都凝聚着人类的智慧,不能单从作品不是直接由人类生产就否定算法新闻的可版权性。实践中,法院应当全面分析每个具体个案,依据著作权法的基本原则和精神,在保障公众知情权、维护社会诚实信用以及有利于文化传播的目标指引下,明确透明性原则的适用规则,遵守正当法律程序,公正地作出裁判。
3.算法新闻版权保护与人工智能技术创新之间存在冲突
人工智能已经成为国际竞争的新焦点,我国从国家战略层面对人工智能进行系统布局、统筹谋划,牢牢把握战略主动以实现有效保障国家安全的目的。但人工智能领域的知识产权保护与人工智能技术创新之间存在冲突,一方面,知识产权法律制度保护的是符合法律规定条件的著作者、发明者或者成果拥有者在一定期限内的独占性权利,但人工智能技术的不断创新很大程度上建立在人们能共享现有人工智能研发成果的基础上;另一方面,人工智能企业公布算法模型,则会暴露其商业秘密,长远来看,会削弱企业进行人工智能技术创新的积极性。
从人工智能应用的细分领域来看,当算法新闻涉及版权侵权案件时,法院能在何种程度和范围内要求算法软件开发公司公布其使用的数据和算法模型,除了要考虑算法透明性原则外,还必须妥善处理算法新闻作品版权保护与人工智能技术创新之间的冲突。
三、算法新闻版权保护的具体路径和方式探析
人工智能时代,只有从立法、司法及技术三个维度入手,通过完善事前、事中的法律保障制度和事后的法律救济制度,并从新闻作品的特殊性出发,在技术层面明确对算法透明原则的相关要求和操作指南,才能真正实现算法新闻版权保护的目标。具体来说,可以从以下方面探索算法新闻版权保护的具体路径和方式。
1.立法机关在修改《著作权法》时应在新闻作品部分明确算法新闻的性质、署名、法律责任等问题
国际上关于著作权保护的先进立法经验表明,著作权法应当能敏锐应对本国经济发展需求、技术进步需求以及产业发展潮流,[10]而我国现行《著作权法》中对新闻作品的规定无法适应人工智能时代算法新闻版权保护的迫切需要,不利于人工智能技术创新及人工智能产业的长远发展。2014年6月6日,国务院法制办向社会发布公开征求意见的《中华人民共和国著作权法(修订草案送审稿)》,也未提及有关人工智能方面的内容,究其原因,可能是囿于当时人工智能发展水平的限制,所以,人工智能创作物的版权保护问题还未进入立法层面。如今,随着互联网络技术、大数据和人工智能的迅速发展,人工智能创作物的版权问题已经成为立法机关亟须解决的问题,而新闻作品相较于其他类型作品的特殊性,又使得算法新闻区别于其他类型的人工智能创作物。具体来说,立法机关可以从以下方面入手。
首先,必须认识到新闻作品的客观性与可版权性、新闻作品著作权保护与信息获取来源之间的张力关系,使得著作权法对新闻作品的保护在内容生产者与受众之间出现了利益失衡,对公众知情权的过度保护损害了媒体产业的利益。[11]归根结底,一方面,是由于长期以来我国立法机关未能对“时事新闻”与“新闻作品”进行明确解释与区分,立法模糊带来法律保护的犹疑,致使满足作品构成要件的新闻一直未能成为版权保护的重要对象;另一方面,虽然著作权法贯穿着利益平衡的原则和精神,但相较于其他类型的作品,公众对新闻作品的知情权要求更高,新闻作品的生产者需要让渡更多利益,但公共利益与企业的私人利益之间仍应保持利益平衡才符合国家发展媒体产业的目标。因此,我国《著作权法》修改时,应当对新闻作品作出单独规定,使其与其他类型的作品相区别。
其次,《著作权法》修改时应当在新闻作品部分对算法新闻作出明确规定,对当前争论不休的算法新闻的性质、署名、法律责任承担等问题进行界定,为司法实践中法院妥善处理算法新闻版权侵权纠纷提供明确的法律依据。至少应当包含以下几个方面:一是应当明确符合作品构成要件的算法新闻在法律性质上应当成为著作权法保护的对象。二是对于算法单独生成的新闻应当由新闻出版机构署名,并注明算法生成字样;对于人类与算法共同生成的新闻,则应当由人类和新闻出版机构共同署名,并注明部分由算法生成字样。三是在算法新闻版权侵权案件中,对作品署名的人或者机构是法律责任的承担主体。侵权的认定应参照新闻作品侵权责任认定标准,由法院在实践中厘清影响算法新闻版权侵权案件裁判的具体因素和相关标准,最高人民法院可以以指导性案例的形式为全国各级法院审理此类案件提供指引。
2.应当厘清影响法院裁判算法新闻版权侵权案件的相关因素及标准
2016年,在State V.Loomis一案中,美国威斯康星州惩教部门的一个官员在为判刑做准备时制作了一份借助COMPAS软件[12]进行风险评估的PSI[13]报告,卢米斯认为,初审法院对该报告的依赖违反了正当程序原则,并提出性别作为算法参数构成歧视。布拉德利大法官认为,将性别作为风险评估中的一个因素有助于达到提高准确性的非歧视性目的,而卢米斯没有提供足够的证据证明量刑法院实际上考虑了性别因素。此外,由于COMPAS只使用可公开获得的数据和被告提供的数据,法院的结论是,卢米斯可以否认或解释构成报告的任何信息,因此可以核实在判决中使用的信息的准确性。关于个别化,布拉德利大法官强调了个别化量刑的重要性,并承认COMPAS只提供与罪犯相似群体的累犯风险的汇总数据,该报告不是法院决定的唯一依据,量刑仍是充分个别化的,因为法院在适当时候有不同意评估信息的自由裁量权。[14]该判例对人工智能具体应用中如何认定算法构成歧视,在遵守正当程序、考察数据来源等方面提供了重要借鉴。
实践中,法院裁判算法新闻版权侵权案件,首先,要妥善处理算法透明性原则的适用问题,笔者以为,只要算法软件开发公司能证明其生成算法新闻是基于公开获得的合法数据,法院就不应当要求算法软件开发公司公开其算法模型,除非原告有相反证据能证明算法软件开发公司的算法模型存在歧视或者信息来源的公开性和合法性存疑。其次,法院应当遵守正当法律程序,在裁判过程中不应当考虑不相关的因素,对于算法透明的要求要具体明确,不能模糊地要求算法软件开发公司对外公开算法模型,版权保护不应当以牺牲人工智能技术创新动力为代价。最后,涉及技术方面的问题应当交由专业人员进行处理,其中,与独立的第三方机构进行合作不失为法院的一种折中选择。至于借助智慧法院系统处理算法新闻版权侵权案件是否更客观公正,还有待实践进一步检验。
3.借助区块链实现算法新闻版权保护与人工智能创新之间的利益平衡
习近平在中央政治局第十八次集体学习时强调“把区块链作为核心技术自主创新重要突破口,加快推动区块链技术和产业创新发展”,同时指出,“要构建区块链产业生态,加快区块链和人工智能、大数据、物联网等前沿信息技术的深度融合,推动集成创新和融合应用”。区块链技术具有中心化、开放性、自治性、信息不可篡改以及匿名性等特征,这对于处理人工智能技术应用于新闻行业时可能出现的算法技术问题具有重要意义。
2019年10月24日,人民在线、微众银行在其主办的”区块链版权保护场景应用与探索”研讨会上,针对当前版权行业面临的“确权难、用权难、维权难”等问题,人民在线开发的“人民版权”产品期望借助区块链技术与版权保护机制的结合,旨在构建新闻版权联盟链,通过建立版权监测闭环,生成版权存证追踪链路,实现线上交易的全流程化和司法综合服务的梯度化,打造一站式版权保护管理平台。2019年11月200,我国首个开放式媒体区块链版权保护平台正式上线。该平台为所有提交发布的原创新闻和文学作品进行数字化版权登记,生成唯一的区域链特征码。作者可在该平台上进行作品的原创确权、权属存证、分发等操作,所有操作行为都会被记录,平台还通过大数据监测技术实时追踪该作品的网络转载情况,从而及时发现侵权行为。简言之,在算法新闻版权保护领域深度运用区块链技术,能从很大程度上缓解因算法黑箱所引起的公众知情权保护问题,客观上能够为人工智能技术创新提供更自由的空间。区块链版权保护平台对算法新闻生成过程中可能存在的侵权风险能够留存充足的证据,大数据监测技术也能迅速发现算法新闻的版权侵权行为,及时加以处理,能够防止侵权行为危害后果的进一步扩大。
总的来说,算法新闻是人工智能技术在新闻领域应用的结果和表现,随着人工智能技术水平的不断提升,算法新闻将从静态描述性新闻向事件驱动型新闻持续发展。为了实现算法新闻版权保护的目标,本文从立法、司法和技术方面进行了积极探索,同时还应当加强对人工智能行业的监管,促进行业自律,加大对滥用数据、侵犯个人隐私以及违反新闻伦理行为的惩戒力度。理论上法律问题由法院裁决,技术的问题则应借助技术手段解决,而在算法新闻版权保护机制中,法律问题与技术问题杂糅在一起,单纯借助法律规制抑或是技术手段都无法全面有效地解决问题,只有将二者结合起来,在法律规制过程中,深度应用区块链技术,才能实现完整且无漏洞救济之目标。
参考文献:
[1]汪庆华.人工智能的法律规制路径:一个框架性讨论[J].现代法学,2019(2):55-64.
[2]本文将不对算法和人工智能进行区分,两者在算法新闻版权保护中可以按照同一概念进行处理。
[3]SeeCaswell D,Konstantin Dorr.Automated Journalism 2.0:Event-driven narratives[J].Journalism Practice,2017(15):477-496.笔者在阅读文献时发现,关于算法新闻,国外有"robot journalism""algorithmic journalism"^automated journalismn""machine-written news"等各种表述,但本质上相同,本文统一采用“算法新闻”的称呼。
[4]蒋忠波,师雪梅.国外算法新闻研究的进展与思考[J].新闻界,2019(6):87-98.
[5]参见北京互联网法院(2018)京0491民初239号判决书。
[6]Andreas Graefe.Guide to automated journalism.How Automated Journalism Works[EB/OL].Retrieved from https://towcenter.gitbooks.io/guide-to-automated-joumalism/content/status_quo_of/how_automated_joumalisni.htinl,2016.
[7]Montal T,Reich Z.I,Robot.You,Journalist.Who is the Author?:Authorship,bylines and full disclosure in automated joumalism[J].Digital Journalism Volume5,2017(7):829-849.
[8]潘忠党,陆晔.走向公共:新闻专业主义再出发[J].国际新闻界,2017(10):91-124.
[9]参见北京互联网法院(2018)京0491民初239号判决书。
[10]曹新明.论《中华人民共和国著作权法》第五条第二项之修改[J1.法商研究,2012(4):17-20.
[11]向光富.论我国新闻作品著作权法调整的认识误区与改进口河南财经政法大学学报,2016(2):142-149.
[12]COMPA Sstands for"Correctional Offender Management Profiling for Alternative Sanctions.”本案中,COMPAS软件基于对罪犯的采访和罪犯犯罪史的信息分析,对累犯风险进行评估。
[13]PSI stands for“The Presentence Investigation and Report”.
[14]Criminal Law-Sentencing Guidelines-Wisconsin Supreme Court Requires Warning before Use of AIorithmic Risk Assessments in Sentencing-State v.Loomis,881 N.W.2d 749(Wis.2016)[J].Harvard Law Review,Mar'17,Vol.130,2017(5).