律政思|生成式人工智能時代下,香港需要怎樣的《版權條例》?
來稿作者:鄧凱
圍繞人工智能與法律及其業界關係的探索展開,2024年無疑是香港科技法律和法律科技的「大年」。1月,香港律師會代表法律實務界別率先表態,以發佈立場文件的形式申明應對技術變革的行動綱領。7月初,特區政府推動公眾諮詢,就《版權條例》如何保障人工智能技術發展研究立法修訂。同月底,司法機構政務處公佈司法人員使用生成式人工智能的一般規則和基本原則,司法界採取何等價值立場與技術趨勢進行妥當相處就此明確。立法、司法以及法律服務界「三箭齊發」,共同構築起香港「科技—法律」關係持續演化的制度框架,故而值得嚴謹剖析。本系列文分上下兩個篇章,上文著重人工智能立法及其背後的法理探討,特別是在香港《版權條例》修訂的知識產權語境之中如何演繹;下文則聚焦法律人工智能,旨在通過解構法律人工智能的核心原理,正本清源地剖析法律業的應用實踐與未來機遇。
和眾多領域一樣,法律業無疑是受眼下大模型技術浪潮衝擊較大的社會子系統。一方面,人工智能已然在法律實踐領域中展現巨大的應用潛力,並試圖重塑行業內的工作方式。另一方面,實定法制度、數字法法理也需要對技術的客觀演化做出有效回應。而在法律體系內部,被譽為「技術之子」的版權法則是最敏感的法律學科,不論是涉及司法訴訟抑或是相關立法檢討,生成式人工智能的版權保護、侵權認定、風險防範等重點關切的厘清,都取決於知識產權法治如何破題。
本人與合作者曾在〈香港如何應對生成式人工智能的版權法挑戰〉(《大公報》法政新思欄目2023年6月8日刊載)一文中指出,生成式人工智能會誘發傳統版權制度消亡。這絕非危言聳聽,二者間的拉扯和張力首先表現在內容創造在版權領域內的底層邏輯遭遇重塑,人工智能在思想的具體表達層面正逐步趕超人類對創作行為的一貫壟斷。該現象的側面則是,鑒於人工智能慧生成內容的效率遠超人類,這使得傳統版權法對於自然人主體的堅守,以及「只保護自然人創作」的制度基石產生動搖。進一步推演,版權法「授權—許可」模式的可適用性,連同「接觸+實質性相似」的侵權規則在很大程度上也會被大模型訓練的技術模式所架空,等等。
相信上述版權法新現象是香港此次檢討《版權條例》修訂的初衷。儘管該條例於2022年新修完畢並在次年5月生效實施,並側重在數字化環境中加強版權保護,但彼時之修訂並沒有預見此番生成式人工智能技術浪潮的「驟然」來臨,故而未能及時納入立法者應對當前挑戰的價值判斷。在社會新矚目下,立法會就完善《版權條例》推動新一輪公眾諮詢應當視為又一次與時俱進的制度因應和法律補強,具有極強的現實性和必要性,本文即源於此展開。
一、版權是否存在於人工智能創作的作品?
從文本上看,關於「版權與人工智能」公眾諮詢文件的整體敘事邏輯,主要圍繞「人工智能生成作品的可版權性」、「侵權責任」以及「特定豁免的擬制」這三個方面展開。首先是關於人工智能生成作品是否應獲得版權法保護,這在法理上似乎是一個應然性的思辨論題,依託不同理論支撐的各國法律實踐對此存有分歧。多數國家原則上不為人工智能生成物提供法律承認,它們受康德式的「主客體統一認識論」和「人是目的」哲學觀點的支配,恪守「工具論」,也即人工智能通常被視為人類實現特定目的的工具或稱作用對象,只適格擔任版權法法律關係中的客體,其生成物自然無法享受版權法保護。秉持這一嚴格取態的典型司法管轄區包括澳洲、加拿大、中國內地、歐盟、新加坡以及美國(諮詢文件也做了列舉),例如美國版權局在被譽為「生成式人工智能元年」的2023年就數次撤銷或駁回了使用Midjourney生成畫作的版權申請。「工具論」的正當性毋庸置疑,其作為經典的科技法治理念,在維護知識產權體系的穩定性以及捍衛人類中心主義的作者權等價值面向上能形成顯著的正向激勵。
另一種作品可版權類型則不拘泥於僅對自然人作者加以保護,以英國、新西蘭、香港等司法管轄區為代表。這些法域對作品的認定採用了以獨創性結果為核心的「結果主義」範式,只要特定作品能滿足原創性並以表現為某種形式的智力成果就可獲得承認,而不必糾結作品是否必須由人類創作。例如,「由電腦生成的作品」早在英國《1988年版權設計和專利法》(CDPA)中就被正式納入權利範疇,並設置有50年的保護期限。根據相關立法資料披露,香港的立法者於1993年進行版權法律改革時,亦同意上述英國取向並跟隨其做法,創立了自己的電腦生成作品條款且延續至今。
也因此,現時香港版權法可以相容人工智能創造物的法律確認。三十年前的版權法改革「正中今日技術之下懷」,意外成就了一番符合眼下發展利益的法制巧合:按照諮詢文件所述,「現行《版權條例》事實上已包含適用於為人工智能生成作品提供版權保護的所需條文”」。當人們還在思量人工智能生成物可版權性的「應然性」問題時,香港現行法制已供給了「實然性」保障,其不僅在法律形式外觀上甚為超前,更有助於帶來制度激勵和競爭優勢。至少英國當年在CDPA中承認人工智能(電腦)的作者主體地位,根源在於希冀借這一法律創新或稱權利擬制促成激勵,使本國在全球資訊技術競爭秩序中扮演更重要的角色。香港的動機也異曲同工,有英國CDPA的影子,諮詢文件對此坦言到:「早於1997年前訂立的電腦產生作品條文中採用的概括性表述——『電腦產生』,足以靈活應對日新月異的科技發展……(也)足以涵蓋在沒有人類作者,但可以確定作出所需安排的人的身份的情況下由電腦產生的作品……(此舉)旨在回饋為創造電腦產生文藝作品致力作出所需安排的人,並向他們提供經濟誘因,以及與本港版權制度鼓勵創意和其他投資的整體目標一致。」
二、如何推演版權侵權風險與責任分配?
除卻人工智能生成物的可版權性論爭外,大模型或觸發的版權法律爭端則主要集中在生成式人工智能的訓練和應用兩個階段,各國對此均有典型侵權訴訟案件發生,受到各界高度關注。關於前者即大模型在訓練階段易於引發侵權糾紛,其根源在於生成式人工智能的形成和優化依賴於大量的數據訓練,而用於訓練的數據往往包含受版權法保護的諸多內容。例如在全球首例「Stable Diffusion」演算法模型版權侵權案中,原告就把標的模型定義為「一個複雜的拼貼工具」:「(它)將無數受版權保護的圖像存儲和合併為訓練圖像後……生成完全基於訓練圖像的『新』圖像……(而被告)從使用受版權保護的圖像中獲得商業利益和豐厚利潤。」
總體來看,大模型訓練的核心技術原理是將資料庫中的作品數據進行某種形式的轉換後輸入模型,利用模型自主學習能力從中提取有價值的內容,再根據輸入的指令生成與之相匹配的學習結果加以輸出。在此訓練過程中,大模型對版權作品的主要利用行為涉及「複製」與「改編」,法律爭議與侵權風險即源於此。
進入到內容輸出階段,或稱人工智能生成應用階段,當中的侵權風險則更多地附著在大模型用戶對生成內容的後續傳播利用上。一方面,有觀點認為生成式人工智能輸出的內容會侵犯版權是極小概率的事件,這是大模型的技術機制所決定的。具言之,大模型每一次輸出的內容都是根據模型權重、提示詞和隨機種子的組合重新生成的,多重因變數作用下的生成結果勢必存在較大差異,特別是隨著演算法不斷調優與訓練數據集的倍數增加,單個版權作品的價值將不斷被「稀釋」,生成結果的侵權概率微乎其微。 版權作品價值被「沖淡」的另外一面是「接觸」行為作為「實質性相似」前提的侵權測試逐步失靈。囿於生成式人工智能的非外顯機制,版權人實際無法或極難發現模型內部的作品利用行為——類似於鏈條被切斷導致因果關係難以判定——從而致使侵權舉證不能。以上誘因不僅造成了大模型廠商(研發者)與使用者之間出現權責分界,也使內容生成及應用階段的侵權風險被動地向傳播環節的下游轉移,更多地落入資訊傳播權的規制範疇,如由深度合成(偽造)招致的各類法律責任並為傳統的內容監管覆蓋。
不難發現,生成式人工智能的版權侵權責任結構異常複雜,其中既有階段之分,又有風險主體之別,各法域對此並無法律改革或規則創制的基本共識,更遑論對各自現行版權法律作出調整。這一現實背景下,諮詢文件務實地訴諸於各平等主體間基於意思自治的合約安排,提出以市場手段解決人工智能生成作品所引發的歸責與風險分配問題,而非貿然創設剛性法律規定。本港立法者充分恪守「有所不為」或稱「刻意無為」的大智慧,其背後蘊含了精妙而深刻的普通法法理:「……人工智能慧生成作品的侵權相關法律責任問題取決於就每個個案進行必要的調查後所得的事實和支持證據……如一刀切硬性規定法律責任特定由某人(例如人工智能系統的擁有人及/或最終使用者)承擔,將無法顧及每宗侵權個案獨有的實際情況,從而犧牲不同情況下的公平性。」諮詢文件進一步強調,需維持現行《版權條例》中相關條文的概括性、廣泛性和科技中立性,以確保既有法制始終具有持續演化、應對挑戰的空間。 如此取態無疑是各類市場創新主體和相關持份者的最大定心丸。
三、為合理使用作為版權豁免而辯護
諮詢文件的包容性與創新性還體現在通過設置特定的豁免機制對現有版權法系統進行補足。諮詢文件總體上允許大模型在開發、應用時可以寬泛合理地使用版權作品,為的是拓展人工智能產業發展,維持香港競爭力。事實上,大模型構成「合理使用」免責的主張在全球範圍內頗有市場,包括歐盟、日本、新加坡以及英國都已引入版權豁免規則,傾向於認可生成式人工智能享有合理使用版權作品的正當性,文本及數據利用的豁免不同程度地適用在商業和(或)非商業用途。美國更是鼓勵作品二次利用的代表性國家,在合理使用的認定標準上一貫較其他法域更為靈活開放,至少結合過往司法實踐來看,假若美國法院不鮮明地支持版權制度裏的合理使用,包括生成式人工智能在內的一系列數字經濟創新就不可能在該國率先發生。
傳統授權許可機制的固有缺陷也是證立合理使用版權豁免的關鍵理據。這是因為,生成式人工智能的技術提升必須以海量的數據供給為前提,面對紛繁複雜的版權形態、權利歸屬,如若在獲取與利用版權作品過程中仍因循守舊地奉協商授權為基本原則,以付費許可為事前要件,非但違背了大模型內容生產模式本身之規律,更會降低模型訓練/投產速度,犧牲技術演進所需的效率價值。當中徒增合規成本,也將誘發抑制創新的「寒蟬效應」。因而,合理使用之版權豁免應當視為對授權模式適用乏力的制度性「代償」,其「先斬後奏」的特質在某種程度上為促進人工智能生產力效益所必須。誠然,為平衡這一豁免的恣意性,搭建行之有效的作品退出管道(opt-out)並為版權人設定權利保留的法律安排也要納入立法議程,尤其要凸顯對版權人知情權、選擇權等樸素法益的支持與維護。
在技術手段上,在版權合理使用與權利保護之間取得恰當平衡這一治理目標似乎有機會通過開展人工智能生成內容標識工作(AI標識)的方式實現。大模型廠商從提升透明度與權利保障強度等角度出發,正在探索AI標識路徑,特別是就版權作品的使用,採用顯式或隱式的標注示明其內容性質來源,在便利權利人主張權益的同時,更能激勵社會大眾利用新科技工具進行內容創作。 在該意義上,AI標識或許還隱喻出自然人類創造與人工智能生成的邊界在不斷模糊與反復厘清之間盡力做出技術表達,並給予立法者以啟迪:大模型治理應以體現激勵相容與價值共益作為基本共識,一個理想又浪漫的法律秩序必然是包括原始版權所有人、人工智能廠商以及AI增強型創作者等攸關方都能贏取合規激勵,使人工智能內容創作盡可能地從由道德迷思與倫理詰問帶來的哲學式「糾纏」中脫困出來。
四、代結論:創造「多勞多得」的法律激勵
不可否認,關於人工智能的一系列制度性思辨都掣肘在其主體性上。僅就版權規則創制而言,儘管香港《版權條例》以一種似是而非的「模糊立法」範式變相地賦予了生成式人工智能以適格創作者的主體身份(至少在法律外觀採取了「擬制作者」的進路),但實踐效果成疑,有待在真實發生的司法裁斷中做出進一步適用與澄清。以上文提及的英國CDPA為例,該法的「電腦生成作品」條款看似首屈一指,實則早已休眠沉寂,僅在2006年於英國衡平法院有過一次飽受爭議的裁決。究其原因,有分析指出了該制度存在的消極性與被動性:為防止作品被認定為「電腦生成作品」,在版權法上遭受權利範圍受限和保護期限「歧視」,創作者不得不選擇隱瞞相關事實。這種負面激勵在生成式人工智能的香港版權語境中亦有機會發生,值得關注深省。
生成式人工智能的法律實踐方興未艾,也伴隨其理論底座正悄然變遷。相較於文章開頭處論及的人工智能「工具論」與版權保護的「結果主義」,「貢獻論」在業界的認受度則愈來愈強,這顯然根植於生成式人工智能生產內容的人機交互與來回問答的產品技術模式。當生成式人工智能從單純的輔助工具轉變為與人類思維伴生的緊密合作夥伴,但又遠不足以擔任具有自主意志的創造替代者之時,形式主義的工具論和績優主義的結果論這二者的解釋力就難以為繼。「貢獻論」中的「貢獻」內涵指代的是人類具有獨創性的過程控制。例如,《歐盟人工智能白皮書(2020》要求人工智能版權作品需體現人類意志的控制作用;再如內地《人工智能慧法(學者建議稿)》也在激勵人類的智力付出與勞動成本出,強調作品性應「根據使用者對內容最終呈現的貢獻程度」進行判明。
立法之外,各國法院也在向版權新領域探究,並試圖在諸多懸而未決的問題中為人類貢獻作答,為人之稟賦呐喊,這何嘗不是來自司法界的實證主義法律激勵。正如在標誌性的美國Thaler v. Perlmutter案中,裁決者就陳述了人工輸入比重對人工智能可版權的決定性價值;以及在中國內地的「文生圖」首案裏,主審法官毫不掩飾人類個性化表達的關鍵性,「AI使用者在提示詞部分進行的回饋式修正,其體現了原告的審美選擇和個性判斷」。令人驚喜地是,香港法院守衛「多勞多得」人類價值的思考則早已暗含在2007年Tai Shing Diary Ltd v. Maersk Hong Kong Ltd案的「汗水原則」(sweat and brow)敘事中:「只要(人類)作者在創作過程中或多或少投入了精力,又或運用過相關技巧及判斷即可;除非付出勞力過少被視為純機械式活動。受版權保護的不只是展示作品所運用的技巧和付出的努力,還包括在收集、篩選、編排及以易於理解的方式呈現現有資料所投入的技巧和精力。」由此帶來的法律激勵恰巧契合於當下現實,即人類在向機器提示指令(prompts)時的創作與智力勞動也有機會被推定為原創,相應獲得可確權的法律空間。引申而來的「殘忍事實」或在於,包括法律在內的各色職業,在生成式人工智能時代都將面臨其能否進化為「提示詞工程師」(法律知識工程師)之合格角色的靈魂拷問。這既是本文的初步收尾,又是下編嚴謹論及法律職業與法律科技之間關係的發端。
作者鄧凱是香港城市大學法律學院公法與人權論壇研究員、法學博士。文章僅代表作者個人觀點,不代表香港01立場。
「01論壇」歡迎投稿,來函請電郵至01view@hk01.com。來稿請附上作者真實姓名及聯絡方法。若不適用,恕不通知。