【新媒體.二】強大又無力的演算法:「人」的主體價值須被確立
都說演算法是隻溫柔的巨獸,因為它在潛移默化中決定了用戶的「所見所聞」,改變着人們對信息的接收及對產品的需求,也為媒體轉型帶來轉機。不過,《香港01》首席技術總監王龍瀟認為,「演算法一點也不溫柔,它是『惡毒巨獸』才對!」在《香港01》的數碼化戰略中,根據數據、運用算法為讀者推送、展示適切內容是重要的一環。然而,被算法操控,與有質素、有溫度的內容,似乎總是相悖。作為媒體,應如何處理這樣的矛盾?又該如何對讀者負責,對內容生產者負責?
此為新媒體轉型系列報道三之二
承接上文:【新媒體.一】尋找擺脫科網霸權之路 數碼時代下的媒體轉型
王龍瀟表示,傳媒非要「反制」霸權,而是先要擺脫「受制」,亦需「相互利用」達至互利:「Facebook、Google這樣的大平台,用了很多時間發展出海量的人流及訪問量,在不同的市場會有不同的策略。當他們的市場策略有紅利,為什麼不去利用?」
2019年,直播是Facebook主推的功能形式之一,《立場新聞》等網媒也藉着直播的「東風」做出不俗的成績。對此,王龍瀟指出,這便是「有紅利」的時刻,香港01亦在「直播潮」生產出許多此形式的內容。在可控範圍內利用平台的勢頭,是需要、值得去做的。但他也表示,不應將所有雞蛋放在同一個籃子裏,更不可將自己的「脖子」放在別人手中——也就是說,不能將「命脈」交於他人,既要會「乘東風」,又要穩固自己。
與霸權抗衡,並非將其視為「敵人」。他直言,香港01亦有與Facebook、Google、Apple等公司合作的意願,比如他們想在亞洲推動一些計劃時,就需要本地互聯網公司協助。對這些公司而言,這樣可令計劃的落實變得容易些,而對香港01來說,也能夠「乘勢而上」。「但我們要先抓住自己的內核—會員和數據。快餐很容易吃,但我們不能只吃快餐。」他表示。但問題是,如何抓住自己的內核?這就需要有數據分析能力。
「玩轉」數據之餘小心「反噬」
創刊時期,為幫同事完成從傳統媒體到互聯網媒體思維模式的過度,《香港01》互聯網經營高級總監覃純健會構建一個「報攤場景」供大家想像:當一個人站在報攤前,會用一兩分鐘去篩選報紙雜誌,不同的封面與頭條就是一面訊息牆,可將其視為線下的「Facebook feed wall」,只不過「購買」的行為變成了「點擊」。報攤的佈置亦有玄機,新聞類報刊通常會被擺在最前面,娛樂類在旁邊,生活與體育類則比較靠後。他笑言:「當時哪有什麼大數據,只是憑經驗、銷量去佈局報攤。但可以看出,香港讀者資訊消費的主力內容是新聞與娛樂,其次就是副刊,直到現在也是如此。」
也就是說,「數據分析」其實一直都在。可以說,覃純健帶領團隊反覆試驗,透過數據反饋作出調整,是報攤透過銷量來佈局的更科學、更細緻延伸。
然而, 數據、算法亦會帶來負面效應。正如王龍瀟所言,算法是惡毒的。人類「玩轉」數據的同時,亦有可能被算法「反噬」。覃純健對此表示認同:「當然,過度追求流量的點擊最後有可能會『走火入魔』。標題黨、content farm(內容農場)等氾濫時,無論對媒體本身還是對讀者而言,都會很危險。」
那麼,這是否意味着作為嚴肅內容的新聞才應是媒體內容生產的全部?覃純健表示並非如此,連報攤都會將娛樂與新聞擺在差不多的位置,足以說明娛樂內容亦是香港讀者十分買賬的。他指出,當下資訊消費的主力仍是新聞與娛樂,但並不意味着生活類的部份不重要。因為吃喝玩樂、旅遊、親子、旅遊、美容等版塊或許單個來計遠不足以與新聞、娛樂抗衡,但將這些內容合起來,數據就很可觀了。
況且,流量數據的反饋顯示,嚴肅內容帶來的流量遠不及輕鬆內容。「假設我們的整體流量為5,000萬,當中嚴肅內容帶來了1,000萬便已是『大勝』。但值得注意的是,這1,000萬的流量是輕鬆內容無法頂替的。兩者無法替代,相輔相成。」也就是說,讀者需要的是綜合性內容。當讀者基數變多,流量變大,大家自然會在當中尋找自己想看的內容。
然而, 綜合性內容的增加,不免會帶來content farm的爭議。王龍瀟表示,自己從不避諱談這個話題,但他認為,作為媒體,除了有大眾消費的內容外,還應有「頭部內容」,這是包含一定價值觀的,代表了公司的態度。「所以不能定義《香港01》就是content farm。因為content farm並無立場,亦無明確的價值觀。」他笑着反駁道。
在覃純健看來,具誤導、錯誤成份的內容才是嚴格定義上的content farm,讀者被欺騙多了,便不再買賬,故需盡量避免這種不健康的模式。但他直言:「若你問惡性content farm的情況會不會在《香港01》發生?其實是有的,這是不能否認的。因為公司的導向而追逐點擊率時,確實會發生……但這並不是記者和編輯的責任,而是整間公司需要去修正的。」
但同時,他認為類似「十個你不知道的××」、「六個你必須關注的××」、「三個會令你震驚的××」等content farm的「始祖性」標題,早期確實收穫了一大批關注度,故可從中健康地學習其表達、傳播邏輯,為自己所用。「網絡新聞中是有紅線的,比如說,不能做『標題黨』。但我們不應懼怕這條紅線,反之,應該無限接近但不越過。對網絡新聞而言,愈是接近這條紅線,標題效果就會愈好。」他具體解釋道。
從content farm、標題黨類內容的傳播中可以看到,在互聯網世界,中規中矩的標題易令內容石沉大海,故不宜因躲避「紅線」而在文字上採取安全措施。他指出,如「中美會談舌劍唇槍」這樣的標題,在互聯網世界中就是不易被看到的。覃純健直言,所謂中規中矩的標題更易寫出,若在整篇文章中精心選取具體的激烈對話,會更耗時耗力。
算法再強也須「人」存在
「惡毒」的算法、「雙刃劍」數據,都是對媒體的考驗。當你以為已經脫離科技巨頭的規則時,很有可能開始被數據操控。人類應將數據、算法作為工具,自己掌握主導地位,而非被牽着走向另一個「別人的主場」。所以,需對技術保持警惕,並始終保留「人」的作用。
為幫助用戶更高效地發現、接觸到想要的內容,《香港01》亦會提供個性化的內容、產品與服務。確實,算法技術的開發是為了精準匹配用戶的個性化需要,降低在海量信息中的篩選難度,並節省用戶的時間。然而,算法卻有機會在潛移默化中操縱人的信息接收與認知。北京字節跳動科技有限公司旗下產品,如為人熟知的「今日頭條」系產品及「抖音」等,便是透過算法推薦穩穩地抓住用戶眼球的典型。然而,這樣的做法在近年屢遭質疑。
西北師範大學傳媒學院教授趙麗瑾在《光明日報》撰寫《讀者變為用戶,別掉進「算法」的陷阱》一文,指算法在技術上的數據導向,在根本上是資本利益導向,它將用戶轉化為數據與字符,試圖了解人的喜好並進行過濾,強化了認知窄化與數字鴻溝。對此,王龍瀟表示:「我們與『頭條系』不同,他們有着超級海量的內容,『千人千面』的特質會更明顯,我們的內容量則主要依靠自產與合作。」除堅持自產內容,避免令人類被算法技術「反噬」外,更需在海量數據、強大的算法中確立、肯定人的主體價值。
內容生產者是否會被數據「綁架」?方可成認為,現代的媒體的確會在頁面瀏覽量( PV)上背負更多壓力,但這在報刊時代亦存在。報刊時代並非一個毋須關注報紙銷量的烏托邦,只要是商業性質的媒體,定會有此考量。但他亦表示,當時的數據僅有報紙銷量,現在可以看到每篇文章的數據,雖可令媒體了解讀者行為,但同時又像是一個「詛咒」,將數據展示得太具體、太赤裸裸。而當這個商業邏輯侵入到新聞生產過程之中,數據便成為了協助商業的力量,將老闆營業的壓力轉移到了記者的身上。
對此,王龍瀟指出,早年有關於「數據驅動」(data driven)與「數據知情」(data informed)的討論,《香港01》選擇了後者。「數據驅動」意味着數據是團隊決策過程的中心,決策者會依據數據作為操作標準;而「數據知情」則指數據在決策中起輔助作用,取得數據後仍需考慮不同因素再作決定。
什麼是完全按照數據的指示行動?王龍瀟以「自動化SEO」解釋,先透過Google分析出近期「熱詞」,寫文時便可使用這些有更大機率被搜索到的字眼,技術團隊會給出「taging」(標籤)建議,但不會自動設置標籤,因為要留給編輯人員足夠靈活性:「我們的做法是向編輯提供三個熱詞標籤以作參考。我們把『人』放在重要位置,即使算法發展再強,都不會沒有人的存在,因為算法只是幫助人的工具。新聞的自主性、獨立性並不會被算法沖淡。」
他舉例道:「有個很經典的算法——推薦算法,即你喜歡ABC,我喜歡BCD,我們會分別傾向於攝取這些部份的信息。於是,算法就會認為我們兩個都看BC,是一類人,開始向你推薦D內容,而向我推薦A內容。」實際上,這亦是微信、頭條會使用的算法模式。他續稱,這樣的模式,會出現「圈子」愈來愈小的問題,因此,在做算法的時候,便需要一些可變的量去引導,除了以純科技的方法操作外,更需要人去引導,並不斷調整。
方可成認為數據本身其實不強大,即使可看到點擊率、點擊時間,甚至「跳出率」,但無法展示讀者的心理感受,他們是否得到知識的提升?獲得了怎樣的營養?對媒體的品牌認知發生了什麼變化?他指出:「這些我們無從得知。但只有知道這些, 我們才能判斷一篇文章的商業價值。所以,數據看上去很強大,但實際上卻只是很片面、很虛弱的評判標準,不足以真正地衡量一篇文章的價值。」
上文刊登於第268期《香港01》周報(2021年6月7日)《強大又無力的演算法: 「人」的主體價值須被確立》。如欲閱讀全文請按此試閱周報電子刊,瀏覽更多深度報道。