界面新聞記者 | 佘曉晨
界面新聞編輯 | 宋佳楠
近日,中央網絡安全和信息化委員會辦公室秘書局、工業和信息化部辦公廳、公安部辦公廳和國家市場監督管理總局辦公廳四部門,發布了《關于開展“清朗·網絡平臺算法典型問題治理”專項行動的通知》(下稱《通知》),決定自即日起至2025年2月14日開展“清朗·網絡平臺算法典型問題治理”專項行動。
其中,在提升榜單透明度打擊操縱榜單行為方面,《通知》要求全面公示熱搜榜單算法原理,提升榜單透明度和可解釋性。完善榜單日志留存,提高榜單算法原理可驗證性。健全水軍刷榜、水軍賬號等違規行為、賬號檢測識別技術手段,嚴管不法分子惡意利用榜單排序規則操縱榜單、炒作熱點行為。
自互聯網誕生之后,熱搜榜單就成為吸引廣大用戶的“注意力”利器。除了新浪微博,B站、小紅書、抖音等平臺都在應用內設置了熱搜榜單產品。排名前列的話題,往往會成為站內外用戶關注的熱點。
但長久以來,熱搜榜單引發的負面問題一直存在。尤其是熱搜榜單的“泛娛樂化”現象,不僅讓更多商業機構“買熱搜”,更是給公眾帶來不良影響。2021年11月,中央網信辦曾印發通知,其中針對網站平臺首頁首屏、熱門推薦、熱搜榜單等重點環節提出明確要求,以進一步規范娛樂明星網上信息呈現。微博方面曾披露,其從2020年開始就降低熱搜娛樂內容占比,在相關管理政策出臺前,微博的娛樂內容占比在25%左右。
如何有效治理熱搜榜單帶來的一系列亂象,不僅對于公眾了解真實信息具有重要意義,對于平臺而言,也是保證內容生態良性發展的必要之舉。
熱搜背后的“水下”交易
熱搜產品有“原罪”嗎?為何由此引發的亂象屢禁不止?理解這些問題,或許要從互聯網平臺的屬性和熱搜產品的形成談起。
以微博熱搜榜單為例,這一產品于2010年上線,當時的微博平臺已經成為一個“公共廣場”。2021年,微博首次公布熱搜榜單的詳細機制,其中提到,微博熱搜根據微博用戶的真實行為進行計算,實時發現微博平臺內正受到廣泛關注的熱點內容,并形成實時榜單。
微博表示,算法機制會計算所有熱詞的綜合熱度,包括搜索量、發博量、互動量、閱讀量等數據指標,每分鐘計算一次,取前50名展示。被大量網友搜索和討論的關鍵詞或者話題詞,都可能成為熱搜詞;熱搜詞條由網友搜索行為和討論行為產生,或者話題主持人產生。同時,微博也稱榜單算法中包含嚴格的排水軍和反垃圾機制。
值得注意的是,微博公布的熱度計算公式為:(搜索熱度+討論熱度+傳播熱度)×互動率。這意味著,決定哪些內容上熱搜的因素來自于多個維度,涉及用戶的行為、話題主持人的參與,同樣也和平臺的設計方式息息相關。
事實上,微博熱搜榜單之所以足夠典型,一方面在于其發展時間悠久,另一方面也是因為它和其他平臺的熱搜榜單存在一大區別:有“超話主持人”。這讓人工參與榜單運營有了更大的可能性。
鄭州大學新聞與傳播學院副教授王茜長期研究微博熱搜、算法治理相關課題。王茜在接受界面新聞采訪時指出,除了產品和算法上的不一樣,微博的用戶規模較大、用戶構成也比較豐富,這決定了它仍然是受眾進行公共討論的最主要平臺。
官方數據顯示,微博月活用戶達5.87億、日活用戶達2.57億。根據微博發布的《2023年微博熱搜趨勢報告》,熱搜內容涵蓋社會、娛樂及手機、汽車、醫療健康、時尚、美妝等25個垂直領域熱點數據。
在龐大的影響力和平臺商業屬性的驅使下,“買熱搜”、“買水軍”就成為熱搜榜單的一大頑疾。
一位廣告行業人士告訴界面新聞,其在工作中常有類似的操作:當其服務的品牌客戶出現負面輿情時,他需要迅速寫完文案,聯系市面上的“水軍供應商”。這些供應商往往有大量“水軍”賬號,如果品牌預算充足,他們還可以購買更高級的賬號,讓其發布的內容更靠近“超話”的前排,增加搜索曝光。此前《大象新聞》曾報道,在熱搜榜單的產業鏈中,“沖一次熱搜7000元起步,發一次原創消息成本價1元,對外售價3元,關注一次0.1元。”
除了負面危機處理,買熱搜還會出現在品牌需要的營銷事件中。對于熟悉行業規則的人來說,購買僵尸號、素人號和KOL賬號都是明碼標價的。這些“潛規則”,實際上促進了微博熱搜榜單的商業化。上述人士表示,如果預算夠高,就可以購買到高級的、陽光信用高的僵尸粉賬號,目標詞條就能上微博廣場,權重更高。
在水軍刷榜、炒作熱點等行為愈演愈烈時,各個平臺的熱搜榜單都引發過負面影響,被外界質疑。并且,“水軍賬號”還不只出現在熱搜榜單,亂象已蔓延至互聯網平臺的方方面面。據央視新聞報道,今年10月,四川內江警方曾破獲一起“網絡水軍”團伙案,該團伙在2年多時間內,為小紅書、淘寶等平臺1000余戶商家“刷單控評”,涉案金額高達1億元。
熱搜頑疾如何根治?
事實上,平臺自身也不希望內容生態被過度破壞。近幾年,包括微博、小紅書、抖音在內的平臺都多次公布過水軍治理、違規賬號清理等種種動作。
今年11月18日,小紅書全面展開對黑灰產賬號的治理工作,主要針對“橫向評測黑灰產水軍”、“黑灰產賬號矩陣”進行嚴厲打擊。小紅書黑灰產賬號治理專項負責人表示,黑灰產賬號會干擾用戶獲得真實有用的信息,影響用戶體驗,會侵占品牌和商家的正常經營空間,還會擠壓優質創作者的流量,嚴重損害用戶、品牌、商家以及創作者的正當權益。
最近一次,微博于11月發布《熱搜討論區違規內容治理的公告》,其中提到,為保障用戶的互動體驗,站方不斷加強對不友善言論、飯圈違規等行為的治理,鼓勵用戶真實、客觀、理性地參與討論。平臺指出,典型違規行為包括但不限于不友善內容、惡意刷量及煽動對立、虛假信息與惡意引流等等。更早之前,微博于2022年1月宣布將優化熱搜榜單內容配比機制,并基于熱搜生態和價值導向加強人工調控。
王茜在2020年發表的論文中提煉出微博“熱搜”算法價值的四個要素,分別是:時新性、流行性、參與性和導向正確。在近兩年的研究中,她也有一些新的發現,比如隨著2018年上榜規則的調整,熱搜糅合了“個體的搜索痕跡聚合”和“公眾之間的互動和交流”,相較于普通民眾,新聞當事人、意見領袖、媒體等開始發揮更重要的作用。
與此同時,她觀察到,微博這兩年也在不斷進行熱搜機制的改善,比如加入“暖新聞”等更具公共責任性質的產品設計(2023年4月,微博上線暖新聞機制)。
但王茜也強調,在算法機制上,微博之所以沒有把“多樣性”、“重要性”等更多因素加入考量,究其本質還是因為它的商業屬性。“如果將熱搜設計成一個完全公共性的媒體陣地,和它作為商業機構的盈利本質相沖突。”
一位微博前員工告訴界面新聞,微博改變熱搜算法機制的難度在于,這牽扯多方利益,執行起來較為復雜。
此外,水軍賬號的泛濫確實需要平臺不斷加強技術能力,其中也存在一些挑戰。
上述黑灰產賬號治理專項負責人向界面新聞表示,打擊水軍賬號的技術手段主要是通過數據分析,對黑灰產賬號特征進行總結,在后臺排查鎖定;非技術手段包括用戶舉報、前端巡查等。但黑灰產水軍會對平臺治理進行內容對抗,例如導流文案有成百上千種變體,一旦被平臺發現就不斷換新的變體,增加了平臺的識別難度。此外,黑灰產賬號的重要變現手段是賬號買賣,但這種買賣行為,很難識別是正常手機換綁,還是黑灰產交易。
加之黑灰產產業鏈條分布在線上和線下,線下會有聚集地,這對于每個內容平臺來說都增加了難度。
不過,平臺也并非沒有改進的空間。
近年來,學界和產業界的專家為熱搜榜單的治理提出了不少建議,包括加強政府部門主導的監督管理、加入人工智能技術等等。在王茜看來,即使平臺有自身的商業因素等考量,它們仍可以做到改善產品設計,例如設計一些內容選擇的按鈕,讓更多人做出判斷,形成多元的價值排序。其次,加強人工把關也是一種方式。完全依賴算法肯定不可避免地會有誤判,也容易造成虛假信息的泛濫,需要人工干預以加強信息真實性的核查。
王茜還指出,熱搜被視為民意晴雨表和風向標,和民意調查所發揮的作用非常類似,本質上都是一種“民意測量機器”。
受到民意調查倫理規范的啟發,她認為,針對哪些話題登上榜單、哪些沒有登上榜單,平臺也有義務增強榜單規則的可解釋性和透明度,這同樣有利于治理。“可以從世界民意研究學會、美國民意研究協會、歐洲民意與市場調查協會等制定的民意調查國際準則中汲取經驗,例如必須提及民意調查涉及的范圍和收集信息的技術、對錯誤結果的發布作出必要更正,進而提高熱搜數據采集與結果呈現的透明性、規范性和可解釋性。”