網絡文學頻遭“秒盜” 文學網站升級防盜新技術
作 者:任曉寧 來 源:中國新聞出版廣電報發表日期:2018-03-08
閱文集團上線了特殊算法模型數據庫,已實現快速查詢底層能力,秒級內實時計算出指定章節內容重復度,為防抄襲提供大數據基礎能力。
晉江文學城設計了一套抄襲舉報管理系統,自系統上線以來,已累計受理用戶舉報抄襲文章4000余次,共成功處理抄襲文章2000余篇。
分級自動化內容防盜系統是根據對盜文者行為模式的分析,制定對應的防盜規則,付費章節作者可以設定對某些特定人群在一定時間內投放干擾性閱讀內容,從而起到一定的防盜作用。
盜版、抄襲現象是阻礙網絡文學發展的沉疴。據不完全統計,每年網絡文學行業因盜版損失接近100億元。近一段時間以來,閱文集團、晉江文學城等紛紛升級防盜版措施,把大數據、云計算等互聯網新興技術應用到防盜版、防抄襲上,技術手段有了進展。
《中國新聞出版廣電報》記者了解到,閱文集團針對抄襲行為上線了特殊算法模型數據庫,實時查重作家上傳的作品內容。晉江文學城通過技術手段,付費章節作者可以設定對特定人群在一定時間內投放干擾內容,起到了一定的防盜版作用。
特殊算法
實現網絡文學秒級查重
“去年,我們基于自己的數據庫開發了一整套特殊算法模型數據庫,在編輯后臺可以直觀地比對作者的文本是否有抄襲,雖然增加了服務器壓力,但是我覺得很值得。”閱文集團旗下起點中文網總編輯李曉亮這樣告訴記者。
當前,這套針對抄襲行為上線的特殊算法模型數據庫已經在整個閱文集團平臺應用,在這個系統支持下,編輯可以實時查重作者上傳的作品內容。作者每發一章,平臺就可以自動對比全網書庫,提醒編輯本章與書庫中內容的重復率,以便人工查驗是否抄襲,當重復率超過50%時,平臺就會自動報警,該做法有效解決了抄襲現象。
“如果抄襲嚴重,我們會直接禁了作者權限。”李曉亮說。
據了解,目前閱文集團已實現快速查詢底層能力,秒級內實時計算出指定章節內容重復度。這種特殊算法模型根據有效命中段落數、作品總有效段落數加權計算單章節重復度,并根據單章節重復度計算作品總重復度。為了建立最專業的防抄襲監控體系,閱文集團通過歷年深耕,已積累千萬級的作品基礎數據,有效章節數達1.5億,有效段落數達數百億,為防抄襲提供大數據基礎能力。
對于效果,李曉亮表示滿意,“這個措施還是有用的,每章剛一出現,就能發現是否有抄襲嫌疑了。”他認為,這個功能可以降低內容監管風險、提高人工審核效率。
舉報管理系統
警示抄襲行為
對于抄襲,晉江文學城在業內一直是態度鮮明的持續打擊,無論是小透明還是網絡大神,凡是有確鑿證據,一律按照相關規定處理。記者了解到,晉江文學城目前設計了一套抄襲舉報管理系統,自系統上線以來,已累計受理用戶舉報抄襲文章4000余次,共成功處理抄襲文章2000余篇。
晉江文學城的抄襲舉報管理系統主要有“用戶前臺舉報”端及“管理員后臺處理”端兩大部分,同時為便于后續處理,又將舉報抄襲分為“全文照搬”“文字抄襲”“劇情抄襲”三大類。
對于用戶提供的抄襲證據,系統會根據文章數據庫再次進行核實,尤其是在文字抄襲和全文照搬的處理上,基于晉江文學城判定標準,系統會將抄襲文章和被抄襲文章的雷同語段進行特殊標識,并進行雷同語段統計,減少人工判斷的難度。針對劇情抄襲,系統會將抄襲對應章節進行箭頭指向引導展示,便于處理者能夠更加明確地查看到對應關系。
對于被判定了抄襲的文章,晉江文學城會做出對應的懲罰措施,舉報者也會得到舉報成功的獎勵,以此來激勵更多的用戶加入到反抄襲、維護原創作者權益的隊伍中,同時也對作者們起到一定的警示作用,保持晉江文學城這一片創作凈土。
內容防盜系統
初步實現防盜目的
2017年度,晉江法務部聯合熱心作者、讀者做了大量的反盜版維權工作,為作者追回近千萬元的經濟損失,并將兩家公司納入失信被執行人名單進行信用懲戒。在技術手段上,晉江也上線了分級自動化內容防盜系統和盜文侵權行為通知函件自動發送系統。
分級自動化內容防盜系統是根據對盜文者行為模式的分析,制定對應的防盜規則,付費章節作者可以設定對某些特定人群在一定時間內投放干擾性閱讀內容,比如24—72小時內,只有購買一定比例的VIP讀者才能看到最新內容,否則只能看到之前的舊內容,從而起到一定的防盜作用。盜文侵權行為通知函件自動發送系統是讓作者通過該系統向指定侵權網站聯絡郵箱發送侵權通知函件,要求將侵權作品進行下架刪除等處置,同時系統會記錄并分析相應數據,便于網站法務部門人員查看,達到一定程度后,會有法務人員人工介入處理。
2017年,晉江文學城多次就抄襲、盜版問題發起過訴訟,大部分案件獲得較好的維權結果。比如百度閱讀侵犯晉江作者玖月晞的《親愛的阿基米德》《一座城,在等你》作品著作權案,目前已經獲得一審判決,其維權行為得到法院認可。
“在反盜版上,我們也一直致力于在盡量不影響絕大多數正常讀者用戶體驗的基礎上,提升網站各種防盜手段。但上述技術手段只能起到部分作用,在此基礎上,我網站法務人員也付出了很大努力。”晉江文學城副總裁劉旭東認為,網絡文學的抄襲、盜版問題一直比較嚴重,也是制約行業健康發展、侵害作者和文學網站權益的最重要問題之一。抄襲問題更多的是一種道德品質層面的問題,需要作者自覺自律,需要網站公平公正的處理。而盜版問題,危害重,維權難,一直深受詬病,但鑒于網絡文學這種線上閱讀的模式,除非不讓讀者閱讀,否則以現有技術水平來說,很難徹底根除盜版現象,畢竟還有“手打團”這種盜版方式的存在,因此各級網站、各位作者也只是盡可能地增加盜版難度,降低侵害。
起點中文網則主要通過禁止復制作品內容,以及停權盜帖賬號這兩個辦法來反盜版,盡管也取得不小的反盜版成果,李曉亮對此依然提出困惑,“只要盜版網站投入的成本達到一個很低的門檻,我們基本就無能為力了。”他認為,這也是當前正版文學網站一段時間內持續面臨的困境。