- 首頁(yè)
- 民文
- English
- 舉報(bào)專(zhuān)區(qū)
- 登錄
人工智能時(shí)代創(chuàng)新開(kāi)發(fā)媒資庫(kù)的探索與建議
摘要:數(shù)據(jù)是人工智能的基礎(chǔ),優(yōu)質(zhì)、豐富、稀缺的媒資庫(kù)數(shù)據(jù)將成為人工智能時(shí)代媒體融合發(fā)展的關(guān)鍵抓手。主流媒體對(duì)媒資庫(kù)創(chuàng)新開(kāi)發(fā)要搶抓機(jī)遇、超前布局、創(chuàng)新實(shí)踐,賦能建立“新聞+政務(wù)服務(wù)商務(wù)”運(yùn)營(yíng)模式,推動(dòng)智能化轉(zhuǎn)型和媒體融合向縱深發(fā)展。
關(guān)鍵詞:人工智能;媒資庫(kù);數(shù)據(jù);媒體融合發(fā)展
媒資庫(kù),即媒體資產(chǎn)倉(cāng)庫(kù),涉及媒體在內(nèi)容采集、生產(chǎn)、分發(fā)以及經(jīng)營(yíng)過(guò)程中積累的一切成品和素材。當(dāng)前,人工智能(AI)技術(shù)正融合千行百業(yè),驅(qū)動(dòng)新一輪科技革命和產(chǎn)業(yè)變革,也將重塑媒體格局、傳播方式與輿論生態(tài)。主流媒體正積極探索將AI運(yùn)用于新聞采集、生產(chǎn)、分發(fā)、接收、反饋之中,以打造智媒體新生態(tài),鞏固壯大奮進(jìn)新時(shí)代的主流思想輿論。
媒資庫(kù)是人工智能時(shí)代媒體融合發(fā)展的關(guān)鍵抓手
當(dāng)前,各大媒體機(jī)構(gòu)對(duì)媒資庫(kù)建設(shè)與開(kāi)發(fā)存在投入不足的現(xiàn)象。許多媒資庫(kù)建設(shè)僅停留在將歷史文字報(bào)道電子化階段,圖片、音視頻入庫(kù)數(shù)字化進(jìn)程緩慢,創(chuàng)新開(kāi)發(fā)媒資庫(kù)賦能媒體融合發(fā)展也還停留在初級(jí)階段。建設(shè)、開(kāi)發(fā)媒資庫(kù)需要大量資金、技術(shù)與人才投入,且無(wú)法直接帶來(lái)可觀(guān)的經(jīng)濟(jì)效益。
隨著AI技術(shù)的發(fā)展,這種低投入的局面有望徹底打破。數(shù)據(jù)是AI的燃料,是智能發(fā)展的基石。主流媒體在新聞報(bào)道與融合發(fā)展過(guò)程中沉淀積累了海量的內(nèi)容成品和素材數(shù)據(jù),匯集大量政務(wù)數(shù)據(jù)、服務(wù)數(shù)據(jù)、商務(wù)數(shù)據(jù),這些數(shù)據(jù)能有效支撐AI學(xué)習(xí)和訓(xùn)練,提高其智能水平。
知名AI研究機(jī)構(gòu)EpochAI的一項(xiàng)研究預(yù)計(jì),隨著AI技術(shù)發(fā)展,到2026年,高質(zhì)量的數(shù)據(jù)將變得稀缺,2030—2050年低質(zhì)量數(shù)據(jù)也將消耗殆盡。在國(guó)外,《紐約時(shí)報(bào)》等多家媒體起訴生成式AI應(yīng)用ChatGPT的開(kāi)發(fā)公司OpenAI“未經(jīng)授權(quán),使用已發(fā)表的新聞作品訓(xùn)練生成式人工智能應(yīng)用”。美國(guó)有線(xiàn)電視新聞網(wǎng)(CNN)、美聯(lián)社、福克斯(Fox)、《時(shí)代》雜志(Time)也與OpenAI就內(nèi)容授權(quán)訓(xùn)練AI應(yīng)用事宜進(jìn)行了多次談判[1]。這從一個(gè)側(cè)面說(shuō)明,媒體數(shù)據(jù)優(yōu)質(zhì)、豐富、稀缺,而且應(yīng)用場(chǎng)景與市場(chǎng)十分廣闊。以這些數(shù)據(jù)為基礎(chǔ)建立的媒資庫(kù),不僅是媒體機(jī)構(gòu)重要的資產(chǎn),更是媒體機(jī)構(gòu)抓住AI發(fā)展機(jī)遇,賦能建立“新聞+政務(wù)服務(wù)商務(wù)”運(yùn)營(yíng)模式,推動(dòng)媒體融合向縱深發(fā)展的關(guān)鍵抓手。
隨著AI與媒體融合進(jìn)一步加深,媒資庫(kù)對(duì)主流媒體融合發(fā)展而言,或?qū)摹坝悬c(diǎn)關(guān)系”變成“性命攸關(guān)”。
(一)媒資庫(kù)是智能生產(chǎn)和傳播的基礎(chǔ)
媒資庫(kù)將全面賦能媒體智能生產(chǎn)和智能傳播,推動(dòng)媒體智能化進(jìn)入快速發(fā)展階段。當(dāng)前,以ChatGPT為代表的AIGC(人工智能生成內(nèi)容)應(yīng)用平臺(tái)發(fā)展迅猛。行業(yè)普遍認(rèn)為AIGC將成為繼專(zhuān)業(yè)生產(chǎn)內(nèi)容(PGC)、用戶(hù)生產(chǎn)內(nèi)容(UGC)之后新的內(nèi)容生產(chǎn)模式,廣泛應(yīng)用在內(nèi)容生產(chǎn)的各個(gè)領(lǐng)域并且替代了部分人工創(chuàng)作。媒資庫(kù)是媒體AIGC的基礎(chǔ),AI新聞寫(xiě)作、AI繪畫(huà)、AI視頻生成、AI虛擬場(chǎng)景生成等AIGC應(yīng)用均離不開(kāi)AI對(duì)媒資庫(kù)數(shù)據(jù)的學(xué)習(xí)和訓(xùn)練;AI審核、媒體報(bào)道精準(zhǔn)傳播、傳播效果精準(zhǔn)評(píng)估等也離不開(kāi)AI對(duì)媒資庫(kù)數(shù)據(jù)的數(shù)據(jù)挖掘和預(yù)測(cè)分析。
(二)媒資庫(kù)數(shù)據(jù)決定媒體智能服務(wù)
隨著AI技術(shù)融合千行百業(yè),媒資庫(kù)里面擁有的數(shù)據(jù)類(lèi)型和數(shù)量,將決定主流媒體提供智能服務(wù)的類(lèi)型與水平。AI時(shí)代,沒(méi)有數(shù)據(jù),主流媒體就很難有智能服務(wù),影響力和競(jìng)爭(zhēng)力也會(huì)打折扣。例如,當(dāng)前不少主流媒體針對(duì)政務(wù)服務(wù)建立了網(wǎng)絡(luò)問(wèn)政互動(dòng)及訴求反映平臺(tái),包括人民網(wǎng)“領(lǐng)導(dǎo)留言板”、新疆日?qǐng)?bào)“石榴云12345問(wèn)政”、四川日?qǐng)?bào)“問(wèn)政四川”、河北新聞網(wǎng)“陽(yáng)光理政”、華龍網(wǎng)“重慶網(wǎng)絡(luò)問(wèn)政平臺(tái)”等,這些平臺(tái)所積累的政務(wù)數(shù)據(jù)和運(yùn)營(yíng)經(jīng)驗(yàn),將造就主流媒體面向政務(wù)服務(wù)的AI能力。
媒資庫(kù)在人工智能領(lǐng)域的應(yīng)用探索
AIGC平臺(tái)的迅猛發(fā)展為創(chuàng)新開(kāi)發(fā)媒資庫(kù)提供了方向指引。當(dāng)前,主流媒體在AI領(lǐng)域探索開(kāi)發(fā)媒資庫(kù)主要包括以下幾個(gè)方向。
(一)主流價(jià)值語(yǔ)料庫(kù)
AI平臺(tái)有立場(chǎng),AI生成的內(nèi)容有導(dǎo)向,其導(dǎo)向本質(zhì)上是由AI學(xué)習(xí)的數(shù)據(jù)語(yǔ)料和算法決定的。例如,ChatGPT被指“充滿(mǎn)西方意識(shí)形態(tài)和美式政治正確”,根源是美國(guó)硅谷和科技界本來(lái)就是美國(guó)價(jià)值觀(guān)的大本營(yíng),ChatGPT訓(xùn)練與學(xué)習(xí)的數(shù)據(jù)大多來(lái)源于西方的數(shù)據(jù),產(chǎn)品當(dāng)然自帶西方意識(shí)形態(tài)。
在推進(jìn)媒體融合過(guò)程中,主流媒體不能一味采用、入駐商業(yè)企業(yè)的AIGC平臺(tái),而是要特別關(guān)注喂養(yǎng)AI的語(yǔ)料數(shù)據(jù)和模型算法本身的導(dǎo)向。人民數(shù)據(jù)發(fā)布的《AI大模型綜合能力測(cè)評(píng)報(bào)告》顯示,國(guó)內(nèi)主流大模型在內(nèi)容生態(tài)方面的表現(xiàn)仍有一定提升空間,一些大模型對(duì)敏感話(huà)題做出了不同程度的規(guī)避,部分回答內(nèi)容情感色彩較重[2]。這從一個(gè)側(cè)面上反映出,當(dāng)前市場(chǎng)上主流價(jià)值語(yǔ)料庫(kù)稀缺,無(wú)法為大模型學(xué)習(xí)訓(xùn)練提供支持。主流媒體作為鞏固壯大主流思想輿論、擴(kuò)大主流價(jià)值影響力的主力軍,需要?jiǎng)?chuàng)新媒資庫(kù)、建立主流價(jià)值語(yǔ)料庫(kù),進(jìn)一步發(fā)揮在AI時(shí)代守護(hù)意識(shí)形態(tài)安全的價(jià)值。
例如,針對(duì)大模型普遍回答不了、回答不好的重大、敏感、疑難問(wèn)題,人民網(wǎng)動(dòng)員全體員工、匯集各方資源,建設(shè)包括基礎(chǔ)語(yǔ)料、重點(diǎn)領(lǐng)域語(yǔ)料、敏感問(wèn)答語(yǔ)料在內(nèi)的“主流價(jià)值語(yǔ)料庫(kù)”,目前已完成12萬(wàn)道題的問(wèn)答語(yǔ)料庫(kù)、16個(gè)重點(diǎn)領(lǐng)域語(yǔ)料庫(kù)、超300億字的基礎(chǔ)語(yǔ)料庫(kù)的建設(shè),實(shí)現(xiàn)與多個(gè)國(guó)產(chǎn)主流大模型的集成對(duì)接,大幅提升了其安全水平。
(二)行業(yè)應(yīng)用大模型
媒體創(chuàng)新融合發(fā)展路徑可以從三個(gè)層面展開(kāi):一是媒體內(nèi)部的融合,也就是傳統(tǒng)媒體與新興媒體的融合;二是媒體與媒體之間的行業(yè)融合;三是媒體與一切行業(yè)、產(chǎn)業(yè)的融合,讓媒體在與各個(gè)行業(yè)的深度融合中壯大。主流媒體通過(guò)行業(yè)報(bào)道以及行業(yè)內(nèi)容運(yùn)營(yíng)業(yè)務(wù)積累了大量高質(zhì)量行業(yè)數(shù)據(jù),可以轉(zhuǎn)化為行業(yè)垂直大模型訓(xùn)練的優(yōu)質(zhì)語(yǔ)料庫(kù)數(shù)據(jù),能為開(kāi)發(fā)行業(yè)垂直大模型、推動(dòng)產(chǎn)業(yè)融合提供數(shù)據(jù)與技術(shù)支撐,為下一步推進(jìn)行業(yè)、產(chǎn)業(yè)的融合打下基礎(chǔ)。
例如,人民網(wǎng)研發(fā)的“人民智媒大模型”為國(guó)家地震局提供地震知識(shí)科普問(wèn)答應(yīng)用。該應(yīng)用基于地震科普類(lèi)圖書(shū)和相關(guān)規(guī)范標(biāo)準(zhǔn)文件的學(xué)習(xí),有效提升在地震基礎(chǔ)知識(shí)、地震災(zāi)害防御、地震應(yīng)急救援和地震預(yù)警及應(yīng)對(duì)等方面的知識(shí)科普效率。
(三)內(nèi)容風(fēng)控應(yīng)用
AI時(shí)代,信息無(wú)處不在、無(wú)所不及、無(wú)人不用,智能內(nèi)容風(fēng)控?fù)碛袕V闊的應(yīng)用場(chǎng)景。媒資庫(kù)的報(bào)道成品內(nèi)容,一定程度上是主流媒體內(nèi)容審核把關(guān)能力與經(jīng)驗(yàn)的體現(xiàn)。通過(guò)AI技術(shù)學(xué)習(xí)和訓(xùn)練這些數(shù)據(jù),可以研發(fā)內(nèi)容風(fēng)控應(yīng)用,全面延伸主流媒體意識(shí)形態(tài)把關(guān)能力。
例如,人民網(wǎng)推出的涉政內(nèi)容智能審核平臺(tái)“人民審校”,以人民日?qǐng)?bào)媒資庫(kù)為核心數(shù)據(jù),基于人民網(wǎng)獨(dú)家資源和資深編輯的內(nèi)容把關(guān)經(jīng)驗(yàn),構(gòu)建涉政知識(shí)數(shù)據(jù)庫(kù),具備涉政文本審核、視覺(jué)內(nèi)容檢測(cè)等智能風(fēng)控模塊,可以實(shí)現(xiàn)在線(xiàn)檢測(cè)、文本審校、圖片審校、視頻審校、自定義詞庫(kù)等多功能。目前,“人民審校”已為300多家客戶(hù)提供內(nèi)容把關(guān)和巡查服務(wù)。隨著AI大模型的進(jìn)一步發(fā)展,“人民審校”將助力審核AI訓(xùn)練的數(shù)據(jù)語(yǔ)料、生成內(nèi)容、線(xiàn)上課程等內(nèi)容。
(四)智能文稿創(chuàng)作應(yīng)用
媒資庫(kù)里海量的政務(wù)數(shù)據(jù),例如時(shí)政新聞報(bào)道、領(lǐng)導(dǎo)講話(huà)稿、政策文件、官方報(bào)告等內(nèi)容,奠定了主流媒體在黨政文稿方面的智能創(chuàng)作能力。在開(kāi)發(fā)智能文稿創(chuàng)作應(yīng)用方面,媒資庫(kù)擁有兩大不可替代的優(yōu)勢(shì):一是數(shù)據(jù)來(lái)源于主流媒體報(bào)道,確保了AIGC的政治方向、價(jià)值取向和輿論導(dǎo)向;二是原始數(shù)據(jù)的寫(xiě)作邏輯、語(yǔ)句語(yǔ)序等契合黨政機(jī)關(guān)、事業(yè)單位及國(guó)有企業(yè)的應(yīng)用場(chǎng)景。
例如,人民日?qǐng)?bào)社主管、依托人民網(wǎng)建設(shè)的傳播內(nèi)容認(rèn)知國(guó)家重點(diǎn)實(shí)驗(yàn)室推出的人工智能寫(xiě)稿秘書(shū)“寫(xiě)易”創(chuàng)作引擎,通過(guò)AI訓(xùn)練學(xué)習(xí)符合我國(guó)主流價(jià)值觀(guān)的數(shù)據(jù)集和媒體語(yǔ)料庫(kù),內(nèi)容涵蓋政治、經(jīng)濟(jì)、文化、社會(huì)、生態(tài)、黨建、國(guó)防、外交等重點(diǎn)領(lǐng)域,保障生成內(nèi)容安全,著重為黨政機(jī)關(guān)、事業(yè)單位、國(guó)有企業(yè)提供優(yōu)質(zhì)安全的智能創(chuàng)作服務(wù)。目前,“寫(xiě)易”已為多個(gè)黨政機(jī)關(guān)和大型國(guó)企提供應(yīng)用服務(wù)。
(五)人工智能檢測(cè)
隨著AI技術(shù)進(jìn)一步與內(nèi)容行業(yè)融合,AIGC迎來(lái)發(fā)展新階段。與之伴隨的內(nèi)容侵權(quán)、網(wǎng)絡(luò)釣魚(yú)、深度偽造、虛假信息等風(fēng)險(xiǎn)挑戰(zhàn)引發(fā)廣泛關(guān)注。媒體報(bào)道是AI內(nèi)容生成平臺(tái)數(shù)據(jù)訓(xùn)練學(xué)習(xí)的重要來(lái)源。通過(guò)AI技術(shù)學(xué)習(xí)訓(xùn)練相關(guān)數(shù)據(jù),推出針對(duì)性的智能檢測(cè)產(chǎn)品,可以起到保護(hù)版權(quán)、維護(hù)內(nèi)容安全的作用,在內(nèi)容安全、版權(quán)保護(hù)方面有廣闊的市場(chǎng)應(yīng)用前景。
例如,人民日?qǐng)?bào)社主管、依托人民網(wǎng)建設(shè)的傳播內(nèi)容認(rèn)知國(guó)家重點(diǎn)實(shí)驗(yàn)室推出的“AIGC-X”應(yīng)用,可快速區(qū)分機(jī)器生成內(nèi)容與人工創(chuàng)作內(nèi)容,對(duì)中文文本檢測(cè)的準(zhǔn)確率已超過(guò)90%。下一步,AIGC-X將擴(kuò)展為對(duì)AI生成文本、圖像乃至視頻的通用智能識(shí)別模型,為統(tǒng)籌AI安全與發(fā)展貢獻(xiàn)力量。
進(jìn)一步創(chuàng)新開(kāi)發(fā)媒資庫(kù)
AI與媒體深度融合,重塑媒體格局和輿論生態(tài)已是大勢(shì)所趨。主流媒體對(duì)媒資庫(kù)開(kāi)發(fā)要超前布局、創(chuàng)新實(shí)踐,抓住AI發(fā)展的機(jī)遇,賦能媒體智能化轉(zhuǎn)型,推動(dòng)媒體融合向縱深發(fā)展。
(一)積極豐富媒資庫(kù)數(shù)據(jù)
媒資庫(kù)優(yōu)質(zhì)數(shù)據(jù)的廣度決定了在AI領(lǐng)域創(chuàng)新開(kāi)發(fā)的深度。除了傳統(tǒng)媒體歷史報(bào)道與素材數(shù)據(jù)之外,以下數(shù)據(jù)可以重點(diǎn)考慮。一是AI數(shù)據(jù)。當(dāng)前,AI與媒體融合進(jìn)一步加深,主流媒體內(nèi)容生產(chǎn)效率與質(zhì)量得到大幅提升。未來(lái),由AI生成的數(shù)據(jù)呈現(xiàn)爆發(fā)態(tài)勢(shì),許多媒體內(nèi)容將來(lái)源于AI。因此,可以將海量AI生成數(shù)據(jù)補(bǔ)充到媒資庫(kù)中。二是行業(yè)數(shù)據(jù)。主流媒體在探索建立“新聞+政務(wù)服務(wù)商業(yè)”經(jīng)營(yíng)模式的過(guò)程中,要留意對(duì)行業(yè)數(shù)據(jù)的積累、挖掘,形成各類(lèi)行業(yè)數(shù)據(jù)庫(kù),提升媒資庫(kù)的深度和廣度。三是互聯(lián)網(wǎng)數(shù)據(jù)。通過(guò)開(kāi)放合作,主流媒體可以定向采集互聯(lián)網(wǎng)相關(guān)數(shù)據(jù),拓展媒資庫(kù)的數(shù)據(jù)量。
(二)推進(jìn)智能媒體資源庫(kù)建設(shè)
媒資庫(kù)建設(shè)不能僅停留在文字報(bào)道電子化階段。要將文字、圖表、圖片、音視頻報(bào)道和素材數(shù)字化、智能標(biāo)簽化,實(shí)現(xiàn)海量數(shù)據(jù)數(shù)字化存儲(chǔ)、多模態(tài)搜索與精準(zhǔn)管理。同時(shí),建議對(duì)各類(lèi)數(shù)據(jù)進(jìn)行清洗、提煉與分類(lèi),形成各類(lèi)專(zhuān)業(yè)數(shù)據(jù)庫(kù),為媒資庫(kù)創(chuàng)新開(kāi)發(fā)做好準(zhǔn)備。
(三)加速媒資庫(kù)在人工智能領(lǐng)域的創(chuàng)新開(kāi)發(fā)
媒資庫(kù)是媒體機(jī)構(gòu)優(yōu)質(zhì)、稀缺的數(shù)據(jù)資產(chǎn),但如不創(chuàng)新開(kāi)發(fā)使用,仍然只是“歷史檔案”,無(wú)法體現(xiàn)其數(shù)據(jù)價(jià)值。因此,建議主流媒體積極創(chuàng)新開(kāi)發(fā)媒資庫(kù),通過(guò)技術(shù)的引入,持續(xù)賦能媒體內(nèi)容生產(chǎn)、智能傳播及經(jīng)營(yíng)運(yùn)營(yíng)分析。此外,還可以通過(guò)對(duì)外尋求合作,共享和開(kāi)放媒資庫(kù),暢通數(shù)據(jù)資源大循環(huán)。要超前布局,先行先試,在使用中積累數(shù)據(jù)和經(jīng)驗(yàn),在使用中完善媒資庫(kù),為媒體智能化轉(zhuǎn)型與融合發(fā)展提供支撐。
【參考文獻(xiàn)】
[1]財(cái)聯(lián)社.OpenAI與CNN、福克斯和時(shí)代雜志洽談內(nèi)容授權(quán)事宜[EB/OL].(2024-01-12).https://www.cls.cn/detail/1568645.
[2]人民數(shù)據(jù).重磅!人民數(shù)據(jù)發(fā)布《AI大模型綜合能力測(cè)評(píng)報(bào)告》[EB/OL].(2023-07-07).https://www.peopledata.com.cn/html/NEWS/Dynamics/3225.html.
(本文刊發(fā)于《全媒體探索》2024年4月號(hào))
分享讓更多人看到
推薦閱讀
傳媒推薦
熱門(mén)排行
- 1中國(guó)品牌 勇立時(shí)代潮頭(中國(guó)品牌日)
- 2二〇二四年“高質(zhì)量發(fā)展調(diào)研行”主題采訪(fǎng)…
- 3厚植品牌優(yōu)勢(shì) 提升品牌形象(中國(guó)品牌…
- 4讓體育賽事添彩城市發(fā)展(評(píng)論員觀(guān)察)
- 5履行社會(huì)責(zé)任 促進(jìn)企業(yè)發(fā)展(中國(guó)品牌…
- 6美好博物館,點(diǎn)亮百姓生活
- 7中華老字號(hào),擦亮金字招牌
- 8 人民日?qǐng)?bào)社第18屆長(zhǎng)江韜奮獎(jiǎng)候選人公…
- 9關(guān)于參評(píng)第三十四屆中國(guó)新聞獎(jiǎng)自薦(他薦…
- 10人民日?qǐng)?bào)社申報(bào)第34屆中國(guó)新聞獎(jiǎng)參評(píng)作…