過去幾年間,大數(shù)據(jù)逐漸從一個熱門概念落地為可進行商業(yè)變現(xiàn)的具體業(yè)務。無論是互聯(lián)網(wǎng)公司還是傳統(tǒng)企業(yè),都在迎接數(shù)據(jù)帶來的改變,媒體行業(yè)也不例外。
數(shù)據(jù)“入侵”,重識媒體
隨著移動互聯(lián)網(wǎng)的普及和大數(shù)據(jù)技術的發(fā)展,泰一數(shù)據(jù)發(fā)現(xiàn)數(shù)據(jù)技術與媒體的關系愈加緊密,在內(nèi)容素材、創(chuàng)作參考、業(yè)務探索等方面,數(shù)據(jù)技術正在“擠占”媒體人的生存空間,其表現(xiàn)在于數(shù)據(jù)在數(shù)字技術與媒體融合的過程中扮演著越來越多的重要角色。
內(nèi)容素材
作為內(nèi)容素材的數(shù)據(jù)。在今天的技術環(huán)境下,媒體信息的表達不再局限于文字,數(shù)據(jù)作為一種信息組織形式,正在被越來越廣泛的用于傳遞信息。據(jù)對媒體人的調查顯示,95%媒體從業(yè)者認為數(shù)據(jù)對于新聞創(chuàng)作具有非常重要的作用。數(shù)據(jù)已不再是數(shù)據(jù)新聞團隊專屬的創(chuàng)作素材,對于普通記者來說,使用數(shù)據(jù)進行報道正在成為一種新聞操作習慣。
*數(shù)據(jù)作為內(nèi)容素材
同時,如果能對數(shù)據(jù)進行進一步挖掘,通過數(shù)據(jù)的匯總和分析,個案之間的潛在關系被重新組織,從中也可能挖掘出另外的新聞發(fā)現(xiàn),這是普通采訪所無法達到的。通過數(shù)據(jù)查看熱點、利用數(shù)據(jù)進行新聞線索挖掘逐漸成為常態(tài)。
【應用】
2016
年,《華盛頓郵報》開發(fā)的新聞撰寫機器人
Heliograf
正式上線。通過使用記者和編輯提前制作的敘事模板,其中包括各種潛在結果的關鍵詞句,比如,“共和黨人對眾議院的控制權”,“民主黨重新控制了眾議院”,
Heliograf
將這些內(nèi)容與數(shù)據(jù)交換網(wǎng)站中的結構性數(shù)據(jù)源相聯(lián)系,并進行數(shù)據(jù)識別,與模板中的詞句匹配、整合,“編寫”新聞,同時根據(jù)不同的發(fā)布平臺提供不同版本的報道。
在國內(nèi),騰訊財經(jīng)的機器人
Dreamwriter
、今日頭條的
Xiaomingbot
等寫稿機器人同樣能根據(jù)算法瞬時輸出分析和研判,在第一時間自動生成稿件并送達用戶。
創(chuàng)作參考
作為創(chuàng)作參考的數(shù)據(jù)。移動設備正在成為最重要的媒介載體之一。據(jù)中國互聯(lián)網(wǎng)信息中心
(CNNIC)
統(tǒng)計,截至
2017
年
6
月,中國手機網(wǎng)民規(guī)模已達
7.24
億,手機上網(wǎng)人群在網(wǎng)民中占比
96.3%
?;陔娮用浇?,人的閱讀行為已經(jīng)被廣泛而準確地記錄,輿論變化和新聞熱點變化可以通過數(shù)據(jù)被更加細致地呈現(xiàn)。閱讀量、轉發(fā)率、二次傳播等數(shù)據(jù)已成為媒體量化傳播效果的重要參考指標。
【應用】
社交平臺Twitter上,一款叫做ReutresNews Tracer的工具被用來監(jiān)測隨時出現(xiàn)的各類新聞事件、檢測社交媒體信息的真實性。其功能亮點是:能夠實時監(jiān)測社交媒體上的新聞;用算法去問記者平時可能會問的問題,倒推新聞的真實性;通過算法和機器學習挑選出哪些是新聞,哪些是廣告、謠言或一般性對話,并摘出要點,同時把相同類別的新聞相疊,組成數(shù)據(jù);給記者和編輯提供可靠的素材和資源。
*ReutresNews Tracer
業(yè)務探索
作為業(yè)務探索的數(shù)據(jù)。除了素材提供與創(chuàng)作參考,對新聞數(shù)據(jù)反饋的搜集分析即輿論業(yè)務也逐漸成為部分媒體的新業(yè)務內(nèi)容。
截至目前,包括人民日報、新華社、南方報業(yè)等在內(nèi)的國內(nèi)媒體已經(jīng)開始發(fā)展數(shù)據(jù)、輿情業(yè)務。其中,人民曰報社從
2008
年開始組建人民網(wǎng)輿情監(jiān)測室(
2017
年更名為“人民網(wǎng)輿情數(shù)據(jù)中心”),南方報業(yè)集團于
2014
年成立南方輿情研究院,新華網(wǎng)網(wǎng)絡輿情監(jiān)測分析中心于
2016
年開始推出信息超市平臺一一新華“云智”。
【應用】
人民網(wǎng)輿情數(shù)據(jù)中心已擁有個性化、垂直性監(jiān)測功能的互聯(lián)網(wǎng)輿情監(jiān)測系統(tǒng),該系統(tǒng)基于網(wǎng)絡輿情傳播規(guī)律,及時、全面地監(jiān)測境內(nèi)外新聞網(wǎng)站、論壇、報刊、電視、廣播和知名博客、微博,并在此基礎上進行數(shù)據(jù)的抓取、挖掘、聚類、分析和研判,以實現(xiàn)網(wǎng)絡聲譽管理、輿情監(jiān)測、敏感信息預警、內(nèi)部風險管理評估、突發(fā)事件實時追蹤和宣傳工作評估考核等功能。
*人民網(wǎng)輿情數(shù)據(jù)中心
媒體巨變,進入“智媒時代”
先進的數(shù)據(jù)技術使全球的媒體生態(tài)都處于巨變之中,隨著媒體對宏觀數(shù)據(jù)、行業(yè)數(shù)據(jù)、地理數(shù)據(jù)、輿情數(shù)據(jù)、讀者/用戶數(shù)據(jù)等數(shù)據(jù)的掌握,使媒體生態(tài)在新聞生產(chǎn)系統(tǒng)、新聞分發(fā)平臺、用戶平臺、信息終端四個維度的生態(tài)均已經(jīng)發(fā)生變化。其中,新聞生產(chǎn)系統(tǒng)的變革首當其沖,得益于未來數(shù)據(jù)的極大豐富、算法模型的升級及人工智能等創(chuàng)新應用,這些技術將直接推動內(nèi)容生產(chǎn)由
UGC、MGC
進入更高的
IGC
發(fā)展階段。
在
UGC
(即用戶原創(chuàng)生產(chǎn)內(nèi)容)階段,微博、微信、豆瓣等各類網(wǎng)站、
APP
上的任何用戶都可以生成原創(chuàng)內(nèi)容,因此而產(chǎn)生了數(shù)量龐大但質量參差不齊的內(nèi)容數(shù)據(jù)。隨后的
MGC
(即機器生產(chǎn)內(nèi)容)階段,將大數(shù)據(jù)、計算機算法和人工智能等工具應用于內(nèi)容生產(chǎn),產(chǎn)生大量的優(yōu)質內(nèi)容,但目前而言,機器寫稿的質量及稿件的普適性依舊偏低,它們更適用于突發(fā)新聞事實的報道,但其后仍然需要專業(yè)的記者、編輯做深度挖掘和擴充。
直到進入
IGC
(即智能化內(nèi)容生產(chǎn))階段,機器在代替人類完成重復性、規(guī)范性寫作和客觀數(shù)據(jù)聚合類等工作的基礎上,通過語料、素材與數(shù)據(jù)的搜集處理與高效率加工等完成內(nèi)容生成工作,內(nèi)容生產(chǎn)者在此基礎上充分發(fā)揮人類的演繹、推理和聯(lián)想能力,從而完成更深層次的內(nèi)容生產(chǎn)。
隨著數(shù)據(jù)技術“入侵”媒體,未來人機協(xié)作的趨勢已是必然,媒體的內(nèi)容生產(chǎn)將更加智能、信息整理的效率更高、創(chuàng)作能力也將顯著提升,因此這種“入侵”未嘗不是好事。
【關于我們】泰一數(shù)據(jù)是泰一指尚(股票代碼:600070)旗下數(shù)據(jù)商業(yè)服務品牌,依托大數(shù)據(jù)技術實力及持續(xù)的產(chǎn)品創(chuàng)新,幫助客戶實現(xiàn)大數(shù)據(jù)分析與應用,建構數(shù)據(jù)價值發(fā)現(xiàn)和應用創(chuàng)新能力。