来源:《全媒体探索》2024年4月号

公民网:5个实践倾向让“媒资+AI”可行、有用、有商机_媒体_数据 智能助手

导读

主流媒体积累了几十年的媒资库是媒体机构的主要资产。
随着AI与媒体领悟进一步加深,媒资库对主流媒体领悟发展而言,或将从“有点关系”变成“性命攸关”。

如何盘活这些资产,让存量带动增量,为媒体内容精准分发、N次传播、二次创作、上线交易、版权保护等奠定根本,为“***+政务做事商务”贡献力量?本期推出“主流媒体平台化培植”系列专题研讨之三,诚邀业界同行和学界专家对智媒时期的媒资库培植进行有益磋商。

媒资库,即媒体资产仓库,涉及媒体在内容采集、生产、分发以及经营过程中积累的统统成品和素材。

当前,人工智能(AI)技能正领悟千行百业,驱动新一轮科技革命和家当变革,也将重塑媒体格局、传播办法与舆论生态。
主流媒体正积极探索将AI利用于***采集、生产、分发、吸收、反馈之中,以打造智媒体新生态,巩固壮大奋进新时期的主流思想舆论。

媒资库是人工智能时期媒体领悟发展的关键抓手

当前,各大媒体机构对媒资库培植与开拓存在投入不敷的征象。
许多媒资库培植仅勾留在将历史笔墨宣布电子化阶段,图片、音***入库数字化进程缓慢,创新开拓媒资库赋能媒体领悟发展也还勾留在低级阶段。
究其缘故原由,一是媒资库对主流媒体***主业而言并非必需品而是赞助品,长期得不到重视;二是培植、开拓媒资库须要大量资金、技能与人才投入,且无法直接带来可不雅观的经济效益。

随着AI技能的发展,这种低投入的局势有望彻底冲破。
数据是AI的燃料,是智能发展的基石。
主流媒体在***宣布与领悟发展过程中沉淀积累了海量的内容成品和素材数据,搜集大量政务数据、做事数据、商务数据,这些数据能有效支撑AI学习和演习,提高其智能水平。

有名AI研究机构EpochAI的一项研究估量,随着AI技能发展,到2026年,高质量的数据将变得稀缺,2030—2050年低质量数据也将花费殆尽。
在国外,《纽约时报》等多家媒体起诉天生式AI运用ChatGPT的开拓公司OpenAI“未经授权,利用已揭橥的***作品演习天生式人工智能运用”。
美国有线电视***网(CNN)、美联社、福克斯(Fox)、《时期》杂志(Time)也与OpenAI就内容授权演习AI运用事宜进行了多次会谈。
这从一个侧面解释,媒体数据优质、丰富、稀缺,而且运用处景与市场十分广阔。
以这些数据为根本建立的媒资库,不仅是媒体机构主要的资产,更是媒体机构捉住AI发展机遇,赋能建立“***+政务做事商务”运营模式,推动媒体领悟向纵深发展的关键抓手。

随着AI与媒体领悟进一步加深,媒资库对主流媒体领悟发展而言,或将从“有点关系”变成“性命攸关”。

(一)媒资库是智能生产和传播的根本

媒资库将全面赋能媒体智能生产和智能传播,推动媒体智能化进入快速发展阶段。
当前,以ChatGPT为代表的AIGC(人工智能天生内容)运用平台发展迅猛。
行业普遍认为AIGC将成为继专业生产内容(PGC)、用户生产内容(UGC)之后新的内容生产模式,广泛运用在内容生产的各个领域并且替代了部分人工创作。

媒资库是媒体AIGC的根本,AI***写作、AI绘画、AI***天生、AI虚拟场景天生等AIGC运用均离不开AI对媒资库数据的学习和演习;AI审核、媒体宣布精准传播、传播效果精准评估等也离不开AI对媒资库数据的数据挖掘和预测剖析。

(二)媒资库数据决定媒体智能做事

随着AI技能领悟千行百业,媒资库里面拥有的数据类型和数量,将决定主流媒体供应智能做事的类型与水平。
AI时期,没有数据,主流媒体就很难有智能做事,影响力和竞争力也会打折扣。

例如,当前不少主流媒体针对政务做事建立了网络问政互动及诉求反响平台,包括公民网“领导留言板”、新疆日报“石榴云12345问政”、四川日报“问政四川”、河北***网“阳光理政”、华龙网“重庆网络问政平台”等,这些平台所积累的政务数据和运营履历,将造就主流媒体面向政务做事的AI能力。

媒资库在人工智能领域的运用探索

AIGC平台的迅猛发展为创新开拓媒资库供应了方向指引。
当前,主流媒体在AI领域探索开拓媒资库紧张包括以下几个方向。

(一)主流代价语料库

AI大脑既是高科技的大脑,也是代价不雅观的大脑。
AI平台有态度,AI天生的内容有导向,其导向实质上是由AI学习的数据语料和算法决定的。
例如,ChatGPT被指“充满西方意识形态和美式政治精确”,根源是美国硅谷和科技界本来便是美国代价不雅观的大本营,ChatGPT演习与学习的数据大多来源于西方的数据,产品当然自带西方意识形态。

在推进媒体领悟过程中,主流媒体不能一味采取、入驻商业企业的AIGC平台,而是要特殊关注喂养AI的语料数据和模型算法本身的导向。
公民数据发布的《AI大模型综合能力测评报告》显示,海内主流大模型在内容生态方面的表现仍有一定提升空间,一些大模型对敏感话题做出了不同程度的规避,部分回答内容情绪色彩较重。
这从一个侧面上反响出,当前市场上主流代价语料库稀缺,无法为大模型学习演习供应支持。
主流媒体作为巩固壮大主流思想舆论、扩大主流代价影响力的主力军,须要创新媒资库、建立主流代价语料库,进一步发挥在AI时期守护意识形态安全的代价。

例如,针对大模型普遍回答不了、回答不好的重大、敏感、疑难问题,公民网动员全体员工、搜集各方资源,培植包括根本语料、重点领域语料、敏感问答语料在内的“主流代价语料库”,目前已完成12万道题的问答语料库、16个重点领域语料库、超300亿字的根本语料库的培植,实现与多个国产主流大模型的集成对接,大幅提升了其安全水平。

公民网“主流代价语料库”

(二)行业运用大模型

媒体创新领悟发展路径可以从三个层面展开:一是媒体内部的领悟,也便是传统媒体与新兴媒体的领悟;二是媒体与媒体之间的行业领悟;三是媒体与统统行业、家当的领悟,让媒体在与各个行业的深度领悟中壮大。

主流媒体通过行业宣布以及行业内容运营业务积累了大量高质量行业数据,可以转化为行业垂直大模型演习的优质语料库数据,能为开拓行业垂直大模型、推动家当领悟供应数据与技能支撑,为下一步推进行业、家当的领悟打下根本。

例如,公民网研发的“公民智媒大模型”为国家地震局供应地震知识科普问答应用。
该运用基于地震科普类图书和干系规范标准文件的学习,有效提升在地震根本知识、地震磨难防御、地震应急接济和地震预警及应对等方面的知识科普效率。

(三)内容风控运用

AI时期,信息无处不在、无所不及、无人不用,智能内容风控拥有广阔的运用处景。
媒资库的宣布成品内容,一定程度上是主流媒体内容审核把关能力与履历的表示。
通过AI技能学习和演习这些数据,可以研发内容风控运用,全面延伸主流媒体意识形态把关能力。

公民网“公民审校”系统

例如,公民网推出的涉政内容智能审核平台“公民审校”,以公民日报媒资库为核心数据,基于公民网独家资源和资深编辑的内容把关履历,构建涉政知识数据库,具备涉政文本审核、视觉内容检测等智能风控模块,可以实现在线检测、文本审校、图片审校、***审校、自定义词库等多功能。
目前,“公民审校”已为300多家客户供应内容把关和巡查做事。
随着AI大模型的进一步发展,“公民审校”将助力审核AI演习的数据语料、天生内容、线上课程等内容。

(四)智能文稿创作运用

媒资库里海量的政务数据,例如时政***宣布、领导讲话稿、政策文件、官方报告等内容,奠定了主流媒体在党政文稿方面的智能创作能力。
在开拓智能文稿创作运用方面,媒资库拥有两大不可替代的上风:一是数据来源于主流媒体宣布,确保了AIGC的政治方向、代价取向和舆论导向;二是原始数据的写作逻辑、语句语序等契合党政机关、奇迹单位及国有企业的运用处景。

例如,公民日报社主管、依托公民网培植的传播内容认知国家重点实验室推出的人工智能写稿秘书“写易”创作引擎,通过AI演习学习符合我国主流代价不雅观的数据集和媒体语料库,内容涵盖政治、经济、文化、社会、生态、党建、国防、外交等重点领域,保障天生内容安全,着重为党政机关、奇迹单位、国有企业供应优质安全的智能创作做事。
目前,“写易”已为多个党政机关和大型国企供应运用做事。

人工智能写稿秘书“写易”

(五)人工智能检测

随着AI技能进一步与内容行业领悟,AIGC迎来发展新阶段。
与之伴随的内容侵权、网络钓鱼、深度假造、虚假信息等风险寻衅引发广泛关注。
媒体宣布是AI内容天生平台数据演习学习的主要来源。
通过AI技能学习演习干系数据,推出针对性的智能检测产品,可以起到保护版权、掩护内容安全的浸染,在内容安全、版权保护方面有广阔的市场运用前景。

公民网深度合成内容检测工具AIGC-X

例如,公民日报社主管、依托公民网培植的传播内容认知国家重点实验室推出的“AIGC-X”运用,可快速区分机器天生内容与人工创作内容,对中文文本检测的准确率已超过90%。
下一步,AIGC-X将扩展为对AI天生文本、图像乃至***的通用智能识别模型,为统筹AI安全与发展贡献力量。

进一步创新开拓媒资库

AI与媒体深度领悟,重塑媒体格局和舆论生态已是大势所趋。
主流媒体对媒资库开拓要超前布局、创新实践,捉住AI发展的机遇,赋能媒体智能化转型,推动媒体领悟向纵深发展。

(一)积极丰富媒资库

数据媒资库优质数据的广度决定了在AI领域创新开拓的深度。
除了传统媒体历史宣布与素材数据之外,以下数据可以重点考虑。

一是AI数据。
当前,AI与媒体领悟进一步加深,主流媒体内容生产效率与质量得到大幅提升。
未来,由AI天生的数据呈现爆发态势,许多媒体内容将来源于AI。
因此,可以将海量AI天生数据补充到媒资库中。

二是行业数据。
主流媒体在探索建立“***+政务做事商业”经营模式的过程中,要留神对行业数据的积累、挖掘,形成各种行业数据库,提升媒资库的深度和广度。

三是互联网数据。
通过开放互助,主流媒体可以定向采集互联网干系数据,拓展媒资库的数据量。

(二)推进智能媒体资源库培植

媒资库培植不能仅勾留在笔墨宣布电子化阶段。
要将笔墨、图表、图片、音***宣布和素材数字化、智能标签化,实现海量数据数字化存储、多模态搜索与精准管理。
同时,建议对各种数据进行洗濯、提炼与分类,形成各种专业数据库,为媒资库创新开拓做好准备。

(三)加速媒资库在人工智能领域的创新开拓

媒资库是媒体机构优质、稀缺的数据资产,但如不创新开拓利用,仍旧只是“历史档案”,无法表示其数据代价。
因此,建议主流媒体积极创新开拓媒资库,通过技能的引入,持续赋能媒体内容生产、智能传播及经营运营剖析。

此外,还可以通过对外寻求互助,共享和开放媒资库,畅通数据资源大循环。
要超前布局,先行先试,在利用中积累数据和履历,在利用中完善媒资库,为媒体智能化转型与领悟发展供应支撑。

(作者为公民网研究院研究员)

本文刊于《全媒体探索》2024年4月号,原标题为《人工智能时期创新开拓媒资库的探索与建议》,参考文献略。