第三节 新媒体数据新闻的生产流程

杂乱无章的数据信息是不能被受众理解的,也无法被广泛应用,这就需要对数据进行专业化处理,然后选择一种受众易于接受的方式进行呈现。新媒体数据新闻的本质是对海量数据进行处理,提取隐藏的关键信息,并将其转化为“新闻故事”。数据处理、呈现的过程以数据为主、文字为辅,根据数据之间的关系,以可视化手段呈现事件的发展、关系,使受众能够解读出数据背后的意义,发挥虚拟数据的实际功能。除此之外,选择合适的制作方法、发布方式对新媒体数据新闻的呈现效果与传播也至关重要。本节将从选题与策划,数据获取、预处理与分析,数据可视化与可视化叙事和数据新闻制作与发布几个步骤简述新媒体数据新闻的生产流程。在后续各章中除剖析一些典型案例外,在实践应用中也会围绕数据新闻作品——《中国城镇化的单身困境》,对每一个环节的理论和技术实现进行详细阐述。

一、选题与策划

1.新媒体数据新闻的选题

新媒体数据新闻选题的确定是数据新闻生产流程中的关键环节,奠定了数据新闻生产的大致方向。数据新闻的选题及其价值判断可通过选题的新闻性和价值性两个方面来完成。

是否具有新闻性是判断选题好坏的重要因素之一。好的选题需要与社会现状、重大问题等具有现实意义的热点紧密联系,应建立在正确反映社会现实的基础上。同时,选题的新闻性中也包含了时效性的要求,选题的时效性在很大程度上影响着读者的阅读兴趣。而选题的价值性在于能通过数据对现象的反映,推动社会向前发展。有价值的选题能揭露数据背后折射出的社会问题,并能够发人深省,具有深远意义。

2.新媒体数据新闻的策划

新媒体数据新闻的策划既包括对拟定选题的具体新闻内容框架的设计,也包括对该项目实施的具体分工、时间规划、资源统筹等具体实践层面的事务的处理。新媒体数据新闻的生产往往需要多方合作,提前规划内容、制订详细计划是必不可少的流程。

首先,设计数据新闻的框架结构是生产一个优秀数据新闻作品的前提。数据新闻的框架设计重点在于内容板块的规划。内容板块规划是做好新闻叙事的关键,也是讲好新闻故事的关键。内容板块的确定既要前后具有逻辑性,又要层层深入,以便更清晰地表达主题。

其次,组建一个具备新闻采编、数据处理、美工设计、媒体运营能力的人才团队也是数据新闻制作的关键。提前规划时间、制订分工计划,才能在确保数据新闻质量的同时保证新闻的时效性。统筹内部、外部资源,拓宽数据来源的同时保障信息的准确性,使数据效用最大化。最后,通过战略合作达到优势互补、促进新媒体数据新闻的全媒体传播。

二、数据的获取、预处理与加工及分析

1.数据的获取

新媒体数据主要指在互联网和移动互联网等新媒体环境中,媒体资源内容生产、管理、运营以及用户参与、应用过程中所产生的数据集。新媒体数据来源丰富,可分为网络数据库大数据、网络社交大数据、网络行为日志大数据和网络舆情大数据等4种数据来源。

目前数据获取方式也非常多元。国家统计部门就有大量可靠的公开数据资源,新闻从业者可以通过官方网站查询下载。互联网部门及专题网站数据有大量专题数据,如国家互联网信息办公室、中国互联网络信息中心等提供的数据属于互联网官方部门数据,中国互联网协会、中国互联网金融协会等提供的数据为互联网行业部门数据。系统日志采集是较为直接可靠的数据获取方式,许多公司的业务平台每天都会产生大量的系统日志数据。系统日志数据可以通过第三方平台获取,如CNZZ数据专家网站。Web数据抓取能够快速、批量地从网站上提取信息。Web数据抓取程序模拟浏览器的行为,能将可以在浏览器上显示的任何数据提取出来。Web数据抓取的最终目的是将非结构化的信息从大量的网页中抽取出来以结构化的方式存储。八爪鱼采集器是比较简单易学的Web数据抓取软件。

2.数据的预处理与加工

一般所获得的原始新媒体数据会存在数据被篡改、不完整、重复等数据异常情况,即存在“脏数据”,并不能直接使用。因此,需要通过数据清洗、集成、变换、归约等步骤对所获得的原始数据进行预处理。

完成数据预处理之后就可以正式进入数据的加工环节,数据加工包括数据合并、数据修正、公式计算等。数据预处理与加工都是基础步骤,主要是为后续数据分析和可视化服务。

3.数据的分析

数据的分析是数据新闻生产的核心步骤。通常可以用Excel、SPSS、Python、R语言、Tableau等工具进行数据分析。按照难度和数据探索程度,数据分析可分为描述性分析、探索性分析等类型。

数据的描述性分析包括对平均值、中位数、众数、方差、标准差等进行计算,以及基于此的对比分析、交叉分析等。目前,大量的数据新闻作品都是围绕数据的描述性分析而展开的。数据的探索性分析和验证性分析属于高级数据分析,包括相关分析、因子分析、回归分析等内容,侧重于验证已有假设的真伪,在数据中发现新的特征,以及对未来进行预测。

三、数据可视化与可视化叙事

1.数据可视化

数据可视化是指通过图形、图表以及动画等手段直观、生动、形象地展示数据。它囊括了信息可视化、知识可视化、科学可视化以及视觉设计方面的进步和发展,经历了图形符号、数据图形、多维信息的可视化编码、多维统计图形以及交互可视化等阶段。

数据可视化的主要目的在于借助图形化的手段,清晰有效地传达与沟通信息。总的来说,数据可视化的意义可分为三点:更快获取数据、获取更多数据、更深入理解数据。

按照视觉形态的动静差异可以将数据可视化分为静态与动态两类,其中静态类型以信息图表为代表,动态类型又可按照是否有交互操作分为动画视频与交互图表两类。数据可视化是新媒体数据新闻的核心竞争力之一,恰当的数据可视化可以使数据新闻作品脱颖而出。

2.可视化叙事

西蒙·罗杰斯曾在书中谈到自己对数据新闻的理解:“数据新闻不是图形或可视化效果,而是用最好的方式去讲述故事。只是有时故事是用可视化效果来讲述。”这说明了“讲述故事”仍应为数据新闻的核心理念,同时,从新闻的核心——建构意义的角度出发,数据可视化应服务于新闻叙事。

可视化叙事相比传统的文本新闻叙事更能向读者呈现新闻事件内在的逻辑联系和关联程度,更具有时空穿透力和感染力。可视化叙事从空间、时间、关系等维度丰富了传统的文本新闻叙事。但数据可视化并不是简单地将数据进行加工、图表化呈现,优秀的数据编辑不仅需要对新闻事件的全貌了解透彻,还必须清楚每个子新闻事件的内在逻辑联系,才能选用合适的可视化方式构建新闻事实,力求呈现真实、准确、深刻的新闻意义。杰出的数据新闻可视化叙事能在传统的新闻叙事基础上为读者构建场景化新闻事实,同时体现时空穿透力和感染力,更易引发读者产生共鸣和深思。

四、数据新闻的制作与发布

1.数据新闻的制作

数据新闻的制作是整合文字、图表、视频、音频等元素,使其成为叙事完整、风格统一的数字化新闻作品的过程。

随着开源软件的不断出现,完全没有编程知识的记者也可以十分轻松地制作很复杂的数据可视化作品。例如Tableau、Data Market、Many Eyes是目前常见的制作数据新闻的软件;iH5、易企秀等是常见的制作并发布数据新闻的网站。除此之外,还有很多功能更加细化的软件,如专门制作时间类作品的Dipity。

2.数据新闻的发布

数据新闻作品制作完成后可通过移动端和PC端集成发布。iH5、易企秀发布平台以H5制作见长,这也就决定了这类平台制作的数据新闻作品更适合发布于移动端,用户通过滑动或翻动界面获取数据,通过动态交互图表、视频等了解详情,数据新闻在移动端的交互感比在PC端更强。相较于移动端,数据新闻在PC端传播过程中用户黏性较低,且PC端数据新闻以媒体转发为主,与普通用户互动较少。

数据新闻发布过程中,各大网络平台之间的联动转发也十分重要。微信是我国网民使用率非常高的移动端软件,但是数据新闻送达率与二次传播率反差显著;微博与用户互动便利,但浏览、点赞、转发、评论量高的大多为热点新闻;同时,关键节点在数据新闻传播链中所处位置极为重要,对数据新闻传播效果有很大的影响。

在大数据时代,要想做好数据新闻报道,需要新闻从业者与时俱进,更新新闻理念,积极学习新兴技术与技能,增强用户黏性,加强互动传播;完善交互式设计,扩展多维链式传播广度;深度追踪热点问题,引发多级点传播;把握关键节点位置,拓展传播网络。