数据富足与数据内核

在刚结束不久的2021年CSM长三角客户年会上,参会嘉宾就跨屏测量、媒体融合等研究热点展开了热烈讨论。同时CSM就全新推出的全媒体视听同源测量NEW TAM的体系构建、数据发现及应用意义作出了详细介绍和相关展示,并获得了业内同行的广泛关注和高度认可。日前,ARC(受众研究中心)对CSM媒介研究董事、总经理丁迈进行了专访,关于在多元复杂的传媒生态环境下,如何解决数据孤岛,如何构建共融共生的评价体系、以及CSM在构建融合测量体系方面取得的进展等行业内颇受关注的问题,大家可以在这篇专访中寻找到答案。






我们现在已经进入数据供过于求的时代,但在数据的应用上还面临着诸多难题。数据在“新基建”中具有何种作用?对于视频生态来说,数据的价值体现在何处?数字生态发生了何种改变?如何解决数字孤岛?本期访谈对话中国广视索福瑞媒介研究有限责任公司(CSM)董事、总经理丁迈,就上述问题进行探讨。



图片

嘉宾:丁迈

中国传媒大学传播学博士,曾任中国传媒大学教授、博士生导师,在应用统计学、定性定量研究方法、数据处理与分析技术、测量体系以及传媒市场研究等领域具有高端专业知识,多部论文和专著屡获省部级和行业大奖。主导构建融合媒体数据云平台V+Scope,研发省级电视台融合传播指数、全国短视频用户价值研究报告等重量级新产品,推进全媒体视听同源测量项目实施落地。



1、2018年底,中央经济工作会议首次提出“新基建”的概念,主要目标是加强人工智能、工业互联网、物联网等新型基础设施建设。在您看来,我们应该如何看待数据在其中的作用?



进入2020年以来,新基建成为我们国家自上而下都在努力发展的新理念。所谓新基建,主要指的是新型基础设施的建设,其中包括信息基础设施建设、融合基础设施建设和创新基础设施建设。我们所熟悉的5G基站建设、数据中心建设以及关于AI和人工智能的发展等等,这些都属于新基建的一部分。




在这一背景下,2020年4月国务院发布了《关于构建更加完善的要素市场化配置体制机制的意见》一文,文件中首次将数据和土地、劳动力、资本、技术并列,称之为新型生产要素,同时也提出要加快建设数据这种新型生产要素的发展。这意味着目前关于数据的开发和利用已经成为一个非常重要的领域。我们可以通过一组数字来了解数据开发的重要性:2015年整个人类社会生产的数据是12ZB,是人类过去历史上产生的数据量的总和,并且从2015年的预测来看,2015年之后人类社会的数据量会以40%—50%这样的比例逐年增长。根据2020年中国信息通信研究院的大数据白皮书,截止到2020年,人类社会所生产的数据总量已经达到42ZB,这个增长的比例已经超过了当年的预测。所以说,我们现在身处的时代,是一个数据富足的时代,我们需要数据来驱动未来的发展。




虽然大家都明白整个社会的数据量已经极大丰富了,但是从另一方面来看,数据的富足与增长是不是给我们带来了更多的数据价值?实际上并没有很好的体现出来。2015年,在整个由人类生产的12ZB的总体数据中,只有9%的信息是以结构化数据的形式保存在数据库中,能够被人类所利用,其余数据信息都被浪费掉了,没有得到很好的开发。到2020年,这个情况稍微好一些,但是结构化数据的占比也只有16%,这意味着大量的数据等待社会去挖掘它们的价值。同时我们也知道,数据存储耗资巨大。所以目前存在的一个主要矛盾是:日益增长的数据存储费用、资源损耗与数据价值挖掘之间的矛盾。回到我们这个主题,无论是智能系统的开发还是数据中心的建设,如何更好地挖掘数据价值?如何利用数据驱动产业发展?这是未来新型基础设施建设所无法回避的问题。




2、 具体到电视产业/视频生态来说,可挖掘的数据价值主要体现在哪些方面?



对于整个传媒行业而言,数据的价值主要体现在两个方面:首先是数据驱动内容。目前,传媒行业的数据实际上是伴随内容增量实现了增量传播的价值。比如我们个人除了会看电视直播之外,还可能会收看IPTV和OTT智能电视,也可能会在爱奇艺、腾讯、优酷等网络平台上收视。在小屏端,短视频可以对长视频进行切条处理,内容显然相较于以前已经实现了增量传播,我们在消费这些内容增量的同时也会时时刻刻留下自己的数据。我们所面临的问题是,在内容增量面前,如何利用数据来证明内容增量的价值,如何辨别这些增量中哪些是可以深入挖掘和借鉴的,这些都是需要深入探讨的问题。


另一方面是数据驱动营销。我们都说要把观众变成用户,观众用户化之后,内容增量也相应地实现了,而如何利用数据帮助营销升级是目前传媒行业所面临的关于数据价值挖掘的主要问题。目前的解决办法主要还是在做内容加法以尝试更多的营销空间,例如电视在做电视+,可以在电视端加入互动平台、长视频平台和短视频平台等;又例如互联网也在做互联网+;社交媒体也是一样,微信推出的视频号,其实也是一个内容加法的举措。



3、在视频内容跨平台传播的今天,数据生态也在改变,您能介绍一下目前家庭大屏收视数据的分布情况吗?



以家庭大屏收视为例,现在的视频内容依据传播渠道可以分为有线电视、IPTV、智能电视等等,此外还有我们长视频平台和短视频平台的内容,但我主要介绍前面三种渠道的数据形态分布。


从有线电视来说,全国大约有2.07亿有线电视用户,其中有些是单向网,有些是双向网。所谓单向网是指无法互动,只是从上到下的单向信号传输。所谓双向网就是可以实现点播及传输互动行为。而所有有线电视的双向网络,都会自动记录大家的收视、点播及回看行为,并进行回传。传统上说,有线电视所产生的数据归各省的有线运营商所有,由他们来运营自己当地的有线电视网络。但我们也看到,2020年10月,中国广电网络股份有限公司在北京正式成立,主要目标就是要把全国的有线电视网整合成一张网,同时推动广电网络的5G建设。所以有线电视的数据网络未来也将可能成为全国网。


从IPTV来说,全国的IPTV用户有3.07亿,其用户量已经超过有线网的用户量了。IPTV也实现了点播和回看,可以说它是一个完全互动的宽带网络。IPTV的运营构成可以分成两部分。运营网络的内容提供者主要是广播电视部门,各省广电可以被认为是分播控平台,分播控平台之上,还有一个总播控平台——爱上电视,这是它们主要的网络运营商。爱上电视传媒有限公司是由中国网络电视台(出资方:央视国际网络无锡有限公司)与上海广播电视台(出资方:百视通技术公司)联合投资设立的IPTV合资公司。所以IPTV数据也相应被分为两大部分:一部分叫EPG数据——节目数据,这部分数据会跟各省的电视台去共享,跟我们的广电部门进行互通。另一部分数据叫流量数据,这部分数据主要由中国移动、中国联通、中国电信、爱上电视等服务提供商进行共享。


从智能电视来说,智能电视每一个品牌方都有自己的数据,因为各品牌方只要在智能电视里做个APK,它的数据就能传回来。例如,有人家里买了台创维电视,创维电视的所有数据都会回传到该电视的品牌方那里。同时,传统电视往往需要搭配OTT盒子(也称互联网盒子)进行使用,例如小米盒子、天猫盒子等等,所以OTT盒子也有一套数据。如小米盒子、天猫盒子的数据就掌握在各自的运营商手里。再比如我们看到的爱奇艺的银河奇异果,腾讯的云视听极光等等,都有自己的一套数据。



4、目前各自分立的媒体数据格局被形容为“数据孤岛”,您认为数据孤岛的形成对市场影响如何?未来会有哪些可能的解决方案?



上述所有的数据确实都是一个个数据孤岛,各个数据平台之间是有相当隔阂的。一方面这种数据孤岛存在于各个品牌商、运营商、广电部门以及电视台之间。因为大家都明白这个时代数据的价值,同时还存在一定的商业竞争关系,谁也不愿意主动分享数据。另一方面,这种数据孤岛甚至存在于企事业单位的各个部门中,例如一家省级电视台想拿到IPTV数据不一定可行,要看IPTV数据在省级运营商中由哪个部门分管。同时,IPTV和有线电视的数据管理部门也很难共享数据。


所以,现在行业中的数据非常多,但更像是一个个封闭的王国。目前,大部分公司还处于数据的加法增长阶段,少部分公司进入数据的指数增长阶段。在指数级增长后,公司的主要矛盾将成为日益增长的数据存储费用和仍然稀缺的数据应用之间的矛盾。这种数据富足和数据孤岛并存的状态所带来的问题是,数据价值在市场中的不断贬值,这稀释了管理者对于数据市场价值的认知。换言之,数据随处可见,而又标准各立,大家会发现好像在面对这些数据的时候有些无所适从的感觉。因为一套数据体系各用一套标准来衡量,没有全国乃至世界统一的一个标准,在这种情况下数据的市场价值就很难真正去衡量了。


解决这个问题的主要方案是建立一套权威、标准的数据标准体系,实现跨平台的数据统一,这也是目前数据市场所面临的难题。从目前来看,我国媒体融合的方向主要还是在尝试做内容的加法,打通产业链;大屏电视、长视频平台、短视频平台以及具有社交媒体属性的互动平台都在互相布局。微信推出的视频号功能,西瓜视频尝试做中长视频的思路,都是内容加法的一种应用。所以,未来的媒体生态其实是一个共生共荣的内容生态。那么,我们的数据生态也就是评价体系如何呢?如下图所示,左边是CNNIC发布的第46次《中国互联网络发展状况统计报告》的数据,其中网络应用包括即时通讯、网络视频、音频、短视频、网络音乐、网络直播、游戏、在线教育、网络新闻、网络文学和其他。右边是2020年上半年CSM所有调查城市当中各类节目的收视比重,其中包括整个电视媒体的三大支撑:综艺、新闻及电视剧,其次还包括生活服务专题、青少电影、体育等。大家一般引用的大屏端数据是CSM的,互联网端数据是CNNIC的,但这两套数据是完全没关系的。换句话说,这两套数据的评价内容是共融共生的,但评价体系却是分裂的。所以,我们不仅需要建设一个共生共荣的内容生态,也要建设一个共生共荣的评价体系。



图片

▲图1. CSM媒介研究网络端与电视端的评价体系


来源:中国广视索福瑞媒介研究(CSM)




5、近年来互联网发展势头强劲,广告也随之转移,中国电视面临前所未有的冲击,有人甚至做出“电视已死”的断言,您对此有何看法?在这个背景下应该如何构建一个共融共生的评价体系?



我们在讨论这个问题的时候,不可否认的是传统广告市场中有一半的份额被互联网广告所取代了,大量的广告流向互联网。但是,如果我们仔细考察广告效果就会发现,广告效果的主要目标是要求服务商在合适的时间把合适的内容以合适的方式高效投放给合适的人,那么有没有研究能够说明互联网广告相较于传统的广告方式更精准、更有效?事实上,目前仍然没有基础研究能够说明广告在不同平台投放时,究竟产生了什么样的效果,以及产生效果的作用方式。从广告效果层面来说,我们可以分为认知效果、态度效果、行为效果,还可以分成品牌效果与转化效果,不同平台所产生的广告效果侧重点如何,这些实际上都还是未知数。




这是因为至今未止还没有基于同一标准、统一水平的比较。刚刚我们谈到在整个内容评价的过程当中,评价标准是各自分立的,广告评价也是一样,传统媒体的广告和互联网媒体的广告从来没有放到过一起进行比较。所以我们有一个观点,广告逐渐流向新媒体,实际上是新媒体话语体系在这个过程中发挥了非常重要的作用。互联网带来的一套新的话语体系,大家都比较熟悉,比如月活跃用户、日活跃用户、点击量、转发量、评论量等等。互联网的这套话语体系目前在市场上占了上风,而这套强势的话语体系对于营销的影响是非常大的,它直接影响了整个广告投放的走向。




实际究竟如何呢?当我们试图将电视收视数据与互联网视频消费数据放到一个维度上去比较时,就可以看出端倪。以一个数据为例,2020上半年,传统电视行业的日人均收视时长是146分钟,日人均观众收视时长是286分钟。前者以全国电视用户为分母,后者以有电视收看行为的观众为分母,这是二者的区别。虽然电视行业的数据正在逐渐下滑,但这两年日人均观众收视时长还是保持着250分钟以上的较为稳定的趋势,尤其在疫情期间,乃至复工复产后,这个数字还有所抬头。对比互联网数据,根据CNNIC在2020年9月发布的第46次《中国互联网发展状况统计报告》,网民周平均上网时长为28小时,日均上网时长为4小时,也就是240分钟。从视频消费的角度来说,与收视有关的时长主要包括:网络长视频消费12.8%、网络短视频消费8.8%以及网络直播消费7.3%,总计28.9%。换算成时长大约为70分钟。网民日视频消费的时长应该与电视日人均收视时长进行对比,因为调查总体分别是我国全体网民以及全体电视用户。所以如果满足相同标准,考虑观众的相同需求,我们的视频消费究竟在哪个平台上消费时长更占优势,实际上仍然是电视大屏。




其次,在计算口径上,互联网内部与电视界也有所不同。互联网月活的概念是以账号为统计单位的,而且活跃的标准判定也有所不同,有的平台消费3秒以上才算活跃,有的平台登陆就算活跃。对应过来电视端就是到达的概念,在电视到达率的定义中,认为收视一分钟才可被视为一次到达,从到达人数来说,CCTV1的月到达人数是7.5亿,CCTV6是6.9亿,这样的观众规模转化成月活跃用户也是相当可观的。所以总体来说,我认为我们需要将这些数据放在一个标准上去比较。首先是计算口径标准的统一,我们需要一个统计口径来进行数据比较;其次,我们需要考虑在跨屏条件下,到底应该建立一个什么样的标准去进行数据评价,把所有的媒体形式放到同一个框架下去比较,这个标准才是我们在数据富足时代的一个核心价值。所有选手都在一条跑道上竞争,这样的营商环境才是更公平的。




6、传统电视大屏端的测量以抽样数据为主,互联网测量则主要生产大数据,这两种方法和两类数据各有什么特点?



在数据逻辑层面,大屏端的抽样调查一直备受诟病,很多人认为抽样数据量级有限,在社会现实环境中使用大数据比抽样数据更好、真实性更高。但实际上在现实环境中,抽样数据更能说明问题。


首先,以往统计学的书上总有一个关于抽样调查的例子。假如我们面前有一碗汤,我想知道这碗汤的味道,就拿一勺来尝尝,如果这个汤均匀的话,我就能够知道整碗汤的味道到底怎么样,也就是说我们可以实现从样本推及总体这个过程。但是就大数据来说,刚才提到了几套大数据系统,IPTV、OTT智能电视等等。以IPTV为例,主要有三个数据源构成:中国联通、中国电信和中国移动。这三个数据源可以理解为“三碗汤”,他们彼此之间是一个孤岛,数据是不交换、不统合的。很多书上说大数据是全量数据,但实际上我们根本拿不到整个网络中的全量数据,现实环境中我们能够拿到的只有自己的存量数据。除非能够统合这“三碗汤”,这才是一个真正的全量数据。现在大数据的问题在于市场中没有全量数据,都是数据孤岛,我们很难了解一个市场的消费全貌,这是大数据的一个问题。


其次,所谓大数据采集的全部都是设备数据,也就是说他没有办法到“人”这个维度,这是它的第二个问题。


再者,大数据处理过程中存在很多“噪音”。一方面是监测环节的问题,比如说我们晚上关了电视,但是没有关盒子,盒子会一直记录数据,所有数据一直持续记录着,停留在最后一个收看的频道上,数据系统里会有一个停止记录的标准,但各家标准不一。这实际上是抽样误差和非抽样误差的问题,在大数据系统中,非抽样误差是更大的。另一方面,大数据在数据处理或是数据回传过程中通常会有bug产生,类似的情况非常之多。当然,抽样数据和大数据有各自解决问题的优势,抽样数据其实更适合去解决结构性问题,比如在一个市场中,我们想看看观众构成是什么样的,那么通过抽样数据就可以很有力的说明这一点,而大数据则更适合应对长尾问题。


关于收视率的抽样调查,好处在于有一套国际通行的标准,也就是国际通行的关于收视率的操作流程和标准。这在漫长的历史过程中逐渐形成了固定的操作流程:从基础研究的抽样设计——组建样本户——确定样本户——培训样本户——定期维护、轮换样本户——数据采集。这种通行标准的好处在于具有可比较性,不仅确保在国家体系内可以比较,同时在国家之间也是可以比较的。例如2020年上半年疫情期间,我们就做了中国、西班牙、土耳其、英国、斯洛伐克和巴西六国收视率的比较研究。



图片

▲图2. 疫情影响下的全球电视观众收视行为变化


来源:中国广视索福瑞媒介研究(CSM)




上述比较也说明了为什么当我们用互联网大数据来统合电视端收视率数据时,总是觉得不太适合。反过来,我们需要去思考的是能否用电视收视率的这套话语体系来统合互联网。其实收视率能够作为广告商和电视台进行结算的货币,就是因为有这么一套世界通行的标准。到目前为止,关于解决融合数据问题,国际上还没有一个最先进的、大家都认可的结论。




7、跨屏测量和数据融合的方法及标准的建立,是一个世界性行业难题,目前国际上的最新进展如何?



在当今大数据时代,大数据还不能代替总体,学界和业界的共识是大数据下抽样仍然是必要的。国际上对于大数据环境下的测量方法做了很多创新,也取得了一定的成果,如对于视频内容多屏受众的测量,目前国际上仍以基于抽样技术的受众测量为主流,通过建立小样本的固定样本组,辅之以通过植码或水印测量技术获取的全量大数据,运用大数据算法,将来自固定样本组的抽样数据与跟踪监测到的全量大数据进行数据整合,对抽样数据进行校正,尽量还原收视率不高甚至为零的长尾节目的受众观看行为,保证数据的精确性和可靠性。



8、媒介融合在我国正如火如荼地进行,形成了多元复杂的传媒生态。关于融合测量体系的构建,广视索福瑞(CSM)有哪些新进展?



以前,我们能够去学习借鉴世界的先进经验,比如收视率测量的相关标准就是从国外引进的,但是今天,中国的媒体融合远远走在了世界的最前列,全国都在轰轰烈烈地进行着媒体融合,包括我们现在的很多政府机构,比如说检察院、司法单位,他们也都在社交媒体上有社交媒体号、短视频号等等,都在通过各种各样的融合形式传播声音。这种复杂的媒介生态使得我们在数据评价过程中没有太多的国外经验可以借鉴,只能用自己的方式来解决跨屏测量的问题。


广视索福瑞目前主要还是通过收视率测量的方式来兼顾其他家庭大屏数据。我们通过对测量仪接口的改造来识别内容来源,以区分有线电视、IPTV、智能电视和OTT盒子(也称互联网盒子)几种渠道。我们已经把所有的这些内容来源都整合到我们的测量仪当中,这使得来自各个平台的数据都可以在我们的系统中进行测量、计算分析和发布。


可以给大家介绍一下截止到2020年上半年的数据:2020年上半年,来自IPTV点播平台的收视份额占比是7.93%,而来自OTT智能电视点播平台的收视份额占比是9.35%。这两个数字看似不大,但实际上,如果与我们传统的五大卫视(湖南卫视、东方卫视、浙江卫视、江苏卫视和北京卫视)进行比较,它们的综合电视直播收视份额是14.67%,就会发现IPTV和OTT智能电视的收视份额其实已经达到了一个可比的水平,而且前者的数据还在逐年上涨。正因为如此,广电部门现在也要重新布局自己的基础设施建设,包括5G网络的建设等等,传统有线电视的频段资源已经不占很大优势了。这是我们在大屏端所做的一个跨平台、标准化、全场景的数据体系。当然,跨平台、全场景是指跨越电视直播、电视点播的平台,标准化是说我们把监测数据全部都放在同一个体系下去计算的一套数据体系。



图片

▲图3. CSM媒介研究电视大屏跨平台收视数据体系


来源:中国广视索福瑞媒介研究(CSM)




对于大屏、中屏、小屏的跨屏测量,我们目前仍在测试阶段。目前在跨越大屏、小屏的测量方面,测量技术主要考虑采用的是声音匹配技术,声音匹配技术可以采集大家的环境音,那么自然也可以用于采集手机的声音,通过虚拟测量仪安装在大家的手机上以记录媒介消费行为。虚拟测量仪技术在2015年率先使用在CSM广播测量项目上,实现了对广播频率收听情况的调查。2019年我们在8个广播测量仪城市网基于音频传播的听众进行了28天为期4周的全媒体视听测试,包括北京、广州、合肥、济南、南京、上海、深圳和无锡。这套数据测量技术已经相对成熟,形成的数据波形是非常稳定的。这套技术可以说是国内第一次打破数据孤岛的融合测量技术,不管是通过大屏的IPTV,还是小屏端手机APP所进行的视频消费,都可以在这套体系内被监测和区分。


在这套数据测量体系中,监测到的人均视听消费时长是218分钟。其中,人均电视直播的消费时长是88分钟,人均广播直播的消费时长是61分钟,人均VOD(音、视频点播)的时长是69分钟。这套数据测量体系的优势在于:一是这套数据是全天侯的测量数据,可以看到全天每时每刻的视听消费数据,这就使得我们可以观察每种不同音视频消费形式的全天使用规律。二是当真正用一个标准来统合数据孤岛时,我们便可以实现多种交互分析。通过交互分析、比较分析,可以发现很多有意思的现象。其中包括年龄、学历、性别和媒介使用内容的交互,现在我们发现对人的媒介行为影响最大的指标其实就是年龄。



9、如何定义收视大数据?对于数据量级庞大却又尚未结构化的跨屏收视大数据,如何看待其应用价值,在测量方法上有哪些新探索?


理想的大数据是全量数据,实际上目前市面上来自智能电视、IPTV、数字有线机顶盒等终端的收视大数据很难做到全量收集。如何在现有数据基础上进行清洗处理以保证其代表性,是需要各方不断探索的议题。更重要的,收视大数据仍然是终端数据,在商业化使用前势必要解决数据到人的问题,这也是CSM从数字有线和IPTV发展之初就一直所关注的。我们和中国传媒大学合作开展的SMART TA项目就是为这个问题提供解决方案,使用算法模型将终端数据还原到人。现在已经有IPTV运营方在使用这个成果帮助广告营销,相信未来也会逐步发展到比如与智能电视OTT大数据相结合等等更广泛的应用中。



10、融合测量体系主要针对受众/用户的媒介行为,着眼于融媒效果的综合评价。您能否谈谈目前有哪些比较流行的评价方式,有什么特点?



融合效果评价体系可以分成两种,一种是基于上面提到的监测媒体融合效果的跨屏同源测量体系,就是在同一套调查体系中测量不同渠道的媒介接触行为;另一种则是不在一个测量体系中所进行的数据融合,这样的数据来源比较复杂,实际上是多方数据整合的结果,我们也在进行这方面的探索。我着重给大家说一下第二种融合评价方式,也就是在没有这套数据的时候,媒体融合领域,大家是如何怎么样解决数据问题的。


比较流行的做法是,将媒体融合传播的数据通过加权的方式来做一个整合,得出一个指数。例如2016年,人民网下属的人民网研究院就创立了媒体融合传播指数指标体系,主要用于考察主流媒体在各个平台(传统端、PC端、移动端)的综合传播力,其中大屏端的数据主要是广视索福瑞的收视数据,PC端和小屏端主要是一些页面数据,也就是爬虫数据。目前有很多家机构都在做这样的指数指标,包括清博大数据等等。当然每家公司指标权重的侧重点有所不同。清博大数据所建构的评价指数实际上不包含大屏部分,主要就是网络部分,网络部分也主要采用的是页面数据,比如播放量、点赞量、评论量等等,用这些数据来加权形成一个指数。


我们之前也做了一些研究,可以给大家看一个例子。CSM曾推出新闻融合传播指数,实际上集合了电视与“三微一端”,即微博、微信、短视频APP所进行的数据加权。数据加权的意义正如刚刚所提到的,这些不同平台的数据有不同的统计口径,并不可比,不能简单的累加在一起,我们必须通过算法把它们整合到一起,才有可能让数据放到一个维度下去比较。我们大概使用了二十多个指标,在电视端用的是总收视时长和大学及以上学历的观众占比等等;短视频端也有一些指标,例如总粉丝量、总发布量、播放量、转发量、评论量、点赞量;微信端是发布量、阅读量和在看量;微博端是总粉丝量、总发布量、转发量、评论量和点赞量,构成了一个总体的指数。指数的特征体现在它的可比较性,相较于原来不具有可比性的各项指标,指数为媒体内容的融合评估搭建了一座桥梁。



11、近年来,OTT、IPTV等互动收视发展迅速,这也使得部分广告开始回归大屏。在您看来,应该如何评估和优化广告的效果?这方面有哪些新举措?



媒介消费行为数据一直是广告投放的重要参考,跨媒体的广告投放提升了对跨媒体数据整合的需求。在数据富足时代,更需要用同一把“标尺”来客观测量和有效评估,公正、完整地衡量和体现数据价值,真实、全面地还原以人为研究对象的跨媒体消费形态。


OTT和IPTV都是基于电视大屏的收视设备,最好的方法就是同源测量。CSM在2019年推动升级了收视测量技术,建成跨平台、全场景、标准化的家庭电视大屏收视数据体系,将数据扩展到包括智能电视、OTT盒子、IPTV等在内的不同收视平台,辨识开机、直播、互动等收视场景,客观地呈现精准到人的收视行为。


为了适应4A公司的使用习惯,我们在调研基础上自主研发了CSM-MAPS大屏跨平台广告效果评估软件,基于CSM跨平台收视数据及第三方广告监测数据,对于跨电视大屏的电视频道、IPTV、OTT等各平台,跨开机、直播和点播等多种行为,进行跨大屏直点播不同平台间MIX的广告投前计划和投后评估的综合分析。



12、谈到数据,有一个无法回避的问题就是数据隐私保护。欧盟2018年出台《通用数据保护条例》(GDPR)之后,美国加州也推出了《消费者隐私法案》(CCPA)。目前世界上关于数据采集和隐私保护的法律法规越来越完善,跨屏收视测量如何平衡两者之间的关系?



首先,我们在进行测量的过程中会对全国样本进行一个抽样。所选取出来的样本在采集数据前肯定会与其达成事前协议,告知他相关信息,在征得他同意的情况下进行采集。


其次,要测量与识别不同的信息内容,得先有全面的音视频数据库,这个音视频数据库是通过对全国900多个电视频道、广播节目进行监测来获得的。必须要有一个匹配的数据库才能进行内容的识别,才能知道这个过程中具体的媒介消费内容以及时长。同时,收视率测量是一个双向的采集过程。一边是受众的收视行为,另一个是监测电视台播出的节目,然后将收视数据进行实时回传,两边进行匹配,通过这样的一个匹配过程来获取数据。最重要的一点是,无论采集的数据,还是相互匹配的数据,整个过程使用的数据都是特征码,也就是每隔20秒采集8秒在这个过程中最强烈的声音特征,而不是抽取我们的媒体声音、环境声音本身,所以其实不存在全天候监控以及隐私侵犯这个问题。在声音的匹配上,目前收视率数据是做得比较好的,一方面节约资源,避免大量图像、音视频回传造成的数据存储的浪费,另一方面,我们也会考虑隐私保护的问题。



13、据悉,CSM正在建立一个侧重移动端的测量网,现在进展如何,这个网络的建设会对原有的受众视听率测量体系产生什么样的影响?



准确地说,CSM正在建立的是一个全媒体视听同源调查网,不仅仅是移动端测量,是采用电视人员测量仪和移动虚拟测量仪两种测量技术来实现。2020年7月我们在城市广播调查网上进行了为期一个月的虚拟测量仪对移动端测量的数据有效性测试,数据结果稳定;2020年10月开始构建覆盖全国的全媒体视听同源测量调查网,经过对测量技术、抽样方案、质量管理等方面进行多轮论证和运作实践,已于2021年1月1日进行全媒体数据应用测试。


该调查网实质上是基于全媒体测量的全国网络,从调查成本、数据代表性、应用效度等多方面考虑,与目前覆盖不同省份、不同城市的视听率调查体系是并行的,是CSM为媒体行业和相关市场提供的丰富的数据产品之一。


分享到: