YouTube 广告素材分析

一月 16, 2024
Satish Shreenivasa gTech Data Science Team
Huikun Zhang gTech Data Science Team
Manisha Arora gTech Data Science Team
Paul Cubre gTech Data Science Team

简介

为什么要分析 YouTube 广告?

YouTube 拥有数十亿的每月登录用户,并且每天人们在该平台上观看的视频时长高达数十亿小时,生成的视频播放量也达到数十亿次。企业可以通过 YouTube 广告与这些用户建立联系。YouTube 广告是在 YouTube 网站和应用上展示的推广视频,具有多种视频广告格式和目标。

youtube

挑战

如要制作出有效的视频广告,需关注四个核心要素,简称 ABCD

  • 注意力 (Attention):确保从开始到结束都能吸引观众的注意力。
  • 品牌 (Branding):帮助观众在听觉或视觉上记住品牌。
  • 联系 (Connection):让观众对品牌产生情感上的联系。
  • 行动 (Direction):鼓励观众采取行动。

YouTube 视频广告由不同的组成部分构成,例如物体、背景音乐或徽标。每个组成部分都会影响广告的观看完成率(后文简称 VTR)。因此,通过分析广告中各组成部分的效果,企业能够理解哪些部分有助于提高 VTR。企业可以将基于这些分析得出的洞察用于制作新广告素材,以及优化现有广告素材以改善 VTR。

提议

我们提出了一种解决方案,通过基于机器学习的方法来分析公司的 YouTube 广告,以评估哪些组成部分会影响 VTR,从而优化视频广告的效果。原理如下:

  • 通过 Google Cloud Video Intelligence API,使用基础视频文件提取每个视频广告的组成部分。
  • 将提取的数据转化为经过构建的特征,这些特征对应于可操作的业务问题。
  • 使用机器学习模型来分离每个构建的特征对 VTR 的影响。
  • 解读洞察并采取行动,以提高视频广告的效果,例如更改现有广告素材或创建新广告素材以用于 AB 测试。

方法

过程

我们提议的分析方法分为 5 个步骤,如下所述。

  1. 确定业务问题:首先确定一系列具有可操作性的业务问题,例如“在视频开头出现徽标是否会影响 VTR?”我们建议提前考虑这些问题的可行性。例如,如果出于法律原因产品必须展示免责声明,那么就没有必要评估免责声明对 VTR 的影响。
  2. 原始组成部分提取:利用 Google Cloud 技术(如 Google Cloud Video Intelligence API),并结合视频广告的基础文件,从每个视频中提取出原始组成部分,包括但不限于:在特定时间戳出现的物体、文本及其在屏幕上的位置,以及特定声音的出现情况等。
  3. 特征工程:基于步骤 2 中提取的原始组成部分,构建与步骤 1 中确定的业务问题相对应的特征。例如,如果业务问题是“在视频开头出现徽标是否会影响 VTR?”,则创建一个特征,对每条视频进行标记。1 表示开头有徽标;0 表示开头无徽标。对于每一个特征,重复此操作。
  4. 构建模型:使用步骤 3 中构建的特征,创建一个 ML 模型,将 VTR 作为模型的目标变量。
  5. 解读结果:从 ML 模型中提取具有统计显著性的特征,并解释这些特征对 VTR 的影响。例如,“当视频开头出现徽标时,观察到 VTR 提升了 xx%。”

特征工程

数据提取

假设我们有 2 个针对同一网络浏览器的不同 YouTube 视频广告,每个广告都着重突出不同的产品功能。广告 A 中包含的文本是“内置病毒防护”,而广告 B 中的文本为“自动保存密码”。

我们可以从这两个视频广告中提取出原始文本信息,并基于这些信息创建表格形式的数据集,如下所示。为简洁起见,后续例子将只关注文本特征,暂时忽略时间戳维度。

Screenshot 2024-01-19 at 11.09.46 AM

预处理

在从每个广告中提取出原始组成部分之后,可能需要进行预处理,比如去除字母大小写敏感性以及标点符号。

Screenshot 2024-01-19 at 11.10.23 AM

手动的特征工程

设想一个场景,您需要回答这样一个业务问题:“在视频中包含产品功能的文本引用是否会影响 VTR?”

对于这个特征,我们可以进行手动构建。具体做法是对样本中所有视频的文本进行深入研究,并创建一个标记列表或短语列表,以表示对产品功能的文本引用。然而,这种方法很耗时且难以扩展。

code

基于 AI 的特征工程

我们可以将每个视频广告素材中检测到的文本与能够自动进行特征工程的提示一起传递给 LLM,从而代替上述的手动特征工程方法。

例如,如果目标是探究在视频广告中突出显示产品功能的价值,我们可以向 LLM 提问:“‘内置病毒防护’文本是否是功能点强调?”接着再询问 LLM:“‘自动保存密码’文本是否是功能点强调?”

我们可以从 LLM 的回答中提取信息,并将其转换为 0 或 1 的形式,然后将转换后的数据传递给机器学习模型。

Screenshot 2024-01-19 at 11.10.51 AM

构建模型

训练数据

完成特征工程步骤后,我们会得到一个数据表,其中的列与最初的业务问题相对应。这个数据表可以与另一个包含样本中每个视频的 VTR 的数据表进行合并。

Screenshot 2024-01-19 at 11.11.25 AM

*值是随机的,不得以任何方式解读其含义。

建模采用了固定效应 (Fixed Effects)、Bootstrapping 和 ElasticNet 三种方法来完成。如需了解更多信息,请参阅 Manisha Arora 和 Nithya Mahadevan 撰写的《Discovery 广告效果分析简介》(Introducing Discovery Ad Performance Analysis)

解读

模型输出结果可用于提取具有统计显著性的特征、系数值以及标准差。

系数值 (+/- X%):表示 VTR 的绝对提升的百分比。如果是正值,则表示这个特征对 VTR 有正面影响;如果是负值,则表示对 VTR 有负面影响。
显著性 (True/False):表明该特征对 VTR 的影响是否具有统计显著性。

Screenshot 2024-01-19 at 11.13.49 AM

*值是随机的,不得以任何方式解读其含义。

在上述假设示例中,“包含功能点强调”这一特征对 VTR 具有统计学意义上的显著正向影响。该结果可被解读为:“当广告中包含对产品功能的文本引用时,观察到 VTR 绝对提升率为 2.22%。”

挑战

上述方法面临的挑战包含以下几点:

  • 未考输入到模型中的各个特征之间的相互作用。例如,如果将“包含徽标”和“左下角包含徽标”作为单独的模型输入特征,则它们之间的相互作用不会被评估。但是,您可以设计一个组合了上述两个特征的第三个新特征,例如“具有较大的徽标且左下角具有徽标”。
  • 基于历史数据的推断不一定代表广告素材未来的效果。此方法不保证洞察可提高 VTR。
  • 由于视频广告通常包含多个组成部分,可能出现维度问题。

启用策略

Ads Creative Studio

Ads Creative Studio 是一个为企业设计的有效工具,可让企业快速地将文本、图像、视频片段或音频进行组合,从而制作出多个视频版本。利用这款工具,用户可以根据模型输出添加或删除相关特征,从而快速创建新视频。

image3

Video Experiments

借助该工具,您可以设计新的创意、根据由分析而得的洞察改变组成部分,以及进行 AB 测试。例如,改变徽标的大小,以及利用 Video Experiments 设置一个实验。

总结

确定 YouTube 广告的哪些组成部分会影响 VTR 是一项具有挑战性的任务,因为一个广告通常包含多个组成部分。然而,广告商有强烈的意向想优化广告素材以提升 VTR。通过运用 Google Cloud 技术、GenAI 模型和机器学习,广告商可以以一种可扩展且具备可操作性的方式来解答与广告素材相关的商业问题。最终,他们可以借助模型所产生的洞察来优化 YouTube 广告并实现业务目标。

致谢

感谢 Google 的合作者,特别是 Luyang Yu、Vijai Kasthuri Rangan、Ahmad Emad、Chuyi Wang、Kun Chang、Mike Anderson、Yan Sun、Nithya Mahadevan、Tommy Mulc、David Letts、Tony Coconate、Akash Roy Choudhury、Alex Pronin、Toby Yang、Felix Abreu 和 Anthony Lui。