计算广告：智能时代的营销科学与实践（二十）-智慧文博士

10.5.4 生成对抗网络

1. 核心思想：造假者与鉴伪者的博弈论游戏

2. 训练动态与挑战

3. 在计算广告中的核心应用

4. 局限性、伦理挑战与未来方向

5. 总结：从预测智能到创造智能的范式扩展

第11章合约广告核心技术

11.1 广告排期系统

1. 问题本质：带约束的装箱与调度

2. 核心流程：从合约录入到计划生成

3. 技术挑战与解决方案

4. 从排期到担保式投送的演进

5. 总结：品牌广告的基石与演化的起点

10.5.4 生成对抗网络

生成对抗网络（GAN）自2014年诞生以来，迅速成为人工智能领域最具创新性和影响力的技术之一。与专注于识别和预测的传统深度学习模型不同，GAN的核心能力在于创造——生成逼真的、与原始数据分布高度相似的新数据样本。在计算广告领域，这种“无中生有”的能力正被用于创意生成、用户模拟、数据增强和反作弊等多个方面，为广告系统的智能化和自动化开辟了全新路径。

1. 核心思想：造假者与鉴伪者的博弈论游戏

GAN的灵感来源于博弈论中的零和游戏。它由两个相互对抗的神经网络组成：

生成器：一个“造假者”。它的目标是学习真实数据的分布，并生成足以“以假乱真”的合成数据。它接收一个随机噪声向量（通常来自简单分布，如高斯分布）作为输入，通过复杂的神经网络变换，输出一个合成数据样本（如图像、文本）。
判别器：一个“鉴伪者”。它的目标是成为一个精明的“侦探”，区分输入数据是来自真实数据集还是生成器制造的赝品。它接收一个数据样本，输出一个标量概率，表示该样本为真的可能性。

对抗过程的形式化描述：

判别器 DD 的目标是最大化正确分类真实样本和生成样本的能力。其目标函数为最大化：
即，让真实样本 xx 的判别输出 D(x)D(x) 尽可能接近1，让生成样本 G(z)G(z) 的判别输出 D(G(z))D(G(z)) 尽可能接近0。
生成器 GG 的目标是最小化判别器做出正确判断的能力，或者说最大化判别器对其生成样本的误判率。其目标函数为最小化：
即，让生成样本 G(z)G(z) 的判别输出 D(G(z))D(G(z)) 尽可能接近1（让判别器误以为它是真的）。

纳什均衡：整个训练过程是一个极小极大博弈，最终目标是达到一个纳什均衡点：生成器生成的数据分布 pgpg 与真实数据分布 pdatapdata 完全一致，此时判别器对任何输入都只能给出0.5的概率（完全无法区分）。

2. 训练动态与挑战

GAN的训练被公认为是不稳定和微妙的，常被称为“一门艺术”。主要挑战包括：

模式坍塌：生成器发现某些样本（如某一种特定风格的广告图）很容易欺骗判别器，于是开始只生成这些样本，导致生成的多样性严重不足，无法覆盖真实数据的所有模式。
梯度消失：当判别器过于强大时，它对生成样本的梯度（即指导生成器如何改进的信号）会趋近于零，导致生成器无法学习。
收敛性难以判断：损失函数的振荡并不代表训练失败，而平衡点的到达也难以精确定义。

为了应对这些挑战，研究者们提出了大量改进结构和训练技巧，如WGAN（通过Wasserstein距离改进损失函数）、DCGAN（使用卷积结构的稳定架构）、Conditional GAN（引入条件控制生成内容）等，大大提升了GAN的实用性和稳定性。

3. 在计算广告中的核心应用

3.1 程序化创意生成与优化
这是GAN在广告领域最具想象力的应用方向。

静态创意生成：给定广告主的产品图片、Logo、文案等元素，GAN可以学习海量优秀广告设计作品的风格、布局和配色，自动生成多个符合品牌调性、视觉吸引力的广告Banner候选。设计师可以在此基础上进行微调，极大提升创意生产效率。
动态创意优化：可以训练一个Conditional GAN，以用户画像和上下文信息为条件，实时生成“千人千面”的个性化创意。例如，对于喜欢简约风格的用户，生成简洁文字为主的广告图；对于价格敏感型用户，在图中突出显示折扣和价格信息。
视频创意生成：基于视频的GAN（如Video GAN）可以用于生成或编辑短视频广告。例如，自动将静态产品图转化为动态展示视频，或根据背景音乐节奏调整视频剪辑点。

3.2 用户行为模拟与系统压力测试
构建一个高度仿真的广告流量模拟环境，对于算法开发、系统测试和策略评估至关重要。

构建模拟器：使用GAN来学习真实历史流量数据（包括用户特征、上下文特征、点击/转化行为）的复杂联合分布。训练好的生成器可以按需产生无限量的、逼真的“模拟用户”及其对广告的反馈行为。
应用价值：
- 离线评估：在新广告排序算法上线前，可以在高度逼真的模拟环境中进行无风险的A/B测试，评估其对用户体验、广告收入等的长期影响。
- 探索与利用研究：在模拟环境中可以低成本、高速地进行强化学习智能体的训练，尤其是那些需要大量探索（可能会损失短期收入）的策略。
- 系统容量与抗压测试：生成超大规模流量，测试广告投放引擎在极端情况下的稳定性和性能。

3.3 数据增强与冷启动缓解
广告场景下的冷启动问题（新广告、新用户）尤为棘手，因为缺乏历史行为数据。

特征空间增强：对于数据稀疏的特征（如新广告的ID），可以利用GAN在其Embedding空间进行插值或生成新的、合理的虚拟特征向量，与现有特征结合，丰富训练样本，提升模型对未知ID的泛化能力。
合成负样本：在点击率预测中，未点击的曝光作为负样本可能存在偏差（因为曝光本身是经过系统筛选的）。可以使用GAN学习真实负样本的分布，生成更全面、多样的合成负样本，帮助模型更好地学习决策边界。

3.4 反作弊与异常检测
GAN也可以用于识别“异常”，即与主流分布不符的数据。

异常点击流检测：训练一个GAN，其生成器学习正常用户点击行为序列的分布。对于一个新的行为序列，用判别器来评估其“正常性”得分，得分过低则可能判定为作弊机器人或异常行为。这种方法无需预先定义作弊模式，能自适应地发现新型作弊。
生成对抗性样本进行防御：使用GAN生成与真实广告创意极其相似但包含细微扰动的“对抗性样本”，来攻击并测试现有的点击率预估模型和反作弊模型的鲁棒性，从而针对性地加强防御。

4. 局限性、伦理挑战与未来方向

尽管前景广阔，GAN在广告中的应用仍需谨慎对待其局限性：

生成内容的可控性与安全性：GAN的生成过程存在随机性，可能产生不合规、有偏见或令人反感的创意内容。必须结合强大的内容安全过滤器和人工审核。
“深度伪造”与广告欺诈：技术本身是双刃剑。GAN可能被用于生成虚假的、带有名人或机构形象的欺诈性广告，或伪造点击/转化数据。这对广告诚信生态构成威胁，也催生了基于GAN的检测技术。
评估难题：如何定量评估生成创意的“好坏”？除了视觉吸引力和点击率，还需考虑品牌安全、长期用户认知等难以量化的因素。

未来方向：

可解释性与可控性：研究如何让生成过程更可控、更符合广告主的高层意图（如“传达高端感”）。
多模态融合生成：结合文本、图像、音频，生成更丰富的视频或互动广告。
基于扩散模型的创意生成：当前，扩散模型在图像生成质量上已超越GAN，未来可能成为程序化创意的新引擎。

5. 总结：从预测智能到创造智能的范式扩展

生成对抗网络将计算广告的智能化水平从分析预测提升到了创造合成的新维度。它不再仅仅是理解用户和匹配广告，而是能够主动生成适配的广告内容、模拟复杂的环境、增强数据以解决根本问题。尽管面临技术稳定性和伦理应用的挑战，但GAN所代表的生成式AI无疑是广告技术未来发展的重要一极。它要求从业者不仅具备判别式模型的思维，更要掌握这种“创造性对抗”的建模方法，从而为广告系统注入更强大的自动化和创新能力。

第11章合约广告核心技术

合约广告是互联网广告最传统也最经典的形式，其核心是媒体与广告主之间基于事先约定的交易。这种约定通常包括：展示的广告位、目标人群、展示时段、总曝光量以及总价格（CPT或CPM）。保障这些合约的完整、高效履行，是合约广告系统技术挑战的根源。本章将深入剖析支撑合约广告运作的三大核心技术：排期系统、担保式投送系统和在线分配算法。

11.1 广告排期系统

在合约广告时代（尤其是品牌广告），广告主像预订杂志版面或电视时段一样，提前与媒体（网站）签订广告合同，约定在未来某个时间段内（如一个月），在特定广告位（如首页首屏Banner）上展示一定数量的曝光。广告排期系统就是负责将这些五花八门的合同，在媒体有限的广告位库存上，转化为一份可执行的、精确到每次曝光的投放计划表。这是一个经典的、带有复杂约束的资源规划问题。

1. 问题本质：带约束的装箱与调度

我们可以将广告排期问题抽象为：

资源：未来一段时间内（如未来30天），每个广告位在每一时刻（可离散化为小时或更细粒度）的一次曝光机会。这是一个时间-位置二维的资源网格。
任务：众多广告合约。每个合约 ii 的要求可表述为：在时间段 TiTi 内，在广告位集合 SiSi 上，向符合定向条件 AiAi 的人群，展示至少 IiIi 次曝光。
目标：生成一个可行的排期计划，确保所有合约都能在不冲突的情况下被满足。高级目标则是在满足所有合约的基础上，优化某些指标，如填充率、收入或用户体验。
核心约束：
1. 库存容量约束：在任何给定的时间片和广告位上，分配的曝光总和不能超过该位置的实际预测流量（即库存）。
2. 合约独占性约束：某些优质广告位（如首页全屏）的合约可能要求独占，即在约定时段内不能播放其他广告。
3. 竞争排斥约束：同一品类或直接竞争关系的广告主，其广告可能被约定不能在同一时段或相邻位置出现。
4. 频次控制约束：同一个广告对同一个用户，在合约期内不应超过约定的展示次数。

2. 核心流程：从合约录入到计划生成

一个完整的排期系统工作流程包括以下步骤：

合约录入与解析：销售团队将与广告主签订的合同（可能是自然语言）结构化，输入系统。系统需要解析出定向条件 AiAi、展示量 IiIi、时段 TiTi、广告位 SiSi、优先级、排他性等关键属性。
流量预测：这是排期准确的基石。系统需要预测在未来合约期内，每个广告位、在每个时间段、符合每个可能定向组合（如“北京地区男性白领”）的可用曝光量。这通常是一个基于历史时间序列数据（考虑趋势、季节、节假日）和上下文因素（如内容更新计划）的机器学习预测问题。预测的准确性直接决定了排期是“过于乐观导致无法交付”还是“过于保守导致库存浪费”。
排期计划生成（核心算法）：这是最复杂的步骤。给定所有合约要求和预测库存，求解一个可行的分配方案。通常将其建模为一个线性规划或整数规划问题。
- 决策变量：xi,t,sxi,t,s —— 将合约 ii 分配到时间片 tt、广告位 ss 上的曝光量。
- 目标函数：早期系统以“满足所有合约”为硬约束，目标可能是最小化违约风险或最大化缓冲。更现代的系统会考虑最大化总收入（可能包含不同合约的优先级权重）或最大化整体填充率。
- 约束：
  以及各种定向、排他性约束。
- 求解：由于问题规模巨大（成千上万的合约，数百万的时间-位置资源单元），且需要快速响应（销售需要实时知道是否能接一个新合约），直接求解精确解不现实。工业界采用启发式算法或近似线性规划求解器（如使用对偶方法），在可接受的时间内得到一个高质量、可行的解。
计划审核与冲突解决：生成的初步计划可能需要人工销售或运营人员审核，处理一些算法未考虑的软性约束（如品牌调性搭配）。系统需要提供友好的界面，高亮显示潜在的冲突（如库存不足），并允许人工调整和override。
计划发布与锁定：最终确认的计划被“锁定”，并下发给广告投放引擎，作为投放时必须遵守的“宪法”。同时，系统会更新剩余可售库存，供销售接新的合约时查询。

3. 技术挑战与解决方案

预测不确定性：流量预测不可能100%准确。如何处理预测误差带来的风险？
- 解决方案：引入安全边际。在排期时，不使用原始的预测值 Inventoryt,sInventoryt,s，而是使用一个保守估计，例如 Inventoryt,s×(1−缓冲率)Inventoryt,s×(1−缓冲率)。缓冲率根据该位置历史预测误差的方差动态调整。另一种方法是进行场景规划或随机规划，考虑多个可能的未来流量情景，生成一个鲁棒的排期计划。
在线合约的实时接纳：销售在谈判时，需要实时查询“下周三到周五，首页Banner，北京地区男性，还能卖多少曝光？”。这要求排期系统能基于当前已锁定的计划和预测库存，在毫秒内计算出某个定向条件下的剩余可售库存（Remaining Available Inventory）。
- 解决方案：这本质是一个多维范围查询问题。系统需要维护一个高效的数据结构（如多维线段树或组合索引），能够快速聚合在特定时间范围、广告位集合、定向人群上的已分配曝光量和预测曝光量，从而得到剩余量。
合同执行的动态调整：实际投放中，可能因为流量波动（如突发新闻带来额外流量）、某些合约完成过快或过慢，导致原计划不再最优，甚至可能违约。
- 解决方案：系统需要具备动态再排程能力。周期性地（如每天）根据最新的实际消耗数据和更新的流量预测，重新运行排期算法，对尚未执行的部分计划进行微调，将富余的流量智能地分配给进度落后的合约，或将面临违约风险的合约流量提前，确保整体交付率。

4. 从排期到担保式投送的演进

传统的排期系统是“静态的”、“僵硬的”。它生成一个计划后就固定不变，投放引擎机械地执行。但这无法应对互联网流量的实时性和用户行为的个性化。因此，现代合约广告系统已经进化到“担保式投送”阶段。

两者的核心区别：

静态排期：计划规定“在时间t，广告位s，必须展示广告A”。无论谁来访问，都展示A。
担保式投送：计划规定“在时间段T内，向符合定向A的人群，担保展示I次广告B”。系统在每次曝光请求时，实时决策是否用广告B来满足这次请求，以最有效的方式完成担保量。这引入了巨大的灵活性，也带来了新的技术挑战（流量预测、频次控制、在线分配），这些将是11.2和11.3节的重点。

5. 总结：品牌广告的基石与演化的起点

广告排期系统是品牌广告商业逻辑的工程化体现，它将不确定的、动态的互联网流量，通过预测和规划，转化为稳定的、可承诺售卖的标准化商品。虽然随着竞价广告和程序化交易的兴起，纯静态排期的份额在下降，但其核心思想——在约束下对未来资源进行规划和分配——已深深融入现代担保式投送和程序化保量购买中。理解排期系统，是理解整个合约广告体系，乃至互联网广告资源管理逻辑的第一课。它连接了销售、运营和工程技术，是广告业务从商业合同走向机器执行的桥梁。