第 45 期 - AIGC 在小红书展示广告标题生成中的实践与价值
摘要
文章剖析素材对广告业务的价值,回顾行业动向,分享小红书展示广告中素材+ AIGC 的实践,包括实践案例、技术挑战与应对、业务应用、效果评估等方面内容,还介绍了团队情况与招聘信息。
一、素材对广告业务的价值
素材是广告业务的载体,其形态不断创新。广告业务是 b 端客户、平台、c 端用户的三方博弈场。
- 对广告主来说,投流手段包括出价、定向、素材,素材即定向,能为广告主带来效率,广告主追求投流 ROI。
- 对用户而言,若广告满足或激发需求,就不再是打扰,素材能给用户带来价值。
- 对于平台,合适的素材能带来繁荣,不符合社区调性的素材会带来麻烦,平台要平衡商业效率和社区调性。
二、行业的素材实践
- 素材制作成本是投放生产中的大头,不同媒体调性不同,目前素材制作模式在拍摄成本付出后才有判断结论,制作好的素材成本更高。
- AIGC 带来效率革命,有如下案例:
- 某代理商优化素材制作流程,提前专家介入时机:idea - 脚本 - AIGC 生成 - 领域专家人工介入 - 拍摄 - 在线投放。
- 某代理商优化标题关键词融入。
- 某平台推出 AIGC 离线工具 + 在线组合优选。
- 某平台进行 spu 到素材的生成。
- 某平台通过模糊素材内容达到防爬&站外引流。
三、技术视角的实践挑战
- 生产范式的幻觉挑战(一致性):广告有商业性,宝马广告生成奔驰标题不可容忍。
- 通用大模型到行业的适配性:要考虑营销感与社区调性。
- 多样性:在有限广告内容中挖掘多样标题,提高投放匹配效率。
四、可控生成的实践
- 训练:基于自动标注(Auto - Labeling) - SFT (Supervised Fine - Tuning)架构的可控生成训练范式。
- 推理:构造级联框架,输入笔记,输出推广对象 + 标题。
- 基座模型的领域预训练:清洗亿级别笔记数据,混合通用语料对基座模型开展小红书领域预训练,选用 10B 量级模型效果较好。
- 关键词感知生成模型训练:
- 先以笔记原生标题训练小红书领域预训练模型,随机采样生成多标题。
- 利用通用大模型给标题抽取关键词,获得训练数据,训练得到模型。
- 风格感知生成模型训练:利用大模型自动标注的标题风格数据,获得训练数据,进而训练得到模型。
- 端到端联合 SFT & 推理:将相关数据整合为一个 label,对小红书领域预训练模型建立端到端微调任务。
五、RM(Reward Model)
- 可用性 RM:目标是避免不通顺、实体不一致、幻觉等情况。通过人工标注和数据增强手段构造样本进行训练。
- 吸引力 RM:预估生成标题吸引力,通过人工标注收集排序数据,用小红书领域预训练模型得到文本向量,采用 pair - wise loss 训练。
六、业务应用
- 一致性:保障商业活动确定性,紧扣素材即定向逻辑生成标题,以可控生成训练 + 可用性 RM 技术路线取得成果。
- 调性:为让模型适应小红书领域特点,进行预训练和基于用户行为 SFT。
- 多样性:通过深度利用大模型能力,使用合成数据解决符合社区调性的多样化数据获取问题。
七、整体方案&评估
- 多样性评估:实验模型相比基线模型在每个笔记上平均生成更多标题,确保评估公平性后对比评估。
- 一致性评估:通过人工 GSB 评估 200 篇笔记对比模型结果。
八、团队情况与招聘信息
作者所在团队从事多模态大模型与内容分发系统结合工作并落地在小红书发现页场景,介绍了团队成员负责的工作内容,并发布招聘信息,提供简历投递邮箱,还介绍了往期精彩内容和相关活动。
扩展阅读
Made by 捣鼓键盘的小麦 / © 2025 Front Talk 版权所有