互联网广告精准投放中的个人信息保护问题

官方公众号企业安全新浪微博

FreeBuf.COM网络安全行业门户，每日发布专业的安全资讯、技术剖析。

FreeBuf+小程序把安全装进口袋

活动

互联网广告精准投放中的个人信息保护问题

2020-04-28 00:33:27

摘要

互联网广告投放的精准度，本质是一种匹配度。它不可能实现把广告内容一对一地精确投放给用户个体，而只是尽可能将广告展示给与广告内容匹配度更高的用户群体。广告投放的精准，离不开技术的支撑，但不同的技术却可能给个人信息带来不同程度的风险。在后GDPR时代，对于互联网企业而言，保护好用户的个人信息，不仅是一个合规问题，更是一个能在行业中保持优势地位的核心竞争力。为此，在适用知情同意原则上，我们应针对不同的精准广告投放技术，调整其侧重点。

关键词

互联网广告；精准投放；个人信息保护；知情同意

互联网广告在生活中随处可见，也是当前互联网公司的重要营收来源之一。然而，随着这类广告投放的精准度越来越高，不少用户也开始产生质疑：这些广告的内容为什么与我和朋友聊天的话题如此契合，是不是我的私人谈话被人监控了？它们是不是侵犯了我的隐私权?要回答这类问题，首先需要了解互联网广告精准投放的技术逻辑是什么。随后，根据这些技术的特点和运行机制，来判断互联网公司是否存在可能侵犯消费者（用户）个人信息的情况。

一、实现互联网广告精准投放的技术手段

要实现互联网广告的精准投放，也就是要将广告内容在正确的时间、正确的场景下，以正确的方式，定向呈现给正确的受众群体，即最应该看到该广告的用户人群和最想看到该广告的用户人群，从而提高网络广告平台的效率，增强网络广告的效果。[1]为了达到用户与需求之间更为准确的匹配，离不开两大基本的技术手段：一是通过用户画像技术，解决如何正确认识用户的问题；二是通过用户行为定向技术，解决如何正确界定用户的需求。

1、用户画像

用户画像是将分散的各种用户数据收集起来，然后对它们进行数据清洗、拉通、整合、分析、建模，最后形成对真实用户的数学模型。

这个概念可以从以下几点来解读。首先，用户画像是用于描述用户的数据，是针对符合特定业务需求的用户进行的形式化描述。它源于现实、高于现实。其次，用户画像是对一类群体结合业务所做的数学模型，而不会呈现某一个用户的具体信息。它是一种用户的数字化描绘，通过标签化的方式，刻画出具有相同属性（如兴趣点、浏览习惯、购物偏好等）的某一类用户。最后，用户画像是通过分析、挖掘用户尽可能多的数据信息得到的。它源于数据而高于数据。它并非大量数据的简单堆砌，而是通过对数据进行筛选、重组和匹配等综合处理后所形成的数据集。

正因如此，用户画像所描绘出的某一用户，实质上是从业务角度界定（亦称标签）的一个用户类型，且与现实世界中的界定是有出入的。以性别为例，做用户画像时的性别，不是以该用户在现实世界中的生理特征意义上的男或女来界定，而是通过该用户在注册时所填写的性别（这种填写往往未必是真实的，一个女生也可以在注册时，选择性别为“男”），结合该用户在网购时喜欢买男性的商品或者女性的商品、更爱浏览女性化的内容还是男性化的内容等在网络上的表现来综合判断的。所以，用户画像是和业务场景密切联系的，一旦脱离某个具体的业务场景，该画像也就可能失去了它的应用价值。

2、用户行为定向

用户行为定向（Behavioral Targeting）技术能够根据用户行为，如浏览网页、查看商品、甚至购买等情况，分析用户的类别，特别是近期消费意向，并通过商品推荐系统或广告投放系统，在用户浏览网页时弹出相应的产品或广告。

二、不同技术的个人信息风险评价

从广告投放的效果来看，越容易将某一个具体的、真实的用户与该用户的某种网络行为联系起来的技术，对用户的精准锁定性也就越高。但这同时意味着，互联网公司需要获取到更多的用户数据，一旦发生信息泄露，给用户带来的危害也越大。需要注意的是，不同技术的应用对个人信息所造成的风险程度也不同。

如前所述，用户画像技术是将具有共同特质的用户进行标签化。通过这样的技术处理后，用户画像是无法对应到真实世界中的某个用户身上。它只是对真实世界中某一类型用户的数字映射而已，具有高度的概括性和抽象性。从个人信息保护的角度，是很安全的。

在应用基于 Cookie 的用户行为定向技术时，平台只能通过 Cookie 中的唯一编号来识别某一用户。除非用户向平台披露其真实的姓名、地址、性别等个人敏感信息，否则根据这一编号，是无法读取出这些敏感信息的。也就是说，在线下的现实世界里，当使用某一Web 浏览器的人换成另一个人时，但Cookie 中的唯一编号未变，那么在线上的虚拟世界里，用户仍是同一个“人”。尽管随着时间的推移，通过Cookie收集到的用户信息会更详细、更丰富，也更易识别出明显带有该用户行为的特征，或者说是其在网上表现出的某种“风格”和偏好。不过就整体而言，利用Cookie进行用户行为定向，从个人信息保护角度来说还是低风险的。

而对于基于间谍软件的用户行为定向方法来说，其技术带来的风险系数就比较高了。因为在安装相应软件时，消费者要么以为该软件的安装对所想访问的网站是必备的，要么安装该软件是为了获得一些好处，比如一个有趣的游戏、一个漂亮的头像等，但并不知道这个软件会不会跟踪、监控自己电脑或手机的网络使用情况，更不会知道自己的哪些信息，甚至包括个人敏感信息会不会已经被“盗”走。

不过，不论是Cookie还是间谍软件，用户本身是可以进行一定掌控的。用户可以通过删除Cookie和卸载软件的方式，保护相关信息不再被继续收集。但基于深度数据包检测技术，即DPI技术的用户行为定向方法，却是个例外。消费者不仅很难察觉到，也几乎没有办法通过自己处理的方式来“止损”。虽然某些DPI提供商可能具有允许用户选择退出分析的功能，但这种功能也仅仅是停止了对该用户信息的存储，而不是DPI功能本身。还有一点值得注意的是，DPI技术的实施离不开一个关键因素，即所需的网络硬件需要在ISP的流量"流"内，因此如果ISP不配合，是没有办法实施该技术的。这也在相当程度上，限制了DPI的应用范围。

三、对互联网广告精准投放的理解

1、对精准投放的追求是行业的必然趋势

追求广告的精准投放，既是根据不同消费对象进行市场营销细分的必然产物，又是解决企业与目标用户间信息不对称问题的必然需求。

在互联网未出现之前，企业也从未停止过追逐精准触达用户的步伐。哪怕是一个服装小店，店员或老板也会在你光顾时，根据他所观察到的，比如你的身高、肤色、长相、以往的购衣偏好、你要穿衣的场合等信息，向你推荐一款或几款他认为适合你的服装穿搭。而有时不得不承认，他似乎比你自己更了解你适合的穿衣风格，他所推荐的或许正是你希望购买却一时尚未发现的那件。这种愉快而满意的购衣体验，会逐渐让你成为这家店的老主顾。

而互联网的出现，不过是丰富了这个服装店员或老板的信息量，提高推荐商品的成功率而已。这是一种商业社会中常见的现象，所以互联网广告追求精准投放本身是无可厚非的。这一行为本身并不违法或违反商业伦理，关键在于为提高投放互联网广告的精准度，所采用的获取用户信息的手段是否正当。

2、“隐私悖论”说明用户可以接受一定精准度的互联网广告

“隐私悖论”是指用户的隐私关注态度和用户的隐私披露行为上存在的标准不一致。也就是说，一方面用户认为隐私对他们来说非常重要。另一方面，他们的实际行为和实际选择却可能与他们的这种观念截然相反。比如：用户会一边担心在社交媒体（像Facebook、微博、微信）上的隐私安全，一边又热衷分享他们的生活日常、照片等个人信息；用户一边介意自己的个人信息被互联网公司获取，一边又会为了一个星座小测试，填写自己的真实姓名、生日、年龄和性别等，哪怕明知这个测试的结果其实是娱乐性大于准确性。

同样的道理，互联网广告用户也同样陷入“隐私悖论”的矛盾。一方面，如果广告投放实现了一定的精准度，他们会怀疑自己的个人信息被监控，从而觉得被冒犯。另一方面，他们又乐于享受由广告收益所支撑起来的各种免费的互联网内容服务，包括电子邮件、搜索、位置导航、游戏等，甚至还会点击网站推送给他们的链接（如天猫、亚马逊推荐的消费者可能喜欢的产品链接）。

隐私悖论的存在反映出，不论是出于网络社交的需要，还是为了自我呈现的心理需求，亦或是为了获得更多、更好的个性化服务，用户其实是可以接受部分个人信息被网站收集的。这种悖论反映出的实质是，用户希望能够以最少的个人信息为代价，换取更丰富的免费互联网服务或者更合心意的互联网服务。也就是说，如果能够有效地控制个人信息采集对用户可能造成的伤害风险，那么用户在一定程度上其实是可以接受的。

3、互联网广告投放的精准度实质是一种匹配度

用户画像技术将真实的用户“脱敏”，实现用户类型的划分；而用户行为定向技术，则是将真实用户的个体网络行为和网络选择，或者说网络偏好，以用户画像去套用。两者重合越多，所投放的广告也就越精准。这就象拿着一张没有任何背景资料介绍的相片，去与人群中的每一个人进行比对，找出最像这张相片上的那个人或者那些人。其实质，就是用一种已知的类型去匹配不同的个体，并针对这些有一定匹配度的个体，批量且定向推送广告。匹配度越高，投放的精准度也就越高。

正因如此，如果某公司设计了一款针对含有沙漠冲浪和探险、星空帐篷的迪拜旅游产品，并希望通过互联网广告方式投放。那么，为了实现更好的投放效果，更准确的将该广告投放给它的目标客户群体。首先，该公司会根据这款旅游产品的路线特点，确定这款产品适宜某一个年龄段喜欢旅游的用户，并调用已建立的适宜的用户画像，覆盖该用户画像所对应的用户数据集。如果该数据集中的某位用户，其年龄范围与该用户画像比较匹配，那么就可能被该广告覆盖到。

如果要进一步提高投放的精准度，广告主可以在用户画像基础上，进一步结合用户行为进行判断。比如：通过Cookie 中的唯一编号可以反映出，同一Cookie用户近期曾在一个订票网站中，打开过一个搜寻前往迪拜机票信息的网页，然后，该Cookie用户退出了该网页，访问一个小说网站，追小说连载更新。根据用户画像，常用这一Cookie的用户，亦在该用户画像的数据集中；结合Cookie，该用户相对数据集中的其他用户而言，可能更有去迪拜的意愿，是更适合该广告的投放对象。如果，该订票网站、小说网站又都属于该款旅游产品互联网广告的投放网站，那么该用户在小说网站上也能够看到该款旅游产品的广告。这也是程序化广告的主要逻辑，也是用户经常发现在A平台浏览/搜索一些关键词，很快在B平台看到相关广告的原理。

四、用户隐私利益与互联网公司利益的平衡

用户在享受网络带来的巨大便利的同时，也需要为网络的繁荣承担代价。与此同时，作为信息行业的互联网领域而言，没有个人信息这一基础的存在，信息大厦顷刻间便会失去根基。在确保互联网领域繁荣发展的同时保障个人信息的安全，不但是对当前立法、行政管理和司法裁判的考验，更是对企业经营管理的严苛要求。在互联网广告精准投放过程中，如何在用户隐私利益与互联网公司利益间寻找平衡，甚至可以说，已经成了“一门艺术”。

1、保护用户个人信息正变成一种竞争优势

在后GDPR时代，越来越多的互联网公司意识到它们不仅是用户数据的采集者，还是用户数据的“管家”。建立和维护客户对其隐私保护能力的信任，正在成为这些依赖数据而生的互联网公司取得成功的关键因素之一。

互联网行业是一个非常有危机感的行业。一方面，不进则退，如中华网、亿唐、3721、博客中国、FM365、Chinaren、饭否、熊猫直播等，都曾红极一时，却很快归于湮灭。另一方面，黑马频出，美团、拼多多、抖音、今日头条、滴滴、快手、趣头条等，都是近几年崛起的新势力。在这样的残酷局面之下，即使是那些已经获得巨大成功的企业，比如腾讯、阿里巴巴、京东、百度、新浪、网易等，也不敢松懈，因为稍有不慎，就可能被人取而代之。而在后GDPR时代，用户的个人信息保护已经在全球层面受到政府、用户的关注，谁更有能力保护用户的个人信息，将更容易赢得用户的青睐。如果在个人信息保护上，让用户怨声载道，就算基于一时的支配地位，用户因为离不开公司提供的相应互联网服务而“被迫同意授权”，但只要有新的可替代“黑马”出现，极有可能出现大规模的用户流失。

因此，像腾讯、阿里巴巴这样的互联网巨头，一方面，感受到了个人信息保护和数据合规的沉重压力；另一方面，它们也更清醒地意识到用户对个人信息保护的强烈需求。它们比以往任何时候都更有动力满足用户的这种期望。保护好用户的个人信息，不仅是一个合规问题，更是一个能在行业中保持优势地位的核心竞争力。

2、知情同意原则的适用应有侧重点

我国《网络安全法》第四十一条规定，“网络运营者收集、使用个人信息，应当遵循合法、正当、必要的原则，公开收集、使用规则，明示收集、使用信息的目的、方式和范围，并经被收集者同意。”

在此基础上，《信息安全技术公共及商用服务信息系统个人信息保护指南》在“4.2　基本原则”里确立了八项基本原则：目的明确、最少够用、公开告知、个人同意、质量保证、安全保障、诚信履行和责任明确。其中作为第一原则的目的明确原则规定，处理个人信息具有特定、明确、合理的目的，不扩大使用范围，不在个人信息主体不知情的情况下改变处理个人信息的目的。公开告知原则更是明确，对个人信息主体要尽到告知、说明和警示的义务。以明确、易懂和适宜的方式如实向个人信息主体告知处理个人信息的目的、个人信息的收集和使用范围、个人信息保护措施等信息。个人同意原则也是明晰了事先同意：处理个人信息前要征得个人信息主体的同意。

在域外法上，知情同意原则也被各类立法所明确，如欧盟GDPR、德国《联邦数据法》、瑞典《个人数据法》、新加坡《个人数据保护法》、美国《加利福尼亚州消费者隐私法》等。

这意味着，为了实现互联网广告精准投放目的，对用户个人信息的采集和使用，同样也需要遵循知情同意原则。并且，如前所述，要实现互联网广告精准投放，所使用的几种主要技术，其个人信息风险是不同的，用户对它们的接受度也不同。因此，知情同意原则的适用，针对不同技术，侧重点也会有所不同。

其中，用户画像、基于 Cookie 的用户行为定向是相对低风险的，并已通过科普、学术争论、隐私政策等多种渠道被不少用户所了解。用户对它们的接受度普遍较高，可以通过嵌入到普通隐私政策的方式，让用户点击接受，并保留用户可以通过删除Cookie的方式，实现 “无痕浏览”的权利。

而间谍软件则不会被用户，也不会被该用户正接受服务的ISP所接受。不少ISP一旦识别到侵入或接入到平台上的间谍软件，会通过风险提示方式，警醒用户不要安装、使用该软件；或者在用户投诉该软件系间谍软件时，迅速将其下架。正因如此，ISP不论是在普通隐私政策，还是特别隐私政策中，都不宜、也不会以知情同意为理由，要求用户接受间谍软件。

对于DPI技术，则比较复杂。它对ISP采集信息流，精准定位互联网广告用户，是个好帮手。但用户一旦知道ISP使用该技术，会普遍不悦，毕竟没有人喜欢在不知不觉中被监测。比如在英国，就曾有用户对英国电信和另一家DPI设备销售商Phorm提起诉讼，认为它们通过NebuAd197擅自采集、监测他们的个人信息。而为了赢取用户的信任，一些ISP公开明确表示它们不会使用该技术，除非征得用户的特别同意。[2]也就是说，在保护用户个人信息正变成互联网企业的一种竞争优势的当下，对于通过DPI技术采集、使用用户的个人信息，那些“爱惜羽毛”的互联网企业，会通过特别的隐私政策或隐私提示，逐个取得用户的特别同意后，方才可能会使用该技术。

鉴于互联网广告投放的精准度实质是一种匹配度，它不可能实现把广告内容一对一的精确投放给用户个体，而只是尽可能的选择与广告内容匹配度更高的用户群体进行投放。因此，互联网企业为广告业务所需，在采集、处理用户个人信息，适用知情同意原则时，需注意如下几点：

一，要明确告知用户，将会采集他（她）的哪些个人信息，并且未来将会用于互联网广告业务。

二，这些信息通过用户画像进行技术处理后，才会使用。

三，针对不同的数据收集方式，分别做出不同的声明，以及分别适用普通隐私政策或特别隐私政策。

四，在注重合规之外，还需要重视通过各种渠道，以生动易懂的方式增进用户对互联网广告精准投放的实质和所采用的相应技术的了解，以消除用户误解，打消用户顾虑。毕竟恐惧源于未知，终于认知。

[1] 网络广告系统的用户行为定向研究，复旦大学硕士学位论文

[2] Dustin D. Berger，Balancing Consumer Privacy With Behavioral Targeting，SANTA CLARA COMPUTER & HIGH TECH. L.J. Vol. 27, 2011.

*本文作者：牟萍，转载请注明来源

# 个人信息保护 # 知情同意 # 互联网广告

本文为独立观点，未经允许不得转载，授权请联系FreeBuf客服小蜜蜂，微信：freebee2022

被以下专辑收录，发现更多精彩内容

+ 收入我的专辑

+ 加入我的收藏

展开更多