扫黄、大数据、国安 滴滴能做的事惊掉你的下巴

Danlores
2021-07-20
image
滴滴出行(图片来源:Getty Images)

网信部一纸檄文,将滴滴推上了风口浪尖。

我有个朋友从事银行数据科学工作,对大数据隐私比较敏感。

银行辅助进行黄赌毒排查工作。

以黄为例,聊聊大数据如何用最基本的信息和最简单的手段,找出LSP和不法分子。

每个银行都有一张最基本的用户收支明细表,记录每个用户的每一笔收支记录。

如【时间】2021年7月5日8点15分,【持卡人】Jack在【商家】永和豆浆早餐店花【金额】5.5元买了一杯豆浆、一根油条和一个荷包蛋。

这份数据可以用来解读非常多的信息。

如何扫黄?

第一步,找出那些晚上11点至凌晨3点仍有活跃交易的账户;

第二步,如果这些金额也符合金额特征如”398元”、”498元”等,那就把这笔交易标记为可能涉黄;

这里需要特别指出的是为什么不用商家名称,因为有些搞黄色的按摩会所非常狡猾,很少有使用直接商户名的(如”红浪漫按摩养生会所”的收款名称可能摇身一变成了”永久便利店”);

第三步,假设一个商家1个月有1万笔交易,且70%的交易都符合上述特征。那么大概率这个商家就是涉黄的。

银行会把这批名单输送到公安,至于公安下一步怎么做那就不知道了。

一个特别搞笑的事情是4月份月度排查的时候,名单里居然出现了一家”榆林市解放路空气净化器”的商家,我们觉得不可思议,是不是数据搞错了。

再次核实后确认,这个商家4月份共有989笔交易,有304笔交易是398元,483笔交易是698元,而且交易发生的时间都是在凌晨。 

后来同事们笑称,这哪里是空气净化器,明明是前列腺净化器。

回到滴滴,滴滴掌握的是用户出行数据。

何为用户出行数据?从数据库的角度,至少可以拆解成三张表。

1.用户出行记录表,Linda早上8:00从科苑路打车到科技园; 

2.底层LBS表。精确到经纬度的位置映射,如北京动物园,116.344765,39.941026;

3.地理名词标签表。如科技园西南门-高档写字楼;红浪漫KTV-休闲娱乐;凑凑火锅(大悦城店)-餐饮火锅。

这三张表可以用来干什么坏事儿?我脑补如下:

1.用户隐私角度。 

还是搞黄色,拿搞黄色的为例,近半年内去过5次以上休闲娱乐场所的标记为可能搞黄色;

当然了,滴滴不拿搞黄色盈利,推送贷款才是主要用途。

这里从风控角度可以衍生非常多的标签;如经常往返机场,说明你是有一定消费能力的差旅人士;半年前就注册了但是一直没用,最近开始使用打车软件并且去了好几趟趟家居城。

那么你极有可能被推送贷款。

因为你还得起且有贷款需求。

2.国家安全角度。

2.1暗杀大人物。

北京大院住了很多大人物,当然这些住所很隐蔽,就算你是FBI,也不能挨个排查。因为工作量大。

如果有了滴滴大数据,就可以用排除法了。

首先这些大人物大院子不可能有人经常坐滴滴,人员活动受到限制。搞清楚打车热力图就可以极大减少排除工作量。然后展开暗杀行动。

2.2策反小人物。 

从差旅人士里面找策反对象。

比如禄口机场-南京核工业集团、中川国际机场-兰州核工业基地。

有人会问了,这么级别的人物还需要打车?派奔驰接送不就完了么?

有一类群体是管理咨询顾问。他们经常出入各个国企,自己打车…十四五战略规划项目接触到保密材料绰绰有余。

大数据时代,每个人都在裸奔。

怎么把裤子穿好?几个tips送给大家

1.笛卡尔集支付。3张银行卡、3种支付方式(微信 支付宝 银联),比如今天用微信建行卡吃饭,明天用支付宝招行卡网购。

当然,现金最安全。 

2.不使用真实地址。如想打车去红浪漫ktv,那最好是定位终点为附近100米的鸡公煲或者肯德基。

3.不作恶。人在做,天在看,数在记。

(全文转自微信公众号慕云朝伟

猜你喜欢

编辑推荐

救救工厂:工厂真的卷不动了

浦铭心  2024-11-04

image