普   及   跑   步   健   步   知   识   ,   预   防   跑   步   健   步   伤   害   ,   增   加     跑   步   健   步   乐   趣   ,   提   高   国   民   身   体   素   质

跑步圣经(跑圣)

 找回密码
 注册

QQ登录

只需一步,快速开始

扫一扫,访问微社区

搜索
美女照我去战斗减肥运动入门伤痛预防必读跑圣(跑步圣经)服务器托管募捐跑步入门必读跑步圣经网简介和网站守则
查看: 1602|回复: 5

干货:前海征信数据分析师教你用移动数据防诈骗

[复制链接]
发表于 2016-8-16 19:27 | 显示全部楼层 |阅读模式

  
  最近风头正劲的大数据风控,可以在对用户数据的关联分析中发现蛛丝马迹,从而阻止欺诈的进一步发生。但是,对于很多有大数据风控需求的公司来说,最大的问题是没有足够的数据。当前,市面上虽然有提供外部数据校验的产品,但如果笔笔业务都查,势必增加很多成本。能够有什么低成本的办法,可以先过滤掉那些潜在的欺诈用户呢?就让“朝阳35处”的大数据专家来讲一讲,如何用手机端得到IP数据的相关数据进行欺诈判断的干货吧。
  一、IP数据
  最直接的就是看IP
  最直接的就是通过IP来看。IP所揭示的风险几何?可以从以下几个角度来判断:
  1.代理IP判定
  在互联网上每天有许多公开的代理IP,代理IP的目的是为了隐藏自己的真实IP,所以使用代理的,基本上可以判断为有欺诈嫌疑。可以通过每天的自动爬虫,爬取互联网上的代理IP作为黑名单。
  2.IDCIP
  一个toc的贷款业务,跑来注册的IP是云服务器的IP,这正常吗?显然不正常。事实上很多就是被黑的服务器,或干脆就是自己租的服务器来恶意借款。这里就要去做一些收集,各大云服务商、各大IDC服务器段。可以维护下来作为黑名单。
  3.技术判定
  反向探测对端端口开放情况:代理常用端口是80和8080,如果对端IP开启了这些端口,显然是不正常的,一个家用IP地址是不大会开放这些端口的。
  HTTP头的X-Forwarded-For:这个字段只有在通过了HTTP代理时才会添加,如果带有XFF,那就是代理了。
  源端口:大于10000的源端口有两种情况,不是代理就是大型机构,所以会有误伤,建议判断权重在50%。
  Keep-alive:带有Proxy-Connection:Keep-Alive的报文,毫无疑问是代理。
  二、手机号码认证
  建立自己的高风险库
  用户在注册或者提交资料时候的手机号码,也是一个可以验证的维度。这里也可以通过一些方法收集所谓“黑名单”,可以有以下几种途径:
  1.收码平台手机
  欺诈分子通过在收码平台上开项目,可以使用大批量的不同号码来注册。通过爬虫定期爬取,可以得到这些信息。
  2.小号手机号码
  目前有一些小号软件,可以虚拟一个号码出来,这些号码像正常电话一样,可以打出去,接听,收发短信。在网上搜索:小号,即可找到大量类似平台。把这些号码爬取下来作为黑名单库。
  3.撞库法
  利用注册用户的手机号码,去各类P2P平台上注册,如果提示号码已被注册,则说明该用户对资金有较强需求。
  4.定向爬虫
  例如在一些分类信息网站上爬取中介的手机号码,作为高风险库。
  三、设备指纹
  世界上每台设备都是独一无二的
  世界上没有完全相同的两台设备,每台设备都是独一无二的。可以通过抓取用户手机上的一些特征,形成一个特征编码,这就是“设备指纹”。通过设备指纹,可以判断同一台设备,注册了多少账户,登陆了多少账户,是从设备角度进行判断的一个重要手段。
  同样,欺诈分子在对抗中也逐渐在升级。欺诈分子也开发出了诸如008神器、海马玩等软件,可以一键修改设备相关信息,来以此绕过设备指纹。针对欺诈分子的工具,可以通过作弊软件识别、冷门信息算法。所谓作弊软件识别,市面上很多作弊软件,都是通过同一框架进行开发,因此可以加入对这个框架的识别,来判断是否使用了作弊。而冷门信息算法,则是抓取一些欺诈分子没有注意到的地方,例如传感器的某些信息,例如蓝牙、电池、音乐排序、网卡生产商的某些信息来组成算法,对欺诈分子在修改时不注意的这些地方进行判断。
  四、位置数据
  需要用户授权
  位置数据主要使用GPS进行判断,需要用户授权。位置数据可以有多种使用方式:
  1.定期调取GPS,以此来判断工作地址和家庭地址,与进件资料作比对,看用户是否包装资料。
  2.活动环境位置,用户经常在一些不良场所活动,例如赌场、夜店活动,说明此人可能有不良习惯。
  3.GPS移动异常:可以根据用户的GPS移动距离计算,例如1小时前在上海,1小时候在北京,则有GPS造假可能。
  4.相同GPS:同一位置多笔申请借款,说明有欺诈嫌疑。多台设备同一GPS,说明设备之间有关系,可以作为关联欺诈的判断。
  五、APP数据
  慎重!小心侵犯用户隐私
  可以探测用户的APP列表。如果存在大量贷款类APP,则说明用户对资金需求强烈。同样,如果用户手机没有其他APP,则说明该设备可能用来欺诈。如果探测到安装有模拟器类、GPS伪造类,说明用户有欺诈可能。
  对用户的APP数据进行采集,实际侵犯了用户隐私。请慎重。
  六、设备账户信息
  若采集到APP上的用户名
  在设备上还可以采集到APP的用户名。以此来建立用户名与设备之间的关系,同一个APP存在3个以上的用户,则说明该设备有盗账户嫌疑。其他APP账户与业务申请吻合,则可以对该账户一个较高信任分数。同样,该类数据采集也是对用户隐私的严重侵犯。
  七、通讯录数据
  通讯录数据需要用户授权
  通讯录数据需要用户授权。对通讯录信息的获取,可以防止欺诈关系圈。有几种情况:
  1、通讯录为空,说明该设备有欺诈嫌疑。
  2、通讯录内容,可以形成关系,作为关联欺诈的一个重要判断。
  3、通讯录名称标识,可以通过社交关系信用过判断本人信用。
  “通讯录数据也是严重侵犯用户隐私的行为。”
  八、设备关系数据
  多维度进行
  1.相同WIFI:两个设备多次出现在同一WIFI下,则说明设备之间有关系。出现次数越多,关系越强。
  2.蓝牙配对:蓝牙配对记录的采集,可以获得两台设备的关系。
  3.GPS:前文已说过,同一GPS出现的设备,说明设备有关系。
  4.通话记录数据:通过通讯录、通话记录可以得到关系数据,而且可以根据通讯录名称直接标明关系。
  综上,可以从多个角度的数据进行分析,对潜在的欺诈行为进行判定。其中部分数据,需要考虑到用户的授权。如果用户未进行授权,在借贷业务上,则可以对该进件进行降分处理。另外,部分数据能否采集,还需遵循国家相关规定,同时要保护好用户隐私。
  不过,要是技术主管看到上述介绍,表示开发起来周期长,人手也不够,不妨还是考虑试试“好信盔甲”吧。好信盔甲是平安集团旗下第三方征信公司前海征信推出的一款基于大数据的反欺诈系统产品,可以为您订制整套反欺诈解决方案。
  关于“朝阳35处”
  我们是来自于前海征信的专业大数据挖掘团队。我们不仅是数据科学家,更是数据玩客。我们既用数据挖掘技术解决专业领域的问题,也喜欢在各个领域寻找数据的乐趣,以好玩易懂的方式给大家提供新鲜靠谱的内容。我们会每周发布一篇原创干货,欢迎大家关注。
  

                               
登录/注册后可看大图
发表于 2016-8-17 13:07 | 显示全部楼层
科技这种东西真的很深奥
回复 支持 反对

使用道具 举报

发表于 2016-8-17 14:29 | 显示全部楼层
世界上每台设备都是独一无二的
回复 支持 反对

使用道具 举报

发表于 2016-8-17 15:28 | 显示全部楼层
对于数据这种东西,本人表示茫茫的
回复 支持 反对

使用道具 举报

发表于 2016-8-17 15:39 | 显示全部楼层
这个办法还真得学着点
回复 支持 反对

使用道具 举报

发表于 2016-8-21 18:56 来自手机 | 显示全部楼层
上证指数,没看懂
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

关闭

站长推荐上一条 /1 下一条

我们欢乐和痛苦的源泉都是我们的身心!与其求于外物,不如内求于已。
远山、绿水、清风于跑步时透于己身,焉不是世间极乐!
匀呼吸,振意志,松筋骨,用腰力,“以跑入道”不远矣。


扫一扫关注跑圣公众号

QQ|小黑屋|手机版|Archiver|联系我们|跑步圣经(跑圣) ( 粤ICP备2021066816号联系QQ:31007776  粤公网安备 44030302000263号

GMT+8, 2024-4-24 11:47 , Processed in 0.196403 second(s), 7 queries , Gzip On, MemCache On.

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表