网上爬虫到底是什么(不是侵犯个人信息的遮羞布)
网上爬虫到底是什么(不是侵犯个人信息的遮羞布)如今,大数据风控领域一片风声鹤唳,而这些大数据公司又是很多互联网金融公司的资信审核的数据来源,爬虫被查的蝴蝶效应正迅速传导至互联网信贷市场。所以,北京银保监局在2019年10月12日公布《关于规范银行与金融科技公司合作类业务及互联网保险业务的通知》,明确规定:“严禁与以‘大数据’为名窃取、滥用、非法买卖或泄露客户信息的企业开展合作。”但是,爬虫程序的更大危害则在于,目前不少打着“大数据”旗号的公司,用爬虫程序抓取了未公开、未授权的个人敏感信息,甚至违规留存、使用、买卖这些隐私数据,而且这种大数据还是互联网金融风控的“基础设施”。原本,你申请A银行的一项贷款产品,就需要授权A银行去查询获取你的社保、公积金、航班出行等数据,银行可能通过中间数据服务商去授权爬虫,这是一个正常的“业务闭环”,这时抓取的数据是得到当事人授权的,个人数据当“用后即删”。然而,一些大数据公司将这些个人信息当成“公司资产
10月21日,浙江警方突击进入港股上市地公司——51信用卡在杭州西溪的办公大楼。当天下午,51信用卡股票临时停牌,停牌前跌幅为34.69%
虽然,51信用卡被警方调查的真实原因还有待权威披露,但是可以肯定的是,对于网络爬虫、互联网征信、风控的强监管正在加码。此前有杭州存信数据科技有限公司、杭州魔蝎科技、上海新颜科技等涉及“爬虫”服务产品的公司都已被警方介入调查。
“网络爬虫”就是自动抓取互联网信息的程序。用户熟知的百度搜索引擎就是一种爬虫技术。爬虫本身是一个“中性技术”,这也是进行大数据分析的基础,但爬虫程序也有着它的负面危害。
首先,无限制的爬虫程序可能对网站服务器造成压力。比如,最高人民法院下属的中国裁判文书网之前就“压力山大”,爬虫系统无限制访问,非法获取裁判文书数据,造成网站负荷过大。最高人民法院不得不用限制列表翻页数量来防止爬虫系统,结果对正常的浏览用户造成了很大的困扰。
但是,爬虫程序的更大危害则在于,目前不少打着“大数据”旗号的公司,用爬虫程序抓取了未公开、未授权的个人敏感信息,甚至违规留存、使用、买卖这些隐私数据,而且这种大数据还是互联网金融风控的“基础设施”。
原本,你申请A银行的一项贷款产品,就需要授权A银行去查询获取你的社保、公积金、航班出行等数据,银行可能通过中间数据服务商去授权爬虫,这是一个正常的“业务闭环”,这时抓取的数据是得到当事人授权的,个人数据当“用后即删”。然而,一些大数据公司将这些个人信息当成“公司资产”,去资本市场画大饼、讲故事。
甚至有的大数据公司,在用户没有授权的情况下,就去用爬虫抓取信息,目前关于个人社保、公积金、司法信息、网银支付宝账号密码、京东等电商平台交易记录、社交平台信息等重要隐私数据,被不少“大数据公司”公然出售。
所以,北京银保监局在2019年10月12日公布《关于规范银行与金融科技公司合作类业务及互联网保险业务的通知》,明确规定:“严禁与以‘大数据’为名窃取、滥用、非法买卖或泄露客户信息的企业开展合作。”
如今,大数据风控领域一片风声鹤唳,而这些大数据公司又是很多互联网金融公司的资信审核的数据来源,爬虫被查的蝴蝶效应正迅速传导至互联网信贷市场。
爬虫也好,大数据也好,都不是侵犯公民个人信息的遮羞布,之前大数据风控行业门槛低,业内鱼龙混杂,很多业内的大公司的数据来源,是经不起逼问的。
“出来混总是要还的”,未经授权的爬取、贩卖数据,那就是“偷窃”,该来的监管风暴早晚要来。