[ 随(suí)着数据汇集(jí)、规模变大、透明度变高(gāo),数据越权逐渐成为(wéi)安全的核心问题,近(jìn)期(qī)不断发生的爆雷(léi)事件核心便是来自于数据泄露、数据私下交(jiāo)易(yì),以及隐(yǐn)私权泄露。 ]
[ 2019年11月(yuè)以来,公安部开展APP违法违规采集个人信息集中整治,下(xià)架整改100款违法违(wéi)规APP。 ]
大数据(jù)技术趋势下的“爬虫危机”日益得到有关部门的重视。
7月(yuè)18日,立木征信法人及大部(bù)分员工被警方带走;9月6日(rì),魔蝎科(kē)技高管被警方带走(zǒu),新颜科技CEO黄向前被带走,聚信立被曝(pù)有警方进驻调查;9月(yuè)11日,公信宝(bǎo)被杭州(zhōu)警方查封;9月12日,集奥聚合深圳分公司有10多人被带(dài)走,后(hòu)北京办公(gōng)室也被深圳警方带走(zǒu)多(duō)人;9月27日,同盾(dùn)科技子公司信川科技(jì)高管被带走调查。
所谓网络爬虫又名“网络蜘蛛”,是通过网(wǎng)页的链接地址(zhǐ)来寻找(zhǎo)网(wǎng)页,从(cóng)网站某(mǒu)一个页面开始,读(dú)取网页(yè)的内容,找到在网页中的其他链接地址,然后通过这些链(liàn)接(jiē)地址寻找下(xià)一个网页,这样一直循环下去,直到按照某种策略把互(hù)联网上所有的网页都抓取完为止的技术。
近日,浪潮集团高级副总裁、浪潮云董(dǒng)事长兼CEO肖雪在接(jiē)受第一财(cái)经记者采访时表示,随着数据汇集、规模变大、透明度变高(gāo),数据越权逐(zhú)渐成为(wéi)安(ān)全的核心问题(tí),近(jìn)期不断发生的爆(bào)雷事件核(hé)心(xīn)便是来自于数据泄露、数据私下交易,以及隐私权泄露。
通过爬虫技术获取数据并可能用(yòng)于不法用(yòng)途的(de)审查调查早已开始。中(zhōng)国互联网金融协会向会员单位下发《关于增强个人信(xìn)息保(bǎo)护(hù)意识依法(fǎ)开展业务的通知》。要求不与违规收(shōu)集(jí)和使用(yòng)个(gè)人(rén)信(xìn)息的第三(sān)方开展数据合作,不滥(làn)用、非法买卖和泄露消(xiāo)费者个人(rén)信息。
金(jīn)融业务之(zhī)外,更贴近普(pǔ)通受(shòu)众(zhòng)的APP数据(jù)安全与隐(yǐn)私(sī)保护也被纳入监管范围。国家(jiā)网络与(yǔ)信息安全通报中心发布《公(gōng)安机关开(kāi)展APP违法采集个人(rén)信息(xī)集中整治》的通报指(zhǐ)出,2019年11月(yuè)以来,公安部开展APP违法违(wéi)规采集个人信息集(jí)中整(zhěng)治(zhì),下(xià)架整(zhěng)改100款违法违(wéi)规APP。微店(diàn)、天津银行、考拉海购、晋江(jiāng)小说阅(yuè)读等APP名列其中,具体问题(tí)包括超(chāo)范围(wéi)收集、隐私协议不规范等。
云测数据(jù)总(zǒng)经理贾宇航对第一财经记(jì)者表示,在电(diàn)子信息化时(shí)代(dài)中(zhōng),个人信息的隐私问题逐渐受到重视(shì)。消费者(zhě)在使用个人(rén)信息享(xiǎng)受便(biàn)利的(de)同时,个人信息也是一个(gè)人重要资产的一部分。
贾宇航表示,一(yī)方(fāng)面要做(zuò)到完全(quán)透明,让消费(fèi)者(zhě)有(yǒu)数据授(shòu)权后知情数据的最终流向;其次,尊重版权,对于无版权数据,不应进(jìn)行商(shāng)业变现。
但(dàn)在大数据时(shí)代,用户数据一度被(bèi)认为是互联(lián)网企业的下一(yī)步希望所在。
2019中国企业(yè)领袖年会上,华兴资本董事长兼首席执行官包凡强(qiáng)调称,随(suí)着网民数量红利与市场红利渐趋(qū)瓶颈,互联网行业下一步发展(zhǎn)方(fāng)向与(yǔ)破局(jú)之点主要在于数据的应用。“过去(qù)二三十(shí)年里(lǐ)互(hù)联网把几(jǐ)乎所有(yǒu)的消费者带到了(le)网上,其中产生、沉淀了(le)大(dà)量的数据,同时大量企业业务也基本上了云。如果我(wǒ)们把数据看作资源的话,其实地(dì)下的(待开(kāi)采的(de))石油已经(jīng)很多了(le),如何进一步地挖掘(jué)、应(yīng)用好(hǎo),一定是下一步创(chuàng)新企业需要解决(jué)的问题(tí),也是(shì)我们未来的(de)希望所在。”
然而(ér),持续发生的大数据公司因(yīn)随意(yì)“爬取”用户数据信(xìn)息而(ér)被查(chá)封(fēng)的消息(xī)频(pín)频诉(sù)诸报端,技(jì)术时代到来前,如何(hé)确定安(ān)全红线(xiàn)?
贾宇航对第一(yī)财经记者表示,企业方应确(què)保数据安全性,保证自己的(de)数据(jù)资产不被商(shāng)业盗取。合理构建拥有数据的核心(xīn)壁垒,在(zài)金(jīn)融风控全流程中,做到(dào)认证作用,而并非(fēi)数据买卖。
另外,针对近来火热的AI数据服务行业,贾宇航表示(shì)AI数据也属于数(shù)据行业,本质(zhì)是提升让AI理(lǐ)解事物和世界的能力。作为AI数据服(fú)务商应同样重视(shì)用户个人隐私(sī)、版权(quán)、数据(jù)安(ān)全三点。隐私方面(miàn),如进行人体动作采集(jí),注重被采集人员是(shì)否知情,并且签(qiān)署对应的肖像授权协议,确保潜在法律风险;版权方(fāng)面,在进行数(shù)据采集后,数据公司要确保版权归属问题,若版权归属(shǔ)甲方(fāng)AI人工(gōng)智能(néng)企业,则不(bú)应再通过(guò)其他方式(shì)进行变现,在完成交付后应做到不留底;作为重要的数据资(zī)产(chǎn),AI数据也(yě)同样珍贵,做好安全防护(hù),确(què)保数据不被盗用。在企业(yè)内部工作(zuò)中,通过工具实现工作人(rén)员只有处(chù)理(lǐ)数据权限,而(ér)不能获(huò)取数据。