人工智能平台如何运维(YOCSEF论坛)
人工智能平台如何运维(YOCSEF论坛)第二,数据垄断已经形成,如何加以有效治理是当下的紧迫任务。孟小峰教授的科研团队近期依据三千万移动用户的数据集,包括162个维度用户画像,爬取到30万个APP相关用户使用的信息,基于此,做了一个风险指数,它可以描述地域的风险,行为的风险,人群特征上的各种风险。从这一研究中不难发现10%的数据者,当下获取99%的数据,数据的垄断已经形成。第一,大数据应当放在数据生态中加以考量,应当以第三物的视角看待数据。他首先介绍了十几年来数据发生的变化,以大数据和云计算平台移动互联网方式存在,使得数据在内容和形式上发生改变,它由以企业描述变成以人的描述为主,我们在技术上需要建立数据思维的方法来利用数据,需要用数据智能的算法来有效的发挥数据的效用。孟小峰:人工智能时代的数据生态:数据都去哪了?人物小贴士:孟小峰,博士,中国人民大学信息学院教授,博士生导师。现为中国计算机学会会士(2013),曾任YOCSEF主
随着人工智能的发展和技术的进步,数据的聚集对隐私的威胁必然存在;而因物质的极大丰富,人们对隐私保护的追求愈来强烈;两者看似不可调和。本次论坛通过讨论和思辨,试图去深入一些问题,解决一些问题。
在今年的315晚会上,与往年不同,人工智能和大数据的一些公司也粉墨登场。这些企业利用其所谓的“高科技”手段,包括智能语音机器人、探针盒子等技术,给用户拨打骚扰电话,或者在公共场合就能窃取周围人的隐私信息。众所周知,人工智能的发展离不开数据的支撑,人工智能的发展也带来了数据的聚集,人工智能的发展也让数据获取变得容易。同时,数据作为一项重要资产越来越被人们所重视,更为重要的是很多数据涉及到我们的隐私,像我们的消费习惯数据,医疗数据,上网数据,交际、运动、饮食等产生的大量数据都涉及到个人隐私,而这些数据又不可避免的在日常生活中被智能设备所采集。在获得人工智能发展和便利的同时,社会效率得到了很大提升,但隐私信息逐渐被公开化,隐私保护和效率好像出现了悖论。
论坛现场
3月23日上午,CCF YOCSEF在北京举办论坛“人工智能时代,隐私和效率一定是不可调和的吗?”,邀请行业内专业人士以隐私和效率为主题,共同讨论人工智能时代数据资产发展之路,并尝试去解决隐私和效率的问题,为中国人工智能产业发展献计献策。本次论坛的由YOCSEF总部学术委员、来自曙光公司吴宗友博士和YOCSEF总部学术秘书、滴滴出行吴国斌博士共同担任执行主席,CCF YOCSEF总部学术秘书、北京交通大学李浥东博士和YOCSEF总部学术委员、360公司陶耀东博士共同担任在线执行主席。
孟小峰:人工智能时代的数据生态:数据都去哪了?
人物小贴士:孟小峰,博士,中国人民大学信息学院教授,博士生导师。现为中国计算机学会会士(2013),曾任YOCSEF主席(2003-2004)。近期研究领域为大数据管理系统,包括数据融合(知识图谱构建)、大数据实时分析、大数据隐私管理、以及交叉性研究如社会计算等。
孟小峰教授从2006年就开始研究隐私问题,对隐私和效率有着深刻的理解。他在引导发言中阐述了三个观点。
第一,大数据应当放在数据生态中加以考量,应当以第三物的视角看待数据。他首先介绍了十几年来数据发生的变化,以大数据和云计算平台移动互联网方式存在,使得数据在内容和形式上发生改变,它由以企业描述变成以人的描述为主,我们在技术上需要建立数据思维的方法来利用数据,需要用数据智能的算法来有效的发挥数据的效用。
第二,数据垄断已经形成,如何加以有效治理是当下的紧迫任务。孟小峰教授的科研团队近期依据三千万移动用户的数据集,包括162个维度用户画像,爬取到30万个APP相关用户使用的信息,基于此,做了一个风险指数,它可以描述地域的风险,行为的风险,人群特征上的各种风险。从这一研究中不难发现10%的数据者,当下获取99%的数据,数据的垄断已经形成。
第三,建立数据透明的治理体系是解决人工智能时代效率与隐私的关键,中国应该先走一步。这个体系建立的过程首先包括数据收集和决策,我们在数据收集之前要考虑用户个人数据的用户,收集之后应该考虑数据来源的真实性,否则我们作出的决策是不可靠的。其次在决策的阶段,主要的挑战在于过程的透明化、可解释性上。在商业上,要做到用户得到个性化广告,但并不知道它的推荐算法,算法对用户不透明。在政策上,民众也希望对政治领导人的决策过程有一个公开透明可理解的结果。
朱巍:网络隐私与信息安全常见的三个悖论
人物小贴士:朱巍,法学博士,中国政法大学传播法研究中心副主任,研究员,信息社会50人论坛成员。朱巍博士也是中国消费者协会、互联网协会多个委员会的专家委员,担任中国互联网电子数据研究院电子数据法律与政策专家组委员,中国人民公安大学网络安全创新协同中心专家。
作为一个法学博士,朱巍研究员从一个与技术不同的角度,通过引述多个法条和生动的案例,让大家深入浅出地理解用户和消费者、大数据和个人信息、以及数据权和人格权的异同。在用户和消费者是否是一回事上面,朱巍通过列举《电子商务法》中的消费者和《网络安全法》中的用户两个名词不同,进而解释用户权和消费者权也不是一回事。他指出,在互联网免费经济时代,我们不能用现金对价,但可以用数据来换取对价,我们就有可能从用户变成消费者,用户和消费者的界限是模糊的。在现在这个社会中,隐私的价值已经确定,控制在谁的手里,这是法律和技术的应该关注的问题。此外,朱巍认为大数据不一定可以直接或间接识别到个人信息。所以大数据和个人信息这两个概念如果分不清楚,用保护个人信息的态度去看待大数据,数据经济没法发展。
在随后的思辨环节中,与会的嘉宾就如何平衡个人隐私和个人效率,平衡个人隐私和组织效率,人工智能对隐私和效率的影响和变化,以及隐私保护技术和政策纷纷发表各自的观点。
隐私和效率平衡的三原则
360行业安全研究中心主任裴智勇博士认为APP获取个人信息应遵循三个原则。第一个是最小必要原则,即APP获取这个信息是不是服务的必要数据,应该取得最小必要的范围。比如手电筒获取我的通讯录显然超出这个原则。第二个是用户知情原则,即第一次使用该APP的时候手机需要提示你要不要开启某项服务,你可以禁止它,且不影响APP使用。第三个原则是必要保护原则,即APP收集我们的数据,要保证数据安全,保证不被泄露,不被贩卖,不被滥用。裴智勇还提出了用户隐私保护的一个方案,即三方制衡,让数据的所有者、运营者和安全防范方是分开的。
隐私是超越资产属性的,尊重隐私高于市场价值
中科院计算所韩银和研究员认为隐私是超越资产属性的,类似于人格权利的东西,它应该是我们文明或者尊严的表现。当考虑拿隐私去交换其他利益时要以尊重隐私为最优先原则,然后再判定其价值。其次,隐私的第三方持有并不可怕,但第三方持有人要做到两点:第一点是“不扩散原则”,包含不能被黑客窃取等任何形式的主动、被动扩散,谁持有谁负责;第二,要做到对隐私人“有利原则”,不能利用用户隐私反相宰熟。具体技术上,目前隐私人和第三方数据采集人之间的入口式条款合同制形式,无法应对隐私数据的可复制性和无形性,需要有过程管理的新型隐私管理模式。现在有很多案列隐私出问题,网络服务商会说已经签了合同,我们用你们的隐私之前,都是征得同意的,但对于隐私人而言,这种同意是以某种很隐晦的方式让你确认,只能一揽子同意或者二选一的被动同意,相信一定会有新技术出现,能够让隐私数据可观可控。
解决隐私问题最终需要依靠意识的提升
北京交通大学李浥东教授从事的工作就是隐私保护研究,他一直非常困惑和郁闷两件事,第一个问题是隐私问题到底是政策能解决的问题,还是技术能解决的问题?第二个是寻找隐私和效率的最佳平衡点。整体上,李浥东认为,中国大陆地区属于隐私保护程度较低的,只有通过一两代人的意识提高以后,才能从根本上解决这个问题。
市场化可以有效解决隐私问题
清华大学唐杰教授认为,数据应该在强立法的基础上产品化,市场化,包括隐私数据。当前就属于模糊化,不同的人获取数据的难易程度和代价相差巨大。唐杰支持欧洲的GDPR《一般数据保护法案》,更严格的立法,每个人都可以把自己的数据包装,根据法律规定和个人意愿,让市场无形的手来决策,这样才能让隐私数据正面为效率发挥更大的作用。
隐私和效率问题前途光明,道路曲折
孟小峰教授最后总结到,解决隐私和效率的问题根本出发点要本着如何促使当下大数据生态健康有序地发展,而不是加以扼杀。这需要我们从技术和政策角度多方位考虑,前途是光明的但道路是曲折的。
下排左起韩银和、朱巍、孟小峰、裴智勇、唐杰、李浥东
上排左起林俊宇、唐卫清、吴国斌、吴宗友、高志鹏、李文珏
随着人工智能的发展和技术的进步,数据的聚集对隐私的威胁必然存在;而因物质的极大丰富,人们对隐私保护的追求愈来强烈;两者看似不可调和。本次论坛通过讨论和思辨,试图去深入一些问题,解决一些问题。首先现场听众在概念上对隐私、效率、数据、用户、消费者等有了多维度的深入理解,并在此基础上有了更深入的思考,更清晰的认识,并获得了提升;同时,也希望本次论坛对未来隐私保护法的出台以及人工智能的发展对应的政策支撑和技术路线也能有一定的借鉴意义。这就是YOCSEF,承担社会责任!提升成员能力!
中国计算机学会
ccfvoice
长按识别二维码关注我们
点击“阅读原文”,查看详情。