将物联网传感器和数据湖结合起来,这可以作为模式分析的一种强有力的方式,但对不同消费者和员工来说,也会带来隐私上的影响。
去年10月底,我有幸在迈阿密Unbound大会上主持了一个主题为人工智能和机器学习的讨论会,讨论会进行的同时,还举办了一次有关加密货币和区块链等颠覆性技术的出色的展销会。
该展览会和讨论会邀请了一些卓越的发言人,包括IBM的Alex Liu博士、NEORIS的Anthony DeLima 、迈阿密大学商学院Sara Rushinek教授和UnitedHealth的Ylan Kazi,而我也很高兴最终能够将此次活动的盛况介绍给读者。
自该展览会召开以来,我就一直在思考云中的机器学习这一主题,以及未来它可能将如何影响我们的生活。这一技术在许多方面可能给我们带来积极的好处,但正如所有颠覆性技术一样,它也有缺点。
例如,社交媒体——尤其是Facebook、Instagram和Twitter等服务——被誉为丰富我们生活的强大工具,从而能够帮助我们以前所未有的方式与他人建立联系。它们预示着一个新闻透明、即时报道和公民新闻的时代。
这些都是合法的福利。但这些好处也伴随着陷阱:一群 “生命之流”被无限分散的、拥有技术增强自闭症的人们;技术辅助气体照明的危险;仇恨团体和阴谋者得以在各地传播其有害思想;敌对外国势力对民主的颠覆;当然,当这些网站出现任何数量的API技术安全混乱时,大量个人信息也不可避免地会受到影响。
机器学习和人工智能也是如此。是的,传感器在健康设备中的普及可能而且将会成为一种强大的工具,用于对严重的健康状况进行早期诊断,并将改变医患之间的关系,从而在疾病可能危及生命之前使健康状况得到更动态和实时的监测。
但与社交媒体一样,基于云计算的机器学习也存在类似的黑镜陷阱。
机器学习是现代企业数字化转型趋势的重要组成部分。通过使用不同类型的传感器,便可以通过可测量的内容深入了解业务流程,以及使用模式分析关联这些数据。这些都是正变得越来越重要的能力,正迅速成为整个IT工具箱的重要组成部分。
例如,像SAP这样的公司,通过Leonardo企业智能产品,将物联网和部署为基于云的SaaS的已完成的应用平台结合在了一起,而这些应用平台可以很容易地进行定制,从而使企业能够创建复杂的数据可视化,以便在解决复杂的业务问题时获得洞察力。
通过大数据了解模式和趋势并不是什么新鲜事:多年来,美国国家安全局一直在从事复杂的信号情报(SIGINT)工作,目的是保护美国免受恐怖主义和外国的威胁。PRISM程序也揭示了这一点。同样地,研究公司NPD使用了来自大型零售商的大量销售点数据,以创建关于消费电子产品购买的重要趋势的报告。
如果说有什么新鲜的事的话,那就是智能数据收集和分析不再是世界上最大的公司和机构的专利了——任何公司现在都可以利用它。有了SAP Leonardo这样的平台或者Azure机器学习、AWS Sagemaker、谷歌云AI和IBM Watson机器学习这样的半成品云服务,在构建复杂的机器学习系统或应用程序的过程中,开发速度和投放市场的时间比以往任何时候都要快得多。
企业自然非常热衷于改进和简化业务流程。但是,帮助企业变得更加敏捷和节约成本的工具,也可以用来压迫他们的员工。
例如,Wi-Fi接入点可以收集设备附近的数据,因此,零售中的一个常见应用程序是使用这些信息,以便更好地理解进出商店的客流量以及顾客逗留的位置和逗留的时间。
但是,在企业中,通过使用数据相关性和模式分析,这也可以与移动设备管理、键盘记录、活动/存在性检测结合使用,以用于跟踪员工的位置和活动,从而更好地从整体上甚至是有针对性地了解员工的生产力。
同样的营销信息,如果它被托管在了主要的超大规模云提供商(如AWS或Azure)的 “数据湖”中,也不一定只限于一个租户。这些由商场中的一个零售商所收集的营销数据,可以作为联盟或伙伴关系的一部分与其他零售商共享,以便开发更为复杂的模式分析应用程序,从而了解用户所购买的产品,以及购买的时间。
从理论上讲,在多个云中的多个数据湖中收集的信息可以结合在一起,生成关于任意数量用户群的极其复杂的报告,尤其是如果你将这些信息与其社交媒体上的个人资料(比如他们的喜好和他们分享的内容 )结合起来的话。
从本质上讲,我们应该关心的是传感器收集的是什么种类的数据,如何访问这些数据,以及如何通过机器辅助分析将这些数据混合起来以不同的方式使用。
例如,苹果手表等可穿戴设备可以向医疗从业者提供有关患者整体健康状况的遥测,并提供警报和报告,因此医生就能够更主动地发挥作用,而不是在急性事件(如急诊)时才采取行动。
不过,人寿保险公司已经在使用同样的技术,比如John Hancock通过其“活力计划”,推出了受佩戴者整体活动和生活方式影响的保单。
不需要花费多少努力就可以对趋势分析进行延伸,而这一分析是企业几乎肯定会进行的,以便将设备或者甚至被保险人的智能手机上的GPS接收器的数据整合起来,从而了解,例如,这个人进了什么样的餐馆,以及这可能对这个人造成什么影响。
所以,在将来,你可能会想在去In-N-Out就餐的时候三思而行。
市场上也有一些产品,比如Sprint Drive,它们使用了基于云的服务来存储GPS行程和其他一些车辆性能数据——如果原始数据提供商出售了对这些数据访问权,保险公司就可以访问这些数据。
正如人们可能会选择加入John Hancock的“活力计划”一样,如果你使用了像Sprint Drive这样的自动跟踪设备,你可能会发现GEICO、USAA、Prudential或Hartford Insurance为你的汽车(强制)提供了一项动态保单。
你每天早上都会去麦当劳就餐吗?你在那条大路上开得太快了吗?那么我想你们的保险费每年整体上增加了3000美元。记住,这些不仅仅是有针对性的数据收集,你的邻居也在你的城市和直辖市建立趋势,这也会对你造成潜在影响。
耶,机器学习!
当然,所有这些例子都是企业为了自身利益将会做的事情,当企业能够访问这些数据时,这些数据是他们自己为内部应用程序而收集的。
我们甚至还没有开始钻研感兴趣的第三方将如何处理这些数据,一旦数据的访问权出售或授予给了他们,我们也没有探索来自不法分子的数据湖入侵事件的可能性,甚至也没有探索像我们最近看到的使用谷歌和脸书上的糟糕的API安全性,这类无意识的数据泄露事件。
机器学习和数据湖是强大的工具,可以像社交媒体一样提高我们的生活质量,帮助我们获得重要的业务和个人见解,而这些见解将使我们变得更加敏捷和敏感。但我们需要非常谨慎地对待数据的收集方式、共享方式、用途以及安全性。我想不出现在市场上还有什么其他颠覆性的技术能像它那样善恶共存。
云中的机器学习是预示着一个业务流程可见性和敏捷性的时代,还是会成为下一个人的噩梦,摧毁我们的生活和隐私性?一切终将见分晓。