科技领域近年来有这样一个趋势:移动互联红利正在消退,而数据红利才刚刚开始。据预测:“数据”+“人工智能”将成为未来5-10年的科技投资主线,在过去的十年中,全球每年产生的数据量以50%以上的CARG增长,2015年全球产生数据8ZB(1ZB = 1012GB)。
据IDC预测,2020年全球产生数据量将超过40ZB,相当于地球上每个人产生5200GB的数据。基于海量数据深度学习的人工智能第三次浪潮可能走的更远。
一些领域数据存储量非常大,例如视频、安全、情报等。据说世界上每生产两块硬盘,就有一块用于存储安防监控的视频数据。例如在北京,用于安全监控的摄像头数量超过了200万个,每一个摄像头24小时不停地录制图像。这就意味着,每一天这些摄像头都会录制两百多万天的图像,折合起来,总时长将超过五千年。
这样庞大的数据量,需要耗费巨大的存储成本。因此,一般情况下,每隔30天(或者更短时间),就需要将之前存储的视频循环覆盖。这样做的结果就是,不仅白白浪费了存储资源,而且还会丢失大量的有效线索。
如何从海量数据中提取有价值的数据并转化成有意义的情报呢?专注于安防行业的AI企业格灵深瞳创始人赵勇认为单纯依靠大数据做安防行业的情报挖掘工作效率非常低,而结合AI将大大提升海量数据向有意义的情报的转化率。
赵勇认为实现这一转化率的提高主要在于三个方面:第一是人脸识别、第二是汽车的识别与跟踪、第三是机器识别结果与地理信息的融合。
首先通过高清摄像头采集到路面车辆、行人等数据,通过人脸识别技术识别人物,并保留人物属性信息存入公安系统。那么假设一个人被绑架后,标准流程是先查看过去一个受害人的车辆轨迹,需找跟踪他的车辆,他们的活动范围等活动特性,以此快速聚焦嫌疑人的生活或者经常活动的地点,判断可能把受害人藏到什么地方。
以前警方要去做非常多的人力工作,而通过AI ,将所有的原始数据变成结构化的信息,把这些信息放在一个功能很全的平台里面去,用户只要通过一个网页,就可以完成这个过程。
在整个数据挖掘过程,要做到全面、深度、多模态的挖掘工作。所谓全面是要实现对每个看到的人进行挖掘而不仅仅是嫌疑人,所谓深度是对每一个被观察物体的各种信息进行挖掘,而不简单是人与物的对比,所谓多模态是要综合一个人的各项信息挖掘他的行为特点,例如消费记录、车辆的信息、社保的资料等等。
对于安防行业现状,赵勇认为,目前公安领域对于AI已经是刚需,而现在的瓶颈在于AI企业本身能否将这一的系统快速落地,如何实现快速建立稳定、可靠小型的数据中心。
利用AI将海量数据转换成有意义的情报
发布时间:2017.04.01