编者按:关心AI的人一定希望了解这个行业的最新发展趋势,最近行业分析机构CBInsights最近发布了2019年AI趋势报告正好能满足这个需求。这份84页的报告识别了25种AI趋势,运用CBInsights的NExTT分析框架,从行业采用度和市场优势两个维度对其进行归类,可以为不同参与角色提供决策参考。
其关键发现是对电子商务搜索词的上下文理解正在摆脱“试验”阶段,不过距离广泛采用还有很长一段路要走;深度学习是当前绝大部分AI应用的引擎。不过因为胶囊网络,这种技术可能需要改进一下了;先进医疗保健与生物测定领域的研究人员正在开始利用神经网络研究和测定此前难以量化的非典型风险因素;能访问大型标签化的数据是训练AI算法的必需,而逼真的仿造数据也许能解决这一瓶颈。
为了方便各位了解,36氪对这25种趋势进行摘要编译介绍。
必需
开源框架
AI的进入门槛变得空前的低,这要感谢开源软件。
以2015年Google开源TensorFlow机器学习库为开端,现在AI(尤其是深度学习)的开源框架已经形成百花齐放的局面,其中有Facebook的PyTorch、特利尔学习算法研究所(MILA)的Theano、Keras、Microsoft Cognitive Toolkit以及Apache MXNet等等。
开源AI框架是双赢的局面:一方面令人人都能用上AI;反过来,贡献者社区也为加速Google等公司的AI研究提供了帮助。
知名AI专家Yoshua Bengio表示:
支持深度学习研究的软件生态体系发展得很快,现在已经达到了一种健康的状态:开源软件成为规范;各种框架出现,满足了从探索新颖想法到生产部署的各种需求。而且不同的软件堆栈也在刺激的竞争氛围下得到了有力的行业玩家的支持。
边缘AI
对实时决策的需求正在将AI推向靠近边缘的地方。
在智能手机、汽车甚至可穿戴设备等边缘设备上运行AI算法,而不是跟中心云平台或服务器通信,使得边缘设备具备了在本地处理信息的能力,并且可以更快速地对情况做出响应。
Nvidia、高通、苹果及若干初创企业均在开发用于边缘的AI专用芯片。
边缘AI对消费者电子、电信、医疗影像等主流行业均有应用意义。比方说监控摄像头的人脸识别、华为、苹果等智能手机的人脸与对象识别、Tesla AI芯片的即时驾驶决策、婴儿监视器、无人机、机器人视觉能力(无互联网连接)等。
在2018年各大公司的财报会上,提到边缘计算的次数已经明显增多。
不过尽管边缘AI具有减少延时的优势,但也存在局限。那就是存储和处理能力受到限制。预计会有更多混合模式出现,使得智能边缘设备能够相互沟通以及与中心服务器通信。
脸部识别
从手机解锁到登机手续,人脸识别正在进入主流。
人脸识别在中国的媒体热度从2016年开始就不断升温。
中国对人脸识别技术的需求也与之同步。在这方面中国已经冒出了商汤科技、Face++、CloudWalk等独角兽。
美国这方面的的专利申请也呈现相似的趋势。
人脸识别的早期商业应用正在安保、零售及消费者电子领域出现,并且迅速成为生物特征识别的主流形式。
尽管人脸识别应用日益广泛,但这种技术并不是没有瑕疵。曾有报道称Amazon将一位国会议员认成了犯罪份子。华尔街日报记者用一张校长照片作为面具就轻易骗过了西雅图一所学校的智能摄像头。
医疗影像与诊断
美国FDA正在给AI即医疗设备开绿灯。2018年4月,FDA批准了无需专家补充意见进行筛查糖尿病视网膜病变病人的AI软件。该软件叫做IDx-DR,其识别率达到了87.4%,对没有此病的识别率也达到了89.5%。
此外,FDA批准了初创企业Via.ai的CT扫描与潜在中风症状通知软件Viz LVO,以及初创企业Arterys的Oncology AI软件包,后者可以识别肺部与肝脏损伤。
监管的放松给商业化开辟了新的道路。自2014年以来,共有80家AI影像与诊断公司完成了149项融资交易。
初创企业Healthy.io的第一款产品Dip.io利用率了传统的尿液分析试纸来监控若干尿路感染:用户用智能手机拍摄试纸照片,计算机视觉算法就能根据不同的光照情况和相机品质对结果进行校正。产品可检测感染及怀孕相关的并发症。已在欧洲、以色列商用的Dip.io也已获得FDA放行。
预测性维护
AI工业物联网可为从制造商到设备保险商的既有者节省数百万美元的意外故障损失。
预测性维护利用传感器及智能摄像头不断采集机器数据(如温度、压力等)。生成的实时数据的规模以及格式的多样使得机器学习成为工业物联网不可或缺的组件。假以时日,算法就能够提前预测故障。
工业传感器成本的下降,机器学习算法的进展,以及边缘计算的推进,这些均使得预测性维护的应用变得更加广泛。
从下图可以看出,对领域的投资正在逐年递增。
其中活跃的投资者包括GE Ventures、西门子、SAP等。甚至微软等大公司也对自己的云与边缘分析解决方案进行扩展,提供预测性维护能力。
电子商务搜索
对搜索词的上下文理解已经走出“试验”阶段,但是大规模采用仍有很长一段路要走。
自2002年以来,Amazon已经申请了35项与“搜索结果”有关的美国专利。其中包括利用卷积神经网络“确定一组图像与查询图像类似的物品”,利用机器学习分析图像的视觉特征,并基于此建立搜索查询等。
eBay则利用机器学习来分析卖家的产品描述,然后借此寻找同类产品。
但是很多买家都是使用自然语言来进行查询,这对电子商务搜索构成了挑战。新兴初创企业于是开始为零售商提供搜索技术。
图像搜索初创企业ViSenze的客户包括Uniqlo、Myntra、乐天等。它可以让进店客户拍摄喜欢的东西的照片,然后上传,在网上找到同样的产品。
获得阿里投资的以色列初创企业Twiggle正在基于电子商务搜索引擎开发语义API,对买家的特定搜索做出响应。
试验
胶囊网络
深度学习是当今绝大部分AI应用的引擎。但由于胶囊网络,这种技术现在可能需要改进一下了。
胶囊网络(CapsNet)是深度学习先驱Geoffrey Hinton 2017-18年时提出的概念,旨在克服当前图像识别方法(主要是卷积神经网络CNN)的缺陷。
这种缺陷主要有2个。一是难以识别精确空间关系。比方说右图中尽管嘴巴的相对位置发生了改变,CNN仍会将其识别成人脸。
二是无法从新的视角去理解对象。比方说下图中胶囊网络在识别1、2行为同一玩具的不同视角中表现要比CNN出色得多。CNN则需要更大的训练数据集才能认出每个方向的对象。已经有黑客通过引入少量噪音就能让CNN把目标误认成其他对象。
尽管目前对胶囊网络的研究仍处在初期阶段,但有可能对目前最先进的图像识别方法构成挑战。
下一代修复术
非常早期的研究正在出现,通过生物、物理、机器学习的结合来解决修复术最困难的问题之一:灵敏性。
从2006年开始,DARPA就投入了数百万美元跟约翰霍普金斯大学合作先进修复术计划来帮助受伤的老兵。但是这个问题解决起来并不容易。
比方说让截肢者活动假肢的手指,对自发运动背后的大脑和肌肉信号进行解析,然后再转换为自动控制均需要跨学科的知识。
最近,研究人员已经开始利用机器学习对植入人体的传感器的信号进行解码,然后将之翻译为移动假肢设备的指令。
约翰霍普金斯大学的应用物理实验室一个进行中的项目就是利用“神经解码算法通过”神经接口来控制假肢的。
去年6月,德国及帝国理工学院的研究人员利用机器学习解码截肢者残肢的信号,并让计算机来控制机械臂。
另一个思路是利用中介解决方案,比如利用肌电信号来激活摄像头,然后再用计算机视觉算法估计抓手类型以及面前物体的大小。
临床试验登记
临床试验的最大瓶颈在于登记合适的病人库。苹果有可能可以解决这个问题。
互操作性——也就是跨机构和软件系统分享信息的能力——是医疗保健的最大问题之一,尽管有了病历数字化的努力。
临床试验在这方面问题尤其严重,将合适的试验与适当的病人进行匹配是很耗时且充满挑战的过程。而光美国目前就有18000项临床研究正在招募病人。
理想的AI解决方案是由人工智能软件析取病人病历的相关信息,将之与进行中的试验进行对比,然后给出匹配的研究建议。
在病人与医疗保健计划匹配方面,苹果等技术巨头已经取得了一定的成功。
从2015年开始,苹果就推出了2个开源框架——ResearchKit与CareKit——来帮助临床试验招募病人,并且远程监控病人的健康状况。这些框架使得研究人员和开发者得以创建医疗app来监控人们的日常生活,化解了登记的地理障碍。苹果还在跟热门的电子病历供应商合作解决互操作性问题。
2018年6月,苹果面向开发者推出了Health Records API。用户现在可以选择向第三方应用和医疗研究人员分享数据,为疾病管理与生活方式监控打开新的机会。
生成对抗网络(GAN)
两个互相比聪明的神经网络正在变得非常擅长创作出逼真的图像。
你能认出下面哪些图像是假的吗?
答案是全都是。这些全都是GAN创造出来的。
生成对抗网络是非监督式学习的一种方法,通过让两个神经网络相互博弈的方式进行学习。该方法由Google研究人员Ian Goodfellow于2014年提出。生成对抗网络由一个生成网络与一个判别网络组成。生成网络从潜在空间(latent space)中随机采样作为输入,其输出结果需要尽量模仿训练集中的真实样本。判别网络的输入则为真实样本或生成网络的输出,其目的是将生成网络的输出从真实样本中尽可能分辨出来。而生成网络则要尽可能地欺骗判别网络。两个网络相互对抗、不断调整参数,最终目的是使判别网络无法判断生成网络的输出结果是否真实。
扩充GAN式的大规模项目的主要挑战是计算能力。Google研究人员在创建“BigGAN”用了512块TPU来创建512像素的图像,一次试验的电耗大概就要2450到4915千瓦时之间。这已经相当于普通美国家庭半年的电耗。
而且GAN要想扩充,AI硬件也的并行扩充。
除了有趣的试验以外,GAN也有其他严肃的用途,比如假冒政治视频和色情作品的换脸等。随着GAN研究的扩大,这种技术势必会对新闻、媒体、艺术及网络安全构成挑战。GAN已经改变了我们训练AI算法的方式。
联邦学习
这种新方法旨在用敏感用户数据训练AI的同时保护隐私。
我们跟智能设备的日常互动可以产生丰富的数据,这些数据用于训练AI算法的话可以极大地改善其表现,比如可以更加精确地预测你接下来要输入的字是什么。但是这些用户数据也会涉及到个人隐私问题。
Google于是提出了联邦学习的方案,旨在利用这一丰富数据集的同时保护敏感数据。简而言之,你的数据依然留在你的手机里,不会发送或存储到云服务器上。而是由云服务器将最新版的算法(算法的“全局状态”)发往随机选择的用户设备上。
你的手机做出改进然后基于本地化的数据对模型进行更新。之后只有这种更新(以及来自其他用户的更新)会回传给云服务器以改善该“全局状态”,然后再不断重复这一过程。
把单个更新聚合起来的做法其实并不新鲜,其他算法早就这样做了。联邦学习的不同在于它考虑了数据集的两个重要特征:
Non-IID:其他分布式算法均假设数据是独立同分布(Independent and identically distributed,IID)的,但其实每一部手机生成的数据都是独特的,因为不同的人使用习惯不同,联邦学习考虑到了这种不同。
不平衡:某些用户使用app更加活跃,自然也会产生更多的数据。因此每一部手机的训练数据量也不一样。
Firefox自称是在重要软件项目中首个实现联邦学习的用例之一。当用户在浏览器输入URL时,Firefox会利用联邦学习进行URL推荐排名。
AI初创企业OWKIN则利用联邦学习来保护敏感的病人数据。其方案可以让不同的癌症治疗中心在病人数据不离开本地的情况下进行协作。
先进医疗保健生物测定
研究人员正在开始利用神经网络来研究和测定此前难以量化的非典型风险因素。
Google的研究人员利用视网膜图像训练神经网络,然后再用该神经网络去寻找心血管风险因素。其研究发现,通过视网膜不仅可以识别年龄、性别、抽烟习惯等风险因素,还可以对这些因素量化到一定的精确程度。
类似地,梅奥诊所也跟以色列初创企业Beyond Verbal合作,通过分析声音的声学特征来寻找冠心病人独特的声音特性。研究发现,当受试者描述一段情感经历时,有两个声音特性跟冠心病存在强关联。
初创企业Cardiogram最近的研究发现,利用深度学习,糖尿病引起的心率变异性改变可通过现成的可穿戴心率传感器检测出来。其检测精确率可达85%。
AI寻找模式的能力将会继续为新的诊断方法和识别此前未知的风险因素开辟新的道路。
自动索赔处理
保险公司和初创企业正开始用AI计算车主的“风险评分”,对事故场景图片进行分析,并监控司机行为。
蚂蚁金服在“事故处理系统”中利用了深度学习算法来进行图片处理。过去需要理算员现场处理的事情现在可以由先进图像处理承担了。车主只需上传车辆照片给蚂蚁金服,神经网络就会分析图片,自动进行损失评估。
蚂蚁金服还建立了司机的风险档案来影响车险的定价模型。他们引入了所谓的“车险分”,基于信用记录、消费习惯、驾驶习惯等利用机器学习计算车主的风险评分。
初创企业Nexar鼓励司机把自己的智能手机当成行车记录仪使用,并且将记录上传给Nexar app。车主的好处是可以有车险的折扣。
拿到视频的app会利用计算机视觉算法监控路况、司机行为以及事故。App还提供了“事故重现”功能,并与保险客户合作处理索赔。
初创企业Tractable可以让保险公司将受损车辆图片及车损估价上传到其索赔管理平台。“AI Review”功能就可以将这些资料与库中的几千图片对比,然后进行相应的定价调整。
共2页 [1] [2] 下一页
搜索更多: 人工智能