最近,百度凭借自主研发的人脸检测深度学习算法PyramidBox,在世界最权威的人脸检测公开评测集WIDER FACE的“Easy”、“Medium”和“Hard”三项评测子集中均获得冠军,也打破了历史记录。这个结果,不让人意外。在AI基础技术上,百度一直都在不断证明自己,已不是第一次拿奖。
百度AI技术已成“屠榜”高手
就拿人脸检测技术来说,百度早在2015年就通过DenseBox算法,刷新了FDDB和LFW两个公开数据集的记录,保持世界第一并保持了一年。人脸识别技术是机器视觉与生物识别的交叉技术,人脸检测是人脸识别的第一步——在图片或者视频中找到人脸并精确定位。如果是自拍照自然很容易,目前美图软件、智能手机都可以做到,不过很多照片或者视频中有大量的人像,而且可能有姿态、遮挡、光线、环境、模糊、失焦等不利因素,因此人脸检测并不容易,要机器达到人眼水平很难。
目前,在所有AI技术中,人脸识别应用最为广泛。自拍、解锁、实名制校验,甚至支付,都能用人脸识别来完成,治安、零售、教育、公益等行业也在大量应用人脸识别技术。百度在人脸检测上的不断打破记录,体现的是百度AI技术的实力,人脸技术只是百度AI技术的一部分(当然,也是很重要的一个技术),百度在自然语言处理、机器视觉、语音交互、知识图谱、机器翻译等AI技术上都有布局,且成绩斐然。
今年2月,美国《麻省理工科技评论》揭晓的2018年“全球十大突破性技术”(10 Breakthrough Technologies 2018)中,百度成为唯一入选的中国公司,被列为实时语音翻译领域的关键玩家,百度也是唯一一家连续三年入选该榜单的中国公司。
同样是在2月,百度自然语言处理(NLP)团队研发的V-Net模型以46.15的Rouge-L得分登上微软的MS MARCO(Microsoft MAchine Reading COmprehension)机器阅读理解测试排行榜首。机器阅读理解可以让机器更好地理解一段文字。比如百度可以通过这个技术来理解用户的搜索内容或者问题,从一个页面定位答案并经过总结、提炼、归纳后进行展示。这个赛事更大的意义在于,其运用的训练数据是微软在产品实践中收集来的问题和答案,直接从互联网文本与产品实践问题中训练出的模型,应用价值更强。
这些成绩,都证明了百度AI技术的实力。而所有这些技术都出自于百度AIG。去年3月,百度宣布整合包括NLP、KG、IDL、Speech、Big Data等在内的百度核心技术,组成百度AI技术平台体系(AIG),任命百度副总裁王海峰为AI技术平台体系(AIG)总负责人。现在看来,百度整合多个技术到一个体系,的确让人才的聚集,技术的管理,以及技术的进步更集中。
然而“屠榜”并不是AIG的目的
算法或者技术拿到奖项,打破记录,或者登陆榜单,是百度大力支持AI技术的结果,也是百度AI技术实力的证明,但它不是百度AIG存在的唯一目的。AIG不是一个只会研发底层技术来拿奖的实验室,而是支撑百度业务,特别是AI相关业务的技术平台。
王海峰曾阐述过他对技术的理解:
“AI的发展最终还是要回到‘服务用户需求’的本质,这是我们每一位人工智能的从业者都需要铭记在心的。利用好人工智能来服务好我们的用户和客户,以及更好地打磨AI能力来推动各行各业的效率提升,是每一位人工智能领域从业者的期望。”
具体来说,百度AIG在大力研发基础AI技术的同时,还强调AI技术的应用和开放。
首先,在应用层面重视技术的实用性。比如百度人脸技术,就被百度金融应用到与泰康保险、中国农业银行的合作项目用于人脸核身;乌镇、武夷山等旅游景区、北京首都机场、南方航空在广州白云机场的贵宾休息室,应用人脸识别来提升旅客游客的体验。自然语言处理技术的应用广泛性无需赘言,语音已是DuerOS的基础,百度已经与TCL、创维、海尔、海信等诸多家电巨头,以及华为、小米等手机巨头战略合作,知识图谱也成为百度搜索结果中的重要内容。
抓基础技术的同时,也在强化对应用技术的投入。今年1月,百度研究院在硅谷成立了两个新实验室,一个是商业智能,另一个是机器人与自动驾驶,不再是此前IDL这样的纯技术实验室,不再只做深度学习、大数据这样的底层技术研发。从名字就可以看出,百度AIG对应用技术的重视。
百度去年在AI开发者大会上就已经提出要Bring AI to Life,让AI落地到生活场景中的口号,将AI技术落地到实际业务成为未来的大方向,也与AIG重视“技术驱动产品,产品牵引技术”的策略符合。
其次,在开放层面重视前沿技术的共享。百度AI技术很强大,但不独享,而是开放给行业。百度目前已经开放了包括语音、图像、自然语言处理、视频、增强现实、知识图谱、智能数据七个方向,共计90余项AI技术能力,成为国内最大的AI开放平台。百度还将其深度学习框架PaddlePaddle全面开源,让开发者可以拥抱AI。3月23日,百度在北京举办了第一期AI加速器DEMO DAY,百度AI加速器旨在帮助创业者拥抱AI,是百度AI开放的一个举措。
可以看出,百度AIG的技术路线图是很清晰,也是很有前瞻性的。一方面,作为百度的基础技术,AI底层技术不能依赖任何第三方,要自力更生,因此百度AIG在基础技术上大力投入,不断在技术上突破、获奖也证明了这一策略的效果。另一方面,AIG将技术落地到业务中,让业务牵引技术发展,开放的核心目的也会要促进AI技术在各行各业的落地。当然,反过来,应用和开放也可以巩固百度AI技术的领先地位。
AIG如何一年内成为百度基座?
百度的基石是什么?相信很多人的答案都是:技术。而技术是由什么构成的?一行行抽象的代码后面是工程师等技术人的投入,正是因为此,负责百度核心技术的AIG可以说是百度的基座。当百度将多个分散在各个部门的技术部门,以及百度研究院整合到一起时,许多人都看不清百度为什么要这样做,现在看来好处已经很明显,让百度的AI技术沿着更实用的方向研发,加速AI技术落地。AIG在短时间内稳步成长,原因是多方面的。
综合各种信息来看,目前百度AIG的技术研究部门大致可以划分成百度研究院和应用技术部门,其中百度研究院的目标很单一,就是要做AI底层技术的研发——不过与谷歌X实验室等不同的是,它的探索性更低,实用性更高。应用技术部门,则负责技术的应用与落地。今年百度研究院又增加了两大实验室,目前已有五大实验室,实现了对AI基础和主要应用技术的全覆盖。
AIG不断庞大的背后是百度在研发上的坚决投入,李彦宏去年曾表示,百度每年在研发上投入上百亿 ,占总收入15%,这个占比位列行业第一。
在人才引进层面,李彦宏对于技术人才一直有“周公吐哺天下归心”的广纳良才的策略,除了给很好的待遇外,更重要的是很有吸引力的研发环境。百度AIG也在不断吸纳世界顶尖人才,比如百度研究院目前拥有六位世界级科学家。同时百度拥有广泛的AI应用场景,比如搜索、信息流、DuerOS、无人车,都是AI强相关业务。顶尖的技术团队和作为技术落地沃土的产品和业务,相互作用下形成了一个良性的的正向循环链条,让百度AI能够持续“进化”。
在产业环境层面,AI爆发已是不争事实,2018年AI正在落地到各行各业,但AI技术研发却需要持续进行,机器在大多数时候还是不如人类,技术进步空间很大。不过,在AI产业爆发后,行业对AI人才的急缺已经让更多技术人才开始重视学习AI,前不久南京大学甚至成立了AI学院,培养AI专业人才。在这样的环境下, 百度AIG基于本身的吸引力,要获取优秀人才会越来越容易。而此前百度在AI技术上多年已久的布局,也让它有了厚积薄发的能力。
不难看出,百度“先技术后场景”的思路正在改变,逐渐成为技术研发与场景应用双管齐下,保持技术优势的同时,推动AI技术商业化。而高速运转状态的AIG,正在给百度源源不断地提供前沿、实用和有竞争力的技术,同时帮助百度AI技术落地和开放。