中国经济时报记者从发布会上获悉,截至目前,百度输入法月活跃用户已达4亿,语音输入日流量超过2.5亿,接下来百度输入法作为百度AI技术的桥头堡,将不断落地全新的AI功能,开启全感官输入时代。
值得注意的是,会上发布了百度语音技术的最新突破——Deep Peak 2模型。据百度语音技术部总监高亮介绍,该技术全称为“基于LSTM和CTC的上下文无关音素组合建模”,该模型突破了沿用十几年的传统模型,能够更充分地发挥神经网络模型的参数优势,大幅提升中英文、多种口音、多种风格(如朗读、聊天、轻声)混合输入的识别准确率,聊天场景下的相对正确率较行业领先水平提升20%,让机器更轻松适应用户的自然对话。
此外,百度输入法负责人蔡玉婷表示,此次正式上线的百度输入法v8.0版本,在此前已有的AI功能上增加了“语音速记”和“AR表情”两大全新AI功能。其中,“语音速记”在输入法领域独家首发了“声纹识别”技术,该技术针对2-3人小型会议场景,可根据声纹自动区别发言人,实现智能化的语音识别。
而“AR表情”功能基于百度领先的人脸识别技术和AR技术,用户不仅可根据相机或相册进行人脸识别、制作表情包,还支持用户通过自己的表情控制虚拟人物形象。制作出来的AR表情,可以直接通过输入法搜索、语音输入和键盘输入时展示出来。
同时,百度输入法还与桃花坞等中国非物质文化遗产达成合作,将中国民间传统艺术如年画等引入到表情中,让众多古典人物形象冲破次元壁垒“活”了起来,成为对中国历史文化最好的传承。
在蔡玉婷看来,百度输入法v8.0版本不仅在功能上落地,更拥抱年轻文化,贴近用户的个性化需求。语音识别、图像识别等AI技术在输入法中的应用,让输入法跳脱出语言的局限,懂得用户多种不同的表达形态。“百度输入法除了完成用文字输入形式的人机交互外,还能从声音、图片,甚至有望从动作、眼神中捕捉信息,让用户拥有更自然、更个性化的体验。”