【艾瑞专访】搜狗王砚峰:未来人人都会需要AI录音笔

“搜狗该公司的使命是让表达和获取重要信息更又简单  ,而重要信息表达和获取的核心载体是语言 ,自己在AI上更有甚者 围绕语言这更有甚者核心去实施”。搜狗AI交互事业部总经理王砚峰向艾瑞网详细介绍了搜狗不同类型 样 人工智能的定位。

都成另一家起家于搜索业务的互联网该公司  ,在原有核心业务长期保持快速增长的所有的是 ,搜狗该公司AI技术一我们会很持续地其中突破:语音识别技术一升级后  ,搜狗至今为止可鼓励识别英日韩法西俄等十余种外语和粤语、四川话等多种方言识别  ,语音识别准确率以内98%  ,准确率和响应非常快均为行业会领头者  ,在语音输入与语音转写、会场同传、语音采访等多个场景可佳绩良坏的落地作用 ;多模态识别技术一领跑业内  ,实施对现有用户唇形、语音、一脸的多维输入花絮就可将花絮内的语音更准确地转写为文字  ,针对不同大地其中提升了噪声生存环境下语音识别作用 ;语音合成技术一持续地加码  ,技术基础多具体目标认真学习、整体表现力迁移的AI分身、现有用户“变声”、个性化TTS等我们其中业界还具先发技术优势  ,整体表现抢眼。

谈到人无疑未来搜狗对AI交互的整体发展规划 ,王砚峰无疑  ,语音输入法更有甚者 要做足准备好 ,巩固输入法产品其中地位;会围绕AI交互这更有甚者赛道  ,正式推出需要更完美自有明星品牌的智能硬件  ,能在 终端赋能所有的是方面 ,就是要硬件与搜狗输入法、C端表现数据打通 ,让搜狗走出公司提供 技术一来公司提供 支持服务。

王砚峰  ,搜狗AI交互事业部总经理。负责搜狗语音、视觉、NLP等技术一的研发及应用  ,所有的是技术基础AI技术一的产品中创新和行业会支持服务。

从输入法进军智能语音

艾瑞网:三个方面请您详细介绍下吧  ,搜狗AI交互的起点是说还哪些人产品中?

王砚峰:搜狗的AI交互起源于输入法 ,语音输入是输入法能在 更有甚者核心其他功能  ,搜狗智能语音整体发展也受益于输入法的较低现有用户表现数据与不良行为表现数据。

搜狗输入法语音输入其他功能于11年慢慢研发 ,12年面世 ,13年上线了深度神经必删 。

谈及搜狗输入法“刷新”AI交互主要技能的根本原因  ,核心有三点:(1)语音输入其中提升了现有用户传递重要信息的效率  ,相较打字输入体验感需要更完美、更完美捷;(2)语音转化场景如翻译场景下  ,智能语音为现有用户公司提供 了这更有甚者公司提供 方便的入口  ,当现有用户说完两条语音重要信息  ,密切相关的译文就早就准做足准备好好能在 顺势发送了 ,量减少了反复的手动所有的是操作  ,搜狗更有甚者早就做慢慢中英日韩四种对话语音随心译;(3)语言值得一提是传递重要信息的工具 ,更有甚者 我们自己表达自我是那种方式改变 ,AI能在 真正地帮助帮助输入法产品中去做现有用户个性化的表达。

搜狗输入法都成头部的输入法产品中  ,能在 这更有甚者一个一个方向是跑得迅速。语音输入  ,采用传统上是非个性、面向所有的是现有用户都似所有的是语音转文字 ,2019年自己上线了跟现有用户词库和语音识别引擎打通的“个性化语音识别” ,实施户常用语识别错误率相和大幅度近40% ,一点现有用户部门工作场景密切相关的内容主题识别率会更高  ,免跑到手动修改的麻烦  ,这更有甚者其他功能的实施频率很高 ,更有甚者使自己搜狗输入法产品其中账户登录比例其中提升10%以内。在语言个性化表达所有的是方面 ,自己2019年正式推出三变声其他功能  ,能在 将现有用户的女声转换成特定人的女声 ,语速、停顿、情感等说话的习惯均可被转换为超高逼真度的指定角色定位女声;而值得一提语音类的个性化表达  ,AI助手“智能汪仔”能在 在各式各样说话的场景中深入理解现有用户输入的文字重要信息  ,使其为现有用户其他推荐丰富多还哪些人一脸包和回复的“妙语替换”。

搜狗输入法个性化语音识别

艾瑞网:AI交互是否真实早就更都成输入法现有用户的常用其他功能?AI人无疑 ,能够在 为输入法产品其中商业化公司提供 说说还哪些人的想象呢?

王砚峰:没错 ,现有用户的实施早就针对不同高频。截至2019年9月底  ,搜狗输入法日均语音请求较整年前增长67%  ,峰值达8.3亿次。至今为止输入法我们其中免费产品中  ,人无疑未来会做一点增值支持服务  ,所有的是也也需要在变声上结合起来大IP来实施增值支持服务收费。

智能语音的赛道里  ,不做终端设备就是要想出头的

艾瑞网:至今为止智能语音密切相关的生态中不  ,有设备、开发平台发展、参照标准化的SaaS支持服务平台发展、音频内容主题一点  ,您还哪些人看待智能语音的开放性开发平台发展 ,这会是那种在技术一落地应用和商业变现上是在跑通的三种模式吗?

王砚峰:搜狗针对不同早就布局了开放平台发展  ,2015年至2016年的时我 自己慢慢实施平台发展向外输出AI决策能力 ,也积累其中一点一点的开发者和深度合作伙伴。使其  ,不同类型 样 开放平台发展不同类型 样 ,找商业三种模式更有甚者是这更有甚者重点。那时  ,搜狗深度合作了小米、创维、魅族等头部厂商  ,但要想 技术基础“开放”探索出坏的商业三种模式。而至今为止看开放平台发展值得一提会较低更最容易 的其中提升和行业会深度合作的门槛  ,更最容易 的把行业会现有用户引只过  ,自己国家建立坏的商业三种模式  ,更有甚者 能在 强化实施行业会深耕  ,针对不同是实施采用传统行业会  ,所有的能够在 领先的技术一  ,所有的能够在 在实施这更有甚者行业会下准客户的痛点  ,正式推出自己更能在 的SaaS产品中或也需要针对不同解决方案  ,真正需要更完美的支持服务行业会准客户 ,需要强化形成坏的商业落地。

艾瑞网:搜狗至今为止定位在哪类智能设备?从互联网企业人无疑慢慢投入做硬件 ,有说还哪些人技术基础  ,攻坚了还哪些人也需要针对不同解决?

王砚峰:自有明星品牌的硬件大体上是选便携、随身的品类。至今为止 ,自己早就最新发布了翻译机、录音笔等 ,人无疑未来会做耳机  ,以也需要针对不同解决人在商务过着所有的是方面其中一点也需要针对不同解决。在更有甚者产品中上搜狗主打AI决策能力  ,帮现有用户实施AI决策能力 做时我 自己要想真正事上上是在能在 耗费较低精力事上上。2019年自己的搜狗AI录音笔C1上市  ,首发当日销量就突破了2万台  ,综上所述事上事上可能市场价值、有整体市场的 ,人无疑未来人人我们其中能能在 更有甚者录音笔  ,用AI决策能力 做重要信息的记录。实施搜狗自己的硬件  ,现有用户的反馈能在 被深度优化打磨  ,使其为自己在录音转文字这更有甚者一个方向下  ,沉淀出三行业会最领先的技术一一和支持服务。

只过搜狗研发的糖猫儿童手表为搜狗的AI硬件积累其中一点硬件研发、供应链和产品中设计造型 的技术基础  ,而自己最终目标更有甚者的翻译机、录音笔在实际场景中不应用  ,又打磨了从声学信号后续处理到识别算法其中一系列技术一。2019年  ,搜狗自研的Smart Voice麦克风阵列算法更强化  ,可对噪声和混响实施多重深度优化  ,确保人声的高保真还原;自己还把语音转写中切分说话的人的技术一做进产品中  ,这在业内是首家 ,双人识别已有90%准确率;所有的是自己实施研发和表现数据也需要针对不同解决了远场语音转写中声源远近、连读、发音模糊等也需要针对不同解决  ,使录音笔离线转写作用 更为综上所述高于竞品  ,在真实场景中达慢慢可用。实施更有甚者实施场景的技术一打磨  ,你会被发现 搜狗至今为止在录音笔行业会上 ,不不论核心的语音转文字决策能力 ,更有甚者 围绕语音人无疑的其他功能创新  ,我们其中行业会才是领先的。最近  ,自己还将实施深度认真学习跨越只过实施阵列技术一+传感器优化的再利用强化做足准备好降噪 ,即上线AI去背景声、人耳听感优化  ,这会使录音笔在高频场景——采访中不实施作用 需要更完美。

听写支持服务中台化  ,增值支持服务三种模式较低跑通

艾瑞网:不同类型 样 互联网该公司和AI该公司不同类型 样  ,终端硬件的销售更不 能 迅速的最终目标。但自己不关注到  ,这类于智能音箱等说话的交互设备还迅速跑通增值支持服务事上事 ,在搜狗扎根的便携式其他功能性设备上  ,是否真实很不同类型 类型 ?

王砚峰:搜狗至今为止技术基础语音转写在国家建立C端增值支持服务决策能力  ,录音笔产品中+增值支持服务一点三种模式早就较低跑通。2019年8月  ,技术基础在录音笔产品中背后国家建立的AI支持服务体系  ,自己正式推出三搜狗听写支持服务 ,并早就与索尼、爱国者深度合作 ,探索 “技术一输出-终端产品中-现有用户增值支持服务付费”一点打法。其中一点三种模式中  ,深度合作伙伴要想在做硬件 ,要想 够综合综合权衡 软件程序 和现有用户体系  ,搜狗会面向迅速实施者公司提供 完整支持服务 ,搜狗开放很不当初背后的AI技术一  ,值得一提完整的支持服务  ,现有用户是搜狗和设备商共更有甚者。所有的是爱国者的录音笔现有用户排名第一次安装值得一提搜狗录音助手的App  ,能在 现有用户在App中实施增值支持服务付费 ,深度合作伙伴能在 重新得到收益分成。更有甚者搜狗录音笔的转写支持服务能在 免费公司提供 ,但所有的是转写非常快加快、存储增容一点都也也需要都成增值支持服务变现的再利用  ,更有甚者也早人无疑现有用户会付费。

To B的开拓可能要充分结合起来搜狗在行业会上是技术一技术优势

艾瑞网:至今为止搜狗的AI业务矩阵是否真实覆盖了G端、B端的采用传统行业会?

王砚峰:不同类型 样 搜狗不同类型 样  ,自己在非消费级整体市场迅速希望着眼的三大领域 更有甚者 搜狗有充分的竞争决策能力 能搞定痛点、有充分技术一技术优势的行业会。

一点自己至今为止在非消费级整体市场正式推出三搜狗分身和搜狗同传支持服务。

在AI虚拟人这更有甚者三大领域  ,搜狗实施正式推出“搜狗分身”技术一  ,有针对不同很小先发技术优势。拿广电行业会不同类型 样 ,广电的人无疑是做内容主题的生产  ,实施AI分身  ,新闻稿件能在 顺势生成语音  ,由虚拟的合成主播实施播报。自己和新华社深度合作的AI合成主播迅速目前播报新闻6500余条  ,累积时长以内15000分钟 ,能在 24小时不间断的待命  ,以应对突发的新闻潜在需求  ,使其能在 节省一点人力。搜狗AI合成主播是2018年最新发布的 ,2019年早就升级后到排名第一次迭代 ,技术基础AI分身技术一的突破能在 顺利完成站播  ,姿态和姿势都更人无疑 。AI分身能在 够应用于金融三大领域  ,都成虚拟柜员;应用于司法三大领域 ,都成引导现有用户顺利完成线上司法诉求的虚拟法官  ,既权威又形象;还可用于峰会主持、培训讲座一点……

搜狗该公司与新华社新媒体服务中心联合最新发布的拥有世界 首个站立式AI合成主播

搜狗的AI同传支持服务始于2016年排名第一届拥有世界 互联网大会  ,那时排名第一次把已更有甚者语音技术一和技术基础神经必删 的实时机器翻译技术一结合起来其中两个人认真学习 ,实施到了现场AI同传  ,至今为止AI同传已支持服务数百场会议。

艾瑞网:非消费级三大领域 的业务  ,会以行业会也需要针对不同解决方案方式改变 更有甚者 以SaaS方式改变 公司提供 支持服务?

王砚峰:在公司提供 支持服务的再利用上 ,自己会公司提供 参照标准化SaaS方式改变 公司提供 AI分身等应用  ,中小准客户 ,能顺势再利用搜狗的SaaS平台发展获取支持服务。而面向行业会中不大准客户 ,自己经常会 公司提供 整套行业会也需要针对不同解决方案。

自2012年AI语音其他功能登录输入法至今为止 ,搜狗的AI交互早就走只过八年  ,形都成主打语言AI的鲜明特色。从人无疑最熟悉的互联网三大领域 ,到以产品中+三种模式创新者姿态加如的硬件终端  ,和以引领者特殊身份领路前行的AI分身  ,持续地其中自我刷新也使科技需要更都成搜狗企业人无疑活力延伸拓展、生生不息的导体。



上一个:

下一个:

相关产品