智能语音语义时代,产品经理怎么让AI更聪明?(效果向)_语音语义功能介绍-程序员宅基地

技术标签: 车载语音导航;人机语音交互;语音识别;语音合成  自然语言理解  智能硬件  自然语言处理  

智能语音语义时代,产品经理怎么让AI更聪明?(效果向)

智能语音语义风起云涌的AI时代,各行各业纷纷落地语音语义能力。其中包括
以语音为交互方式的音箱/电视/车机/ivr/智能外呼,以文字输入为 交互方式的智能客服/营销机器人等。本文主要结合自己的一些经验,谈谈“怎么把语音语义的效果做好”这件隐藏在背后且重要的事

在这里插入图片描述

前言:以智能音箱为样本,介绍语音语义全链路

在这里插入图片描述

用户通过语音唤醒词或物理按键,唤起系统,启动收音模块(全双工可跳过该模块)
ASR模块将音频转化为文本
NLU模块通过规则&模型理解用户表达的文本,通过DM模块分发,召回输出intent/slot等信息
调取对应业务服务or指令or内容资源or chat
把机器生成的NLG通过TTS技术播报出来
用户听到机器的回复或播报的内容资源
下面内容主要集中在,与效果强相关的ASR/NLU/内容资源模块

——————————————————————————————

1.ASR模块的效果评估与优化

1.1 核心指标

  • 字识别错误率or字准

  • 句识别错误率or句准

1.2 评估

1.2.1模型(语言/声学)评估
准备足够数量的用户真实音频(A)与音频对应的正确识别文本(B)。将A输入模型,得到线上识别文本=C。将B与C对比,通过简单的公式,计算字准/句准指标

1.2.2端到端评估
准备足够数量的用户真实音频(A)与音频对应的正确的识别文本(B)。在嘈杂/安静/不同距离的环境中,人工或人工嘴播报测试音频,被测设备收音,输出识别结果=C。将B与C对比,计算字准/句准指标。智能硬件的长链路,决定了端到端的任何一个子模块都会影响识别效果。端到端评估的内容包含了“麦克风阵列/降噪/声学模型/语言模型等”的完整链路。做终端的产品同学们,要为整体的设备识别效果负责,在做整体评估的时候不要因测试方法的局限,漏掉某个部分的效果监控

1.3 优化
识别效果是技术与模型的强导向,将测试结果,通过不同方法,反馈进模型,是优化语音识别的一个大的方向(不展开细讲)。这里产品经理关注的重心,应该是模型迭代后的测试/灰度/上线,确保识别效果为正向且无特殊badcase

——————————————————————————————

2.NLU&内容资源服务的效果评估与优化

2.1 核心指标

  • 准确率
  • 召回率
  • F1值
  • 满足度

通过上面几个指标,可以分析出识别后链路的各种问题:技能分布占比及用户需求的强烈程度;对话中控分发效果;pattern/话术/词槽丰富度;TTS反馈的准确率;个性化推荐效果;内容资源丰富度;开放域闲聊表现等

2.2 评估

2.2.1测试集选择要求
根据实验目标选取对应测试集
测试集贴近被测设备的产品形态和使用场景
线上真实用户的query文本,避免按query频次截取
对特殊日期(节假日与工作日)取平均

2.2.2测试集处理
为了评估产品的完整效果,线上拉取的测试集数量巨大,可以根据业务需求选择简单随机抽样或分层抽样,使测试集既确保结果趋近于真实值,又可实际操作。将测试集直接人工评估或用query跑对应NLU模型,获取模型输出的数据

2.2.3人工评估
在这里插入图片描述
按下面指标,对比线上&预期结果并打分:

NLU模块:skill召回情况/intent召回情况/slot解析/TTS文本等
内容资源模块:资源与需求的对应/内容质量是否正版/音质/用户反馈的行为/是否含广告等
满足度:用户需求是否被产品满足。链路中的NLU/内容资源都会都是影响因子

2.2.4 计算
技能召回率=某个skill的线上召回数(预期召回的case中)÷某个skill的预期召回数
技能准确率=某个skill的预期召回数(线上召回的case中)÷某个skill的线上召回数
F1(调和平均)=2×(准确率/召回率)÷(准确率+召回率)
满足度=满足为1的case数÷整体case数
满足度是端到端完整效果的评估,同搜索的那套逻辑,一个数字衡量整体产品技能效果;F1是召回率与准确率的调和表现,F1越高,中控模块的效果越好。但无法衡量slot解析的好坏

2.3 其他评估方法
兜底+chat模块在总case的占比:可以感性的在反面看出产品任务型技能的效果好坏,但不能说占比越大,效果越好。因为用户确实有chat&兜底的需求

技能留存:延用移动互联网的数据分析逻辑,技能的留存越高,黏性越强,效果越好

技能渗透率:技能被更多用户使用,证明该技能使用更加广泛,约等于移动互联网的DAU占比

技能触发频次:技能的交互次数越多,证明用户更愿意与该技能产生交互,约等于移动互联网的PV。但技能设计有简要性原则,使用这个数据时,要根据具体场景,不能盲目设为KPI

负面情绪query的占比:按照简单的逻辑,当用户破口大骂的时候,对应的session是有问题的。所以这个值也可以衡量好坏

2.4 优化
在前面的评估,要对每个badcase的问题标注并聚类,得出问题的数量占比即为对应问题的影响面。根据影响面出现次数由高到低,追踪解决问题,让效果的优化速度最高。对应的推动需要case by case,涉及到的内容很多,例如规则语义的优化/深度学习语义的优化与测试灰度/内容资源覆盖度等。这里考验的是产品经理的逻辑思维能力/推动力/沟通能力/方法论经验

——————————————————————————————

3.智能语音语义产品经理的世界观

3.1 别蒙着眼睛做事——技能效果优化的重头戏
战略:胜者先胜,然后求其战;败者先战,然后求其胜
战术:先在逻辑上推导出怎么胜利,再去落地实施,这样的产品经理更容易吸引胜利
打法:先在评估方法和优化方法上成熟。有最清晰的数据指标,最高效的解决方法,再去讲怎么优化效果。这样的产品路径才是清晰的,可被预期的

3.2 产品的上限和下限——智能语音/语义产品的成功因素
本文主要讲的是针对技能效果角度的一些方法论,但这仅仅只是产品其中的一部分。新人产品经理容易陷在其中,认为效果即一切,但商业的世界往往是多元的,产品的成败已经不仅仅局限于技能效果
产品的成败,决定于语音语义产品的上限和下限
下限:即是技能效果&基础的功能,别人有我必须要有。在商业逻辑上有明显缺陷的产品是无法存活于市场的。下限要做到及格的平均线之上。
在这之后需要聚焦资源,找准产品的护城河做上限,把它深做强。
上限:即自己的卖点与核心竞争力,为什么大家都差不多,用户要买我的产品,这很重要。例如技术的先发落地(全双工/声纹);生态的优势(小米创维的智能家居生态/腾讯音箱的内容生态/阿里的购物生态);渠道的优势(创维/海信/TCL的强大销售渠道)。上限可以是生态,可以是销售,因公司而异

希望上面的一些方法论和思考,能对语音/语义行业的产品经理们有所收益。如果可以迭代的地方,欢迎与我沟通

@sugus,前百度产品经理,专注于语音语义交互/智能硬件领域

未经许可,禁止转载

题图来自Unsplash,基于CC0协议

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/weixin_45556029/article/details/107150796

智能推荐

分布式光纤传感器的全球与中国市场2022-2028年:技术、参与者、趋势、市场规模及占有率研究报告_预计2026年中国分布式传感器市场规模有多大-程序员宅基地

文章浏览阅读3.2k次。本文研究全球与中国市场分布式光纤传感器的发展现状及未来发展趋势,分别从生产和消费的角度分析分布式光纤传感器的主要生产地区、主要消费地区以及主要的生产商。重点分析全球与中国市场的主要厂商产品特点、产品规格、不同规格产品的价格、产量、产值及全球和中国市场主要生产商的市场份额。主要生产商包括:FISO TechnologiesBrugg KabelSensor HighwayOmnisensAFL GlobalQinetiQ GroupLockheed MartinOSENSA Innovati_预计2026年中国分布式传感器市场规模有多大

07_08 常用组合逻辑电路结构——为IC设计的延时估计铺垫_基4布斯算法代码-程序员宅基地

文章浏览阅读1.1k次,点赞2次,收藏12次。常用组合逻辑电路结构——为IC设计的延时估计铺垫学习目的:估计模块间的delay,确保写的代码的timing 综合能给到多少HZ,以满足需求!_基4布斯算法代码

OpenAI Manager助手(基于SpringBoot和Vue)_chatgpt网页版-程序员宅基地

文章浏览阅读3.3k次,点赞3次,收藏5次。OpenAI Manager助手(基于SpringBoot和Vue)_chatgpt网页版

关于美国计算机奥赛USACO,你想知道的都在这_usaco可以多次提交吗-程序员宅基地

文章浏览阅读2.2k次。USACO自1992年举办,到目前为止已经举办了27届,目的是为了帮助美国信息学国家队选拔IOI的队员,目前逐渐发展为全球热门的线上赛事,成为美国大学申请条件下,含金量相当高的官方竞赛。USACO的比赛成绩可以助力计算机专业留学,越来越多的学生进入了康奈尔,麻省理工,普林斯顿,哈佛和耶鲁等大学,这些同学的共同点是他们都参加了美国计算机科学竞赛(USACO),并且取得过非常好的成绩。适合参赛人群USACO适合国内在读学生有意向申请美国大学的或者想锻炼自己编程能力的同学,高三学生也可以参加12月的第_usaco可以多次提交吗

MySQL存储过程和自定义函数_mysql自定义函数和存储过程-程序员宅基地

文章浏览阅读394次。1.1 存储程序1.2 创建存储过程1.3 创建自定义函数1.3.1 示例1.4 自定义函数和存储过程的区别1.5 变量的使用1.6 定义条件和处理程序1.6.1 定义条件1.6.1.1 示例1.6.2 定义处理程序1.6.2.1 示例1.7 光标的使用1.7.1 声明光标1.7.2 打开光标1.7.3 使用光标1.7.4 关闭光标1.8 流程控制的使用1.8.1 IF语句1.8.2 CASE语句1.8.3 LOOP语句1.8.4 LEAVE语句1.8.5 ITERATE语句1.8.6 REPEAT语句。_mysql自定义函数和存储过程

半导体基础知识与PN结_本征半导体电流为0-程序员宅基地

文章浏览阅读188次。半导体二极管——集成电路最小组成单元。_本征半导体电流为0

随便推点

【Unity3d Shader】水面和岩浆效果_unity 岩浆shader-程序员宅基地

文章浏览阅读2.8k次,点赞3次,收藏18次。游戏水面特效实现方式太多。咱们这边介绍的是一最简单的UV动画(无顶点位移),整个mesh由4个顶点构成。实现了水面效果(左图),不动代码稍微修改下参数和贴图可以实现岩浆效果(右图)。有要思路是1,uv按时间去做正弦波移动2,在1的基础上加个凹凸图混合uv3,在1、2的基础上加个水流方向4,加上对雾效的支持,如没必要请自行删除雾效代码(把包含fog的几行代码删除)S..._unity 岩浆shader

广义线性模型——Logistic回归模型(1)_广义线性回归模型-程序员宅基地

文章浏览阅读5k次。广义线性模型是线性模型的扩展,它通过连接函数建立响应变量的数学期望值与线性组合的预测变量之间的关系。广义线性模型拟合的形式为:其中g(μY)是条件均值的函数(称为连接函数)。另外,你可放松Y为正态分布的假设,改为Y 服从指数分布族中的一种分布即可。设定好连接函数和概率分布后,便可以通过最大似然估计的多次迭代推导出各参数值。在大部分情况下,线性模型就可以通过一系列连续型或类别型预测变量来预测正态分布的响应变量的工作。但是,有时候我们要进行非正态因变量的分析,例如:(1)类别型.._广义线性回归模型

HTML+CSS大作业 环境网页设计与实现(垃圾分类) web前端开发技术 web课程设计 网页规划与设计_垃圾分类网页设计目标怎么写-程序员宅基地

文章浏览阅读69次。环境保护、 保护地球、 校园环保、垃圾分类、绿色家园、等网站的设计与制作。 总结了一些学生网页制作的经验:一般的网页需要融入以下知识点:div+css布局、浮动、定位、高级css、表格、表单及验证、js轮播图、音频 视频 Flash的应用、ul li、下拉导航栏、鼠标划过效果等知识点,网页的风格主题也很全面:如爱好、风景、校园、美食、动漫、游戏、咖啡、音乐、家乡、电影、名人、商城以及个人主页等主题,学生、新手可参考下方页面的布局和设计和HTML源码(有用点赞△) 一套A+的网_垃圾分类网页设计目标怎么写

C# .Net 发布后,把dll全部放在一个文件夹中,让软件目录更整洁_.net dll 全局目录-程序员宅基地

文章浏览阅读614次,点赞7次,收藏11次。之前找到一个修改 exe 中 DLL地址 的方法, 不太好使,虽然能正确启动, 但无法改变 exe 的工作目录,这就影响了.Net 中很多获取 exe 执行目录来拼接的地址 ( 相对路径 ),比如 wwwroot 和 代码中相对目录还有一些复制到目录的普通文件 等等,它们的地址都会指向原来 exe 的目录, 而不是自定义的 “lib” 目录,根本原因就是没有修改 exe 的工作目录这次来搞一个启动程序,把 .net 的所有东西都放在一个文件夹,在文件夹同级的目录制作一个 exe._.net dll 全局目录

BRIEF特征点描述算法_breif description calculation 特征点-程序员宅基地

文章浏览阅读1.5k次。本文为转载,原博客地址:http://blog.csdn.net/hujingshuang/article/details/46910259简介 BRIEF是2010年的一篇名为《BRIEF:Binary Robust Independent Elementary Features》的文章中提出,BRIEF是对已检测到的特征点进行描述,它是一种二进制编码的描述子,摈弃了利用区域灰度..._breif description calculation 特征点

房屋租赁管理系统的设计和实现,SpringBoot计算机毕业设计论文_基于spring boot的房屋租赁系统论文-程序员宅基地

文章浏览阅读4.1k次,点赞21次,收藏79次。本文是《基于SpringBoot的房屋租赁管理系统》的配套原创说明文档,可以给应届毕业生提供格式撰写参考,也可以给开发类似系统的朋友们提供功能业务设计思路。_基于spring boot的房屋租赁系统论文

推荐文章

热门文章

相关标签