Page 93 - 电力与能源2024年第四期

P. 93

陆增洁，等：基于机器学习的电力系统语音指令识别算法研究 487

率，本文从现有的语音识别技术入手展开研究。个特定词组之间的相互作用，从而更准确地预测
本文旨在建立一个电力词汇库的语法模型，以便未来结果。
提供有效的语法原则，帮助查询和纠正识别错误。具体地，贝叶斯公式可表示为
以 AC 自动机的高效性为例子来探讨如何在语音 P ( w|x ) =
识别之后进行文本纠正。以汉字和拼音为基础， P ( X|W ) P (W ) / P ( X )∝ P ( X|W ) P (W )

成功地实现对电力巡检指令词的语音识别。采用（1）
式中 P（X|W） ——被广泛用来描述声音识别系
该方法，可以在较短的时间内显著提升对同音字
统；P（W） ——被用来描述人类的语音特征。
词的正确识别率。
这两种识别系统应该是独立的，并且表达能
1 语音指令识别系统的主要内容力存在显著差异。随着大数据技术的不断进步，

人工智能技术已经可以实时地对这两种识别系统
本文研究的是电力系统语音指令识别算法。
进行数值预测，从而更有效地识别人类的语音
在现代电力系统中，语音交互处理技术逐渐广泛
特征。
应用，它显著提升了人机交互的效率和安全性，并
对于语音识别方式，本文调研了多种语音识
降低了系统操作的难度。因此，开发一种高效且
别方式，其主要原理如图 1 所示。这些方法通常
可靠的语音指令识别系统对确保电力系统的稳定
涉及对音频文件的解码，然后与发音字典、语言模
运行至关重要。
型等进行匹配，最后输出满足匹配条件的结果。
（1）语音信号预处理。在传输过程中，语音

指令会受到噪声、失真等多种因素的干扰，导致其
识别精度和可靠性大幅降低。通过分析信号处理
方法，本文提出了一种基于小波变换的语音信号
预处理方法。该方法通过分析小波系数来实现信图 1 几种语音识别方式的主要原理
号降噪和特征提取等处理。对于电力系统语音指令识别，软件会基于语
（2）语音指令识别算法。针对语音指令识别音识别算法结果建立起一套专属于用户工作环境

中常见的语音混淆、重复、模糊等难点，本文提出的语义库，通过统计使用次数、调用次数、验证次
了一种基于深度学习的语音指令识别算法。该算数等指标，可以将频繁使用的词组纳入语义库中，
法将神经网络和深度学习相结合，通过训练样本在语音识别功能运行时，系统会优先匹配语义库
在特征空间的分类，实现了对语音指令的准确中的词组。
识别。声学建模能够帮助更好地理解和处理语言的

复杂性，它能够帮助我们更准确地预测和识别语
2 语音识别理论
言的复杂性，并更好地处理复杂的语言。例如，在
［3］
通过语音识别技术，可以识别并记录音节隐马尔可夫模型（HMM）中，声学建能够更好地
和图像。这一技术通常涉及 4 个方面：识别、数值定义和处理复杂的语言结构。
建立、图像识别和音视频识别。识别过程通常涉 P ( X|W) = P (w 1) P ( x 1 |w 1 ) P ( w 2 |w 1 )
及多种步骤，如过滤、图像压缩和图像识别，最终 P ( x 2 |w 2 ) P ( w 2 |w 2 ) P ( x 3 |w 2 ) （2）
产生识别结果。识别过程可能会影响识别结果的式（2）中提到了两种概率，即初始状态概率 P

准确度和可靠性。通过贝叶斯公式，可以推导出（w 1 ）和状态转移概率 P（w 2|w 1 ），这些概率都是由
一个声音信号和一个特定词组之间的相互作用，传统的统计学方法来确定的；而发射概率 P
进而得到一个更加准确的文本表达。通过这种方（x 1|w 1 ）等则由混合高斯模型（GMM）或者深度神
式，就可以更好地理解和预测这个声音信号和一经网络（DNN）来确定。

88 89 90 91 92 93 94 95 96 97 98