薯儿 发表于 2024-8-3 10:48:03

python3解析wav文件获取dtmf值

操作系统 :Windows 10_x64
Python版本:3.9.2
从事FreeSwitch相关工作,大概率会遇得到DTMF,DTMF的传递方式有三种:

[*]In-band
[*]RFC2833
[*]SIP-INFO
使用RFC2833或SIP-INFO传递方式的DTMF,FreeSwitch可以在日志中打印出来,但遇到inband模式的DTMF,FreeSwitch的日志就打印不出来了。
如果是会议场景,使用In-band模式(比如固话)发送DTMF,DTMF按键的声音和音频流混合在一起发送到对端:
1)在传输过程转换为2833格式dtmf后,会添加2833格式的DTMF按键信息,混合在音频流里面的DTMF按键未移除;2)会出现在会议系统中可以听到座机传来的DTMF按键音。
这个问题目前没有比较好的解决办法,这里记录一下。但这个问题引发了我的思考:
In-band模式的DTMF能识别吗?如果可以识别,怎么识别?
今天整理下In-band模式DTMF识别的笔记。我将从以下几个方面进行展开:

[*]DTMF介绍
[*]如何生成包含DTMF按键音的wav文件
[*]如何使用python脚本解析wav文件获取DTMF按键值
[*]运行效果截图及配套资源下载
一、DTMF介绍

DTMF信号即双音多频信号,网上介绍的资料比较多,这里主要关注的是频率信息,可以参考下pypi上关于DTMF的介绍:
https://pypi.org/project/dtmf/

二、生成包含DTMF按键音的wav文件

1、使用Audacity生成wav文件

Audacity版本:3.1.3这里使用Audacity进行噪音文件的生成,如果不了解Audacity软件,可参考这篇文章:
https://www.cnblogs.com/MikeZhang/p/audacity2022022.html1)选择"生成->DTMF音..."

2)生成0123456789音频

3)导出音频
这里使用8000hz导出音频。

如果想直接使用导出的音频文件(dtmf-au.wav),可从如下渠道获取:
关注微信公众号(聊聊博文,文末可扫码)后回复 20240803 获取。2、使用软电话模拟inband模式生成wav文件

1)配置软电话,使用inband模式

 2)用会议室模拟通话过程的DTMF按键
conference test bgdial user/1001
conference test bgdial user/10021001按键,在会议室的1002可以听见按键音(按键值:123456789*0#)。
3)执行会议室录音
命令如下:
conference test recording start /tmp/dtmf-fs.wav这里描述下大概流程,如果想直接使用导出的音频文件(dtmf-fs.wav),可从如下渠道获取:
关注微信公众号(聊聊博文,文末可扫码)后回复 20240803 获取。三、python解析wav文件获取DTMF按键值

在GitHub上找到一个解析dtmf的库:
https://github.com/ribt/dtmf-decoder

 如果无法打开,可从文末提供的渠道获取下载的源码压缩包。
其核心是 dtmf.py 文件,运行效果如下:

 也可直接使用我修改过的代码(dtmf2.py):

完整代码可从如下渠道获取:
关注微信公众号(聊聊博文,文末可扫码)后回复 20240803 获取。运行效果如下:

四、资源下载

本文涉及源码及相关文件,可从如下途径获取:
关注微信公众号(聊聊博文,文末可扫码)后回复 20240803 获取。
 好,就这么多了,别忘了点赞哈! 

来源:https://www.cnblogs.com/MikeZhang/p/18340275/pyDecodeDtmf20240803
免责声明:由于采集信息均来自互联网,如果侵犯了您的权益,请联系我们【E-Mail:cb@itdo.tech】 我们会及时删除侵权内容,谢谢合作!
页: [1]
查看完整版本: python3解析wav文件获取dtmf值