
金融界2024年8月22日消息,天眼查知识产权信息显示,上海上湖信息技术有限公司申请一项名为“一种音频检测方法、计算设备及计算机可读存储介质“,公开号,申请日期为2023年2月。专利摘要显示,本申请公......
金融界2024年8月22日消息,天眼查知识产权信息显示,上海上湖信息技术有限公司申请一项名为“一种音频检测方法、计算设备及计算机可读存储介质“,公开号,申请日期为2023年2月。
专利摘要显示,本申请公开了一种音频检测方法、计算设备及计算机可读存储介质,涉及语音处理技术领域。该方法包括:针对实时音频流中的待检测音频段,对待检测音频段中每一音频帧进行特征提取,得到每一音频帧对应的第一特征信息;针对任一音频帧,根据音频帧的第一特征信息和音频帧在待检测音频段中的参考音频帧的第一特征信息,得到音频帧的第二特征信息;将待检测音频段中各音频帧的第二特征信息通过分类器,得到每个音频帧的语音有效性识别结果;语音有效性识别结果包括有效帧、噪声帧或静音帧。上述的音频检测方法,可以准确的判断出无效语音,也就是噪声的起止时间,从而准确的剔除无效语音,提高了音频检测精准性。
本文源自金融界