倒谱法wav文件说话人性别识别

本论文主要研究了说话人性别识别方法,并采用倒谱法求基音周期的方法完成了相关软件的设计。


摘要:说话人性别识别是指通过分析说话人的语音信号从而判断说话人的性别,这在现实生活中有着很广泛的应用。例如在人工智能系统中,可以自动识别说别人性别并提供相应针对性的服务或内容。本论文在深入了解语音特征后,采用基音频率作为识别说话人性别识别的判断标准,通过对各种基音周期求法比较,最后选择倒谱法求基音周期。在语音数据处理方面,通过分析wav文件格式,提取wav文件中的语音数据,在求取倒谱前对语音数据进行了加窗,分帧的操作。

关键词  倒谱 基音周期 加窗

毕业设计说明书外文摘要

Title    Speakers Gender Identification                  

                                                           

Abstract:Speakers gender identification is to determine the gender of the speakers through the analysis of the speaker's voice signal. which has a very wide range of applications in real life. For example, in the artificial intelligence system, you can automatically identify other people's gender and provide the appropriate targeted services or content. In this paper, after understanding the phonetic characteristics, the pitch is used as the criterion for recognizing the gender identification of the speaker. After comparing the various method of getting pitch  I finally select the cepstrum method. As for the voice data processing, voice data is extracted from wav file by analyzing the wav file format. Before getting the cepstrum, adding window, frame is operated.  

Keywords  cepstrum window frame

目   次

1 引言 8

1.1 研究背景以及意义 8

1.2 研究现状 8

1.3 本文完成工作 10

2 语音信号的提取与显示 11

2.1 WAV文件格式解析 11

2.2语音数据的显示 13

2.3本章总结 14

3 语音数据的特征参数 15

3.1基音频率 15

3.1.1基音频率提取方法 16

3.2 性别识别 19

3.2.1基于基音频率的性别 19

3.3本章总结 20

4 需求分析 21

4.1功能需求分析 21

4.2接口需求 21

5系统设计与实现 22

5.1 支撑环境 22

5.1.1 软件环境 22

5.1.2硬件坏境 22

5.2总体设计方案 22

5.3 类的设计 23

6 系统测试 26

6.1 测试环境 26

6.2测试 27

6.2.1 界面测试 27

6.2.2 可用性测试 28

6.2.3功能测试 29

结论 30

致谢 31

参考文献 32

1 引言

1.1 研究背景以及意义

使用声音传达信息是人类最便捷、最快速、最普遍沟通信息的方式。语言作为人类特有的功能,是人类惯用也是最主要的交流信息手段。因此,语音信号是承载人类情感沟通与思维碰撞的重要载体。此外,即使听陌生人的语音,我们也能从中得出这个人的性别,大致的年龄,地域,语言等信息,这表明语音信号的特征具有显著规律性。因此语言信号相较于指纹有着更广泛的特征用于判别人。

说话人的性别是语音信号中最显著的特点,与人年龄,地域等其他属性不同的是很容易被人辨别出来,这表明在语音信号中不同性别的语音它所包含的东西差异巨大。从语音信号自动识别说话人性别信息对于许多应用来说有着很重要的意义。例如根据性别不同,电话应答可以自动地提供不同的回答。总的来说,在一般的交互系统中,性别识别有着极其重要的应用,试想自动判断出性别,然后根据这点智能化地提供所需的服务,或者说内容,是极大的便利,也是智能化程度高的体现。随着社会发 展,人们对系统智能化要求越来越高,而不同群体对计算机需求和使用都是不一样的,如果系统能自动识别说话人性别,针对男女性别的差异在系统ui的风格,文字,数据的敏感度,领域的喜爱等方面做出相应的调整,可以极大的提高效率,增加系统的智能度,满足人们日益增长的对智能化的要求。除了一般的交互系统,在社交,应用中心,游戏中心,购物等性别区分度特别高的软件系统中,自动的说话人性别识别有着更为显著的作用,提高推送消息的效率和准确性。