个人简介
我的主要研究方向是语音信号处理,包括语音识别、多模态语音处理以及语音生成等方向。 博士期间的工作主要围绕声音转换研究,主要开展了基于序列到序列的语音转换、超声图像以及唇形到语音生成方面的研究。 在科大讯飞的博士后在站工作以及来到陕西师范大学之后,主要围绕语音识别、音视频语音识别以及语音无监督训练开展研究。
本人在语音处理及人工智能领域知名学术期刊和会议上已经发表和接受论文二十余篇,发表论文累计被引用1000余次。 本人于2018年、2020年与团队参加国际语音转换大赛Voice Conversion Challenge获得第一名成绩, 于2021年与团队参加国际语音识别大赛OpenASR并获得多项测试指标第一名。 在学术任职与服务方面,本人现担任中国计算机学会语音与对话听觉专业组委员,陕西省计算机学会教育数智化专委会委员, 曾多次参与IEEE/ACM Transactions on Audio, Speech, and Language Processing、 Neural Network、Knowledge Based Systems等期刊,ICASSP、Interspeech、AAAI等国际会议的审稿工作。
我未来希望更多地探索大语言模型(LLM)和语音感知与理解结合、多模态语音感知以及高表现力的语音生成等研究方向。 非常期待优秀的本科生和研究生同学能加入我的研究团队,我们一起探索语音感知、理解以及生成的创新性算法以及应用场景。
招生期望
欢迎对语音处理及人工智能有浓厚兴趣的学生加入我的团队。我希望你具备以下特质:
- 具有较强的科研和学习的自驱力,善于主动学习
- 扎实的编程基础和良好的数学基础,动手能力强
- 对深度学习和语音处理有基本了解或强烈兴趣,愿意深入探索
作为导师,我能提供:
- 多元的交流学习机会:本人和中国科学技术大学、科大讯飞研究院、爱丁堡大学等机构保持密切合作。 优秀的同学可以推荐实习以及交流学习的机会。发表优秀学术成果的同学有参与国内外学术会议的机会。
- 语音领域前沿课题的指导和讨论:定期的进行学术讨论科研方向等指导,希望我们能一起充分合作,开展有价值的研究,做出有影响力的工作。 同时,我也会尽力保证团队的GPU等计算资源,使同学们能够更加高效地开展研究。
主要经历
- 讲授专业课:线性代数(秋季学期)、离散数学(春季学期)
- 讲授公共课:大学计算机基础(秋季学期)、Python与人工智能(春季学期)
在科大讯飞期间,本人多次承担或参与了公司内部的语音识别、多模态语音信号处理、语音交互等技术攻关与项目研发。 相关研究成果已经应用于目前科大讯飞的多项产品中,例如讯飞办公本、录音笔、智慧座舱、交互大屏等。 本人和科大讯飞有限公司、科大讯飞西安研究院保持着密切的科研合作关系,优秀的硕士同学有机会进入科大讯飞实习。