当前位置: 首页 >> 研究队伍

自动化研究所人才库

  • 姓名: 梁山
  • 性别: 男
  • 职称: 副研究员
  • 电子邮件: shan.liang@ia.ac.cn
    简  历:
  •  

     

    研究领域: 

    麦克风阵列信号处理、语音分离与增强、噪音环境下鲁棒语音识别、音频分类等

     

    个人简历: 

    2004.9-2008.7  西安电子科技大学 计算机学院攻读学士学位 

    2008.9-2013.6  中国科学院自动化所攻读博士学位 

    2013.7-2017.9  中科院自动化所 模式识别实验室 助理研究员 

    2017.10-       中科院自动化所 模式识别实验室 副研究员

     

    在研课题: 

    作为主要完成人参与多项国家自然基金课题和国家自然基金重大研究计划重点项目,主持国家自然科学青年基金1项(已结题),面上项目1项(在研),完成多项企业合作项目,主要包括: 

    1.   基于计算听觉场景分析的鲁棒语音识别前端处理系统研究,已结题,主持 

    2.   基于空间采样与深度感知融合策略的语音分离方法研究,在研,主持 

    3.   基于声学环境深度感知和对抗学习的微型阵列语音增强方法研究,腾讯犀牛鸟计划项目,主持 

    4.   基于注意力机制的跨渠道对抗特征学习的说话人识别与验证技术,滴滴主题研发计划,主要参与人 

    5.   声学模型降噪处理与优化建模技术,学而思技术合作研发项目,主要参与人 

    6.   麦克风阵列联合研发项目,远鉴科技技术合作研发项目,实际完成人 

    7.   交互式儿童语音识别项目(华为创新中心2019华为合作研发项目,主要参与人

     

    代表论文: 

    [1] Shan Liang, Wenju Liu, Wei Jiang. Integrating binary mask estimation with MRF priors of cochleagram for speech separation. IEEE Signal Processing Letters, 19(10):627-630, 2012. 

    [2] Shan Liang, Wenju Liu, Wei Jiang, Wei Xue. The optimal ratio time-frequency mask for speech separation in terms of the signal-to-noise ratio. The Journal of the Acoustical Society of America (JASA), 2013, 134(5): EL452-458.

    [3] Shan Liang, Wenju Liu, Wei Jiang. A new Bayesian method incorporating with local correlation for IBM estimation. IEEE Transactions on Audio, Speech and Language Processing (TASLP), 2013, 21(3):476-487. 

    [4] Shan Liang, Wenju Liu, Wei Jiang, Wei Xue. The analysis of the simplification from the ideal ratio to binary mask in signal-to-noise ratio sense. Speech Communication, 2014, 59:22-30. 

    [5] Wei Xue, Wenju Liu, Shan Liang. Noise Robust Direction of Arrival Estimation for Speech Source with Weighted Bispectrum Spatial Correlation Matrix. IEEE Journal of Selected Topics in Signal Processing (JSTSP), 2015, 21(3):476-487.

    [6] Shuai Nie, Shan Liang, Wenju Liu, Xueliang Zhang, Jianhua Tao. Deep Learning Based Speech Separation via NMF-style Reconstructions. IEEE/ACM Transactions on Audio, Speech and Language Processing (TASLP), 2018  26: 2043-2055.   

    [7] Bin Liu, Shuai Nie*, Yaping Zhang, Shan Liang, Wenju Liu. Boosting Noise Robustness of Acoustical Model via Deep Adversarial Training. In Proc. of ICASSP, 2018. (best student paper award)

    社会任职:
  •  
    研究方向:
  •  
    承担科研项目情况:
  •  
    代表论著:
  •  
    获奖及荣誉:
  •