首页 >> 语言学 >> 原创首发
袁家宏:大规模语音语料库的采集、处理和研究
2017年07月24日 14:03 来源:中国社会科学网 作者:袁家宏 字号

内容摘要:

关键词:语言;研究;语音;采集;袁家宏;语料库;存档;计算机技术;就读;处理

作者简介:

袁家宏

  【作者简介

   袁家宏,男,语言学博士。1991年至1992年就读于北京大学力学系,1992年至1998年就读于北京大学中文系,1998年至2004年就读于康乃尔大学语言学系。2004年至2005年在斯坦福大学从事博士后研究;2005年至2012年任宾西法尼亚大学语言学系助理教授,语音学实验室主任;2012年至今任宾西法尼亚大学语言资源联盟副主任,主管语音研究。袁家宏的主要研究方向是语料库语音学,语音韵律,以及语音技术在语音学研究中的应用,曾主持包括美国国家科学基金(NSF)和英国经济和社会研究理事会(ESRC)等的多项科研项目。袁家宏积极倡导和推进大数据语音学,其开发的语音强制对齐软件被广泛应用于语音学,心理学以及社会语言学等研究领域。

  大规模语音语料库的采集、处理和研究

  语言资源保护的核心问题之一是如何对语言资源进行存档。从纸笔调查到建立有声数据库,传统的语言资源存档对语言材料的采集具有很强的系统性和针对性。计算机技术和大数据的发展则为语言资源保护提供了另外一个思路,那就是利用海量的语言材料对语言的真实面貌进行全景存档。在这一新的思路中,语言材料的采集、处理和研究可以是分离的,由不同的人在不同的时间实施并共享。本文以汉语普通话为例,阐述大规模语音语料库的采集、处理和研究中的问题和方法,希望对语言资源保护工作能有所启发。

分享到: 0 转载请注明来源:中国社会科学网 (责编:赵珊)
W020180116412817190956.jpg
用户昵称:  (您填写的昵称将出现在评论列表中)  匿名
 验证码 
所有评论仅代表网友意见
最新发表的评论0条,总共0 查看全部评论

回到频道首页
QQ图片20180105134100.jpg
jrtt.jpg
wxgzh.jpg
777.jpg
内文页广告3(手机版).jpg
袁家宏.png
中国社会科学院概况|中国社会科学杂志社简介|关于我们|法律顾问|广告服务|网站声明|联系我们