习近平总书记近日对文化强国战略做出重要指示,明确提出:“要植根博大精深的中华文明,顺应信息技术发展潮流,提升信息化条件下文化领域治理能力。”文化兴则国运兴,科技强则民族强。用科技创新赋能中国语言和文化,在创造性转化和创新性发展中赓续中华文脉方面具有重要意义。
11月18日至23日,我校信息科学学院、语言智能研究院教师柯登峰应邀出席2024年粤港澳音乐科技大会暨粤港澳音乐科技教育与产业发展联盟成立仪式,并受聘担任粤港澳音乐科技中心专家。
会议上,柯登峰做主题发言。他表示,音乐是语言的高级表现形式,音乐与诗、词、曲有很深的渊源,当前语言智能中许多有效的经验都可以给“音乐+AI”提供参考和借鉴。柯登峰对如何做好“音乐+科技”的建设问题提出了意见。
长期以来,柯登峰老师的团队一直在科技助力传承中国传统文化、地方方言等领域开展实践研究,并取得了创新研究成果。
在同期举行的第二十二届国际潮团联谊年会和第十届世界潮商大会上,一款潮汕话的“语音识别神器”在汕头广播电视中心亮相,该系统能将潮汕方言准确识别,并实时用语音生成文字,是业内首个同时支持潮汕方言直译和意译的语音识别平台。该项目融合了前沿的人工智能技术,针对潮汕方言的复杂语音特征进行计算,实现对潮汕方言的高准确度识别,并适用于多种场景,为媒体内容制作、教育学习、智能驾驶、智能客服、实时字幕与翻译等提供便捷的智能语音交互体验,主要应用在车载系统、实时字幕与翻译、潮汕智能助手、潮汕文化教育平台、医疗辅助平台、智能家居控制平台六大方面。该智能语音识别系统的研发由深圳广电组织发起,北京语言大学等五家单位的研究团队合作打造。
语音识别与合成是计算机科学领域的一个重要研究方向,它涉及到自然语言处理、信号处理、机器学习等多个领域的知识和技术。比起语音识别,语音的合成更加复杂,更难实现,除了要准确理解语义,还要考虑人类的感情,以及重音、声调和韵律,音色的多样性和个性化等要素,才能让机器生成自然的、流畅的、接近人类的语音。
柯登峰及其研发团队还在同一时间发布了潮汕方言语音合成的最新研究成果。潮汕方言有“8个声调”,被网友戏称是最难学的一门语言。该研发团队借助大语言模型技术,采用“大量无标注数据预训练+少量数据有监督微调”的范式,基本解决了潮汕方言合成的难题,可将规范化的普通话文本转换成地道的汕头方言语音。
北京语言大学信息科学学院植根于北语“小联合国”文理融通、中外融合的国际化特色,以语言为底色,计算机科学为本色,突出语言智能特色,以“小精尖”为发展模式,不断面向国家和社会需求,服务国家发展战略,在产学研和科技成果转化方面成果丰硕。
特别支持| 柯登峰
编辑 | 陆瑶
审核 | 李超