当AI“小娘鱼”开口讲“倷好”
——科技赋能给苏州话带来的传承、跨界和出圈
选题策划杨天笑高岩
(相关资料图)
稿件执行叶永春
苏州轨交11号线开通后,上海游客到苏州多了便捷的选择,更多了听到正宗苏州话的机会——11号线是首条有苏州话报站服务的轨交线路。从苏州轨交11号线连通上海地铁11号线的特殊性来看,新增苏州话报站,被很多“吴语爱好者”认为是苏州话的又一次“出圈”。毕竟,即便在本地,苏州话也不是耳熟能详。
不过,很多人或许不知道,苏州话正以各种别开生面的形式,悄然上演着一次次“逆袭”——从时间维度看,苏州方言中即便是一个字的发音,民间爱好者所梳理的相关专著和史料,可追溯至150年前甚至更早;从地域维度看,专家学者以及方言保护志愿者通过语料采集和田野调查,所绘出的吴语版图,愈加生动而精细。而随着AI(人工智能)技术的赋能,这个时代或许还将为苏州话的保护和传承开启更多颠覆传统的“破圈”之旅。
AI“小娘鱼”成“爆款”
在AI技术“加持”下,苏州话的跨界,令人惊叹。
今年5月,在苏州博物馆一次媒体发布会上,有则信息就与苏州话有关——《苏州变HUA》AI苏州方言通感互动展暑期在苏州博物馆西馆举行。这个互动展由苏州博物馆、广州美术学院、中国美术学院以及科大讯飞(苏州)科技有限公司(以下简称苏州讯飞)联合推出,将通过声音和视觉呈现,让苏州话听得见、“看”得见。
这次展出并非苏州话的首次跨界。在电脑端或手机端打开苏州非物质文化遗产网络平台,进入“数字展厅”,随意点开一件非遗展品,比如国家级代表性传承人周建明的核雕作品《苏州园林》,在屏幕上欣赏作品的同时,若选择“苏州话讲解”,则会有一个小姑娘的声音娓娓道来:“本作品,以苏州十大园林为题材,采用技法为浮雕技法,部分镂雕,分别刻有狮子林、拙政园、网师园……”“小姑娘”说的正是苏州话。很难想象,“她”其实是一套AI模型,通俗地说,相当于一套算法。
这位AI“小娘鱼”(苏州方言中“小姑娘”之意)的“出声率”不低。在一套以拙政园手绘地图形式展示的导览系统中,“她”是导游,能用苏州话与游客互动;在系列公益短片《姑苏琐记》三部曲《金缕衣》《懒画眉》《天仙子》中,“她”为三部曲的苏州话旁白及“天仙子”一角配了音。这三部曲,正因有“她”的苏州话旁白,获得了全网1.3亿的关注度,并成为去年苏州中考语文试卷中一道“现代文阅读”考题中的案例,考题的主题为“科技与方言”。
AI说方言,正是一项方言保护计划的核心。2017年,科大讯飞发起“方言保护计划”,让人工智能学会说方言。2018年,“方言保护计划”上线苏州方言识别系统,苏州话成为这项计划中的25种方言之一。“相比其他方言,苏州话‘十里不同音’,而且同一个意思经常会‘十个人有十种表达模式’,语料采集就很艰难,需要请专家判定,哪个音才算地道的苏州话。”苏州讯飞市场部经理于馥源来自天津,正因每天与苏州话“耳鬓厮磨”,如今她已能部分听懂曾经让她如同听“天书”般的苏州话。
苏州方言识别系统上线后,从苏州各地采集而来的总共1070个小时的语料,经过专业标注,再投注到AI模型中,成为AI学习苏州话的“母本”。至于AI的声音,“方言保护计划”小组特地将其设计成苏州“小娘鱼”,显得年轻化,让人更有亲近感。而有了声音还不够,还要将苏州话转化为“方言文本”,由“方言文本”再“翻译”成普通人能看明白的文字。
于馥源所述的AI学说苏州话的过程,看似简单,实则纷繁复杂。“AI说的苏州话对不对?调准不准?还需要接受测评,通过测评不断修正。”纵观“方言保护计划”中的25种方言,苏州话属于“小语种”,尚未如部分“大语种”方言那样能很成熟地投入商用并运用于生活。但AI“小娘鱼”却以数字的形式保存了苏州话的种子。“语言是文化的底色,最本真的文化来自于语言,苏州话的语序、语法和俚语,都是苏州本土文化的体现。”于馥源和她的团队相信,或许就在不远的将来,借助技术的不断升级和迭代,AI苏州话将变得更为成熟,从而进入民生领域,在医疗、教学等方面满足“刚需”。
“苏白学堂”的共建共享
AI“小娘鱼”功力有几成?“老师”予安给出的评分是“五六成”。
予安,苏州讯飞“方言保护计划”苏州话顾问之一。实际上,她给出的“五六成”的评分,实属不低,“在不熟悉苏州话的人听来,AI说苏州话已经很像了,不过苏州人仍会觉得似像非像,特别是连读变调,几个字原本这么发音,连在一起读却是那样发音;还有韵律,说苏州话时停顿的地方不同,意思又不一样,这些方面AI还需要人工修正。”
不过,同AI“小娘鱼”般,予安参与的一档节目,无形中也让苏州话“潮”了一回。前不久,她以嘉宾身份参加的文化类脱口秀节目《锵锵行天下》播出。在节目中,她身穿汉服,以苏州“小娘鱼”的形象,向窦文涛、徐累等介绍苏州地域文化并普及苏州话,令人耳目一新。
其实,苏州话于予安,同样有点“跨界”的意味。她是土生土长的苏州人,主修的是西班牙语,在外工作数年后,她回到苏州,参加了一次苏州话能力辅导师培训,获得了苏州话辅导师证书。但站在辅导师角度看,她认为自己的苏州话还不够地道。“想再提高,但用什么方法?向哪个方向?怎么提高?没有找到途经。”于是,她借鉴学西班牙语的方法,从语音、词汇、句型以及篇章等环节循序渐进。可在自学过程中,她发现找来的专业书籍有很高的门槛,难以看懂,于是她索性将汉语言自学一遍,有了专业基础后,再通过一年的系统性学习,摸到了学习和辅导苏州话的门道。
如今,予安参照外语教学的框架,自编了一套辅导苏州话的“教科书”,并通过她在网上开设的“苏白学堂”,免费用于网络辅导。面对来自各地的学员,她曾发起过一次“为什么要学苏州话”的调查,得到了16个理由,包括“好听”“为了爱情”“有江南情结”“喜欢苏州文化”“帮助就业”“融入城市”“传承乡音”以及“帮助学外语”等。
16个理由,出人意料,更令人想不到的,是吴语爱好者们的“为爱发电”。予安难以说出,自己所在的吴语爱好者群里,到底有过多少参与者。“大量的人,在不同地方,各有工作岗位,却出于情怀和对语言的喜爱,默默做着保护和传承吴语的事。”予安所描绘的,是一幅“众人拾柴火焰高”的场景。在众人拾柴之下,他们开通了免费在线吴语词典,输入相关字、词,就可查询到吴语读音。
正因苏州话辅导有了较为成熟的体系,才吸引了越来越多的人参与学习。“有人其实想学无锡话,但发现找不到平台,而恰好苏州话有,就干脆学苏州话吧。”予安有印象的学员中,有位来自安徽的大叔,他一心想拯救自家的方言,但缺乏相关资料,便索性从熟悉周边的方言开始,他首选的就是苏州话。
予安这座“桥梁”,还体现在历史维度。在她的资料库中,随机查询一个“资”字,所筛选出的与苏州话有关的史料,时间跨度达141年。其中最早的专著可追溯至1877年,由苏州清末状元陆润庠的父亲陆懋修编著的《乡音字类》,此后的1935年,又有陆基所著的《一百年前的苏州话》。
“据说有位学者在南京图书馆注意到《乡音字类》,通过它写了一篇论文,引起了更多人的重视和研究。”予安看到的,是一个苏州话的大保护体系,而且这个体系以及现有的资料,与AI可以顺利接轨,帮助丰富和提高AI苏州话。因而她和她的“苏白学堂”,一头延续着历史,另一头触摸到了科技前沿。
苏州话里含“江南密码”
说到苏州话保护和传承,一个数年前由大学生团队调查得出的数据常被人提及——目前吴语区的年轻人中,使用吴语的比例在2%左右——相比赣语、粤语以及闽南语等方言,是个极低的数据。不过予安等吴语爱好者知道,这个数据并不全面,却有积极的一面,即引起人们对吴语保护的重视。
苏州话的分量有多重?吴方言学者蔡佞通过田野调查,有切身体会。蔡佞自小在苏州城里长大,自觉对苏州话的地区差异会更敏感一些。“比如在城里,‘修’‘馊’和‘收’的发音是一样的,出了城就会不一样,在蠡口我听人说方言,三个字的发音就分得很开。”这种变化,蔡佞印象较深的是在车坊,一条大姚塘隔开两个村,在河北边的大姚村,方言是吴县东乡口音,在河对岸的瑶盛村,方言则是吴江口音。蔡佞观察发现,两个村同在车坊,但河北边的靠车坊市镇近,村民的生活向市镇靠拢,河对岸到吴江更加方便,村民的生活与吴江地区联系更为紧密。同样的,在吴中区光福渔港村,蔡佞调查发现村民说话的口音与周边村民有明显区别,“渔港村原本以船民为主,船民在太湖中活动半径大,有的去浙江湖州捕捞,有的在宜兴上学,口音中混杂有周边方言的特征,形成了一种特殊的口音。”
更令蔡佞着迷的,是苏州话中的奥秘。“苏州城里有大井巷,可史料记载巷子原名叫大酒巷。大酒巷为什么变成了大井巷?研究一两百年前的苏州话,会发现‘酒’字的苏州话读音发生了较大变化。有些地名的演变,很可能与相关字音的历史音变有关。”借助对苏州话语音的田野调查,蔡佞“破解”了不少关于地名演变的疑问。
苏州话的奥秘,还在于记录着苏州的传统文化,包括水乡文化和稻作文化。在光福一带,蔡佞发现有个字常常用到和提到,即“公式”。村民称,山脚下的田叫山田,湖滩上的田则叫“公式田”,但说不清“公式”是什么意思。实地看过后,蔡佞才恍然大悟,村民所称的“公式田”,就是湖边筑堤形成的圩田。但为何村民称之为“公式”?原来这是土生土长的方言词汇。《蜀语》中记载“吴越谓堰堤为埧,音具”,“公式”是埧的地方俗字。更有意思的是,原本对稻作不了解的蔡佞,通过对苏州话的采集,掌握了不少苏州话中关于稻作生产的特色名词、动词,进而分清了传统稻作的各个工序。
“苏州话里有苏州生活,它不仅是语言,还记录着以苏州为代表的江南地区历史、地理、商业、农业发展等,是苏州人生活方式的反映,研究方言有利于相关学科的研究。”多年田野调查,厚厚的调查笔记,分门别类,成了蔡佞从另一个角度解读江南文化密码的一把钥匙。
Copyright @ 2015-2022 科技先生网版权所有 关于我们 备案号: 沪ICP备2022005074号-4 联系邮箱:58 55 97 3@qq.com