历史语言学的数字成像:“古音小镜”网站 您所在的位置:网站首页 数字化说文解字平台 历史语言学的数字成像:“古音小镜”网站

历史语言学的数字成像:“古音小镜”网站

2024-06-02 08:13| 来源: 网络整理| 查看: 265

1.1 建设历程

“古音小镜”网站的建设过程不同于有明确组织规划的“主流”数字人文项目,它是由广大爱好者基于兴趣和研究需求一点点推动发展的,这也造就了它数据来源广泛、数据量庞大而运作成本低的特点。

“古音小镜”诞生于2017年,由站长顾国林先生独立创建并运营至今。顾国林先生是计算机行业的资深从业者,小学研究是他的业余爱好,网站最早是为了放置个人积累的历史语言学材料而建立。许多像顾先生一样的小学爱好者通过网络相识,组建了一些方言、古音的兴趣社群。方言群内的爱好者们非常关注方言“定字”的问题:已知方言的音和义,根据古代的韵书、字书推定方言中该字的字形。群友收集了当时能收集到的所有韵书、字书(约15种,后来扩充到37种),希望能通过数字技术实现所有释文的同时查询,“古音小镜”的第一个功能——“古代韵书、字书查询”由此诞生。该功能上线后,社群内反响很好,很多爱好者开始使用。此后,沿着同样的路径,即在站长自己和爱好者们的研究需求推动下,“古音小镜”的内容一步步扩充。

随着数字技术的发展,在检索查询之外, “古音小镜”开始关注如何更高效地服务于语言学研究。站长自身熟悉计算机技术前沿,他发现许多代码界的可视化技术非常适合历史语言学领域的研究,如清人用近三百年完成的诗经分部研究,今天用“多元关系网”可以快速解决这个问题;假借字之间的关系向来是古汉语研究的难题,今天用可视化工具也有望解决。站长希望小学学者能够多考察这些工具,为其研究所用。基于这种认识,“古音小镜”推出了《诗经》韵系联、假借字系联、汉语字音时空关联等统计及可视化功能,在众多语言学数据库中可谓独树一帜。站长本人也将自己的统计结果分析也写成论文上传至网站,充分展现了数字人文在传统语言学研究中的应用空间。由此,“古音小镜”成为一个全面、系统的历史语言学资料与工具共享平台,至今仍在不断更新。

1.2 资料来源

“巧妇难为无米之炊”,网站的每项功能都需要相应的数据支撑,“古音小镜”丰富的功能是建立在其多方面的数据之上的。网站的“更新”及“致谢”栏记录了陆续增加的数据库资料及其来源,分别如表1、图1所示。结合顾国林先生提供的信息,本文将“古音小镜”的资料来源分为以下四类。

(1)Github上的开源数据。Github是程序员分享数据最重要的网站,上面也有语言学方面的资源分享,如日本北海道大学师生人工录入并校对的《篆隶万象名义》《新撰字镜》《宋本玉篇》等,是非常高质量的语言学数字资料。

(2)其他数据库。台湾“引得市”网站录入了《古字通假会典》《简帛古书通假字大系》两书的电子目录,提供了2.4万个假借对,是“古音小镜”网站“简帛假借字系联查询”功能的基础。CBETA(中华电子佛典协会)网站分享有几乎全部的佛经音义类资料,“古音小镜”收录的《玄应一切经音义》《慧琳一切经音义》《新集藏经音义随函录》等材料来源于此。蒋门马先生建立的“白云深处人家”网站共享了海量的道家文献、训诂学文献电子资源,也为“古音小镜”提供了很多材料。

(3)网友主动提供。“古音小镜”上许多难得的材料都来自于小学爱好者们的慷慨帮助。如苏州石汝杰先生提供了《明清吴语词典》电子版及自己制作的勘误表,实现查询功能后,便利了吴语的考字研究;温州潘悟云先生提供了他和学生共同整理的《集韵》电子版;复旦大学李豪先生赠予了一部国内少见的汉越音字典,于是网站增设了“日韩越音”这一功能。还有一些领域此前并没有专门的研究成果,“古音小镜”相关栏目的建立完全基于爱好者们编制的原创材料,如“汉语地理”栏目的粤语寻旺方言,是由寻旺本地的冯志铭先生自主调查记录,于2020年提供给网站的。

(4)外包录入。对于一部分没有电子数据的重要资料,网站也会将工作交给录入公司,如李荣主编的《现代汉语方言大词典》就是由录入公司整理完成。



【本文地址】

公司简介

联系我们

今日新闻

    推荐新闻

    专题文章
      CopyRight 2018-2019 实验室设备网 版权所有