马德拉斯大学启动 “泰米尔古典文献数字化项目” AI 助力千年文化遗产永续

印度大学语言学教授 阅读:21 2019-07-26 22:07:21 评论:0

  【钦奈讯】2025 年 11 月,马德拉斯大学(University of Madras)泰米尔语言与文学学院启动 “泰米尔古典文献数字化项目”,计划用 3 年时间,对该校图书馆收藏的 1.2 万份泰米尔古典文献(含公元 3-19 世纪的棕榈叶手稿、石刻拓片、手写典籍)进行高清扫描、AI 文字识别与数字化归档,建立免费开放的 “泰米尔古典文献数据库”,解决传统文献因年代久远、虫蛀霉变面临的失传风险 —— 泰米尔语是世界上现存最古老的古典语言之一,拥有丰富的诗歌、哲学、科学文献。

  在马德拉斯大学的文献修复实验室里,工作人员正用高清扫描仪处理一份 12 世纪的棕榈叶手稿(内容为泰米尔古典诗歌《库拉经》):“棕榈叶手稿易脆裂,我们先进行脱水、防虫处理,再用 600dpi 分辨率扫描,确保每个文字细节清晰。” 项目的核心技术突破是 “泰米尔古文字 AI 识别系统”,由马德拉斯大学与印度理工学院马德拉斯分校联合研发,能识别不同时期的泰米尔文字(如婆罗米文、 vatteluttu 文),识别准确率达 95%,远超人工识别效率(人工每天可处理 5 页,AI 每天可处理 500 页)。

  “数字化后,用户可通过数据库按‘年代’‘主题’‘文献类型’检索,还能查看手稿的高清图片、现代泰米尔语翻译、英文注释,” 项目负责人卡维塔・拉马钱德兰教授介绍,数据库还加入 “语音朗读” 功能,方便视力障碍者或不熟悉古文字的用户使用。目前,项目已完成 3000 份文献的数字化,其中 100 份珍贵手稿(如 10 世纪的《泰米尔语法大典》)已上线测试,吸引了来自美国哈佛大学、英国伦敦大学亚非学院的学者访问。该项目获印度文化部专项资助 1.5 亿印度卢比(约合 1350 万元人民币),未来还计划与中国北京大学东方语言文学系合作,开展泰米尔文献与中文古典文献的比较研究。


开封要闻

本文 印度大学中文网 首发,如需转载本文章,还请您保留本站链接!网址:https://www.in.kongzi.edu.pl/post/3063.html

搜索
排行榜
标签列表
    关注我们

    印度留学,印度大学排名,德里大学,尼赫鲁大学,印度奖学金,印度高校申请,印度课程介绍