“马栏山语言与文化论坛”第44期:上海外国语大学毛文伟教授应邀来我院讲学
发布时间:2023-04-13 责任编辑:海婧 作者:黄双 来源:我院
2023年4月7日下午2:00,上海外国语大学毛文伟教授在宁静楼3-6为我院师生开展了题为《常用日语数据挖掘方法及应用综述》和《数据挖掘技术在日语语言文学研究中的应用》的专题讲座。讲座由院长刘芬主持,副院长谢冬、全体博士、日语教研室教师及部分日语专业学生参加了本次讲座。
讲座中,毛文伟教授从数据挖掘的定义和近年来国内部分相关研究展开,具体介绍了基于机器学习的数据挖掘方法和基于统计学的数据挖掘方法。毛教授强调,在信息大爆炸的今天,我们只有运用数据挖掘技术,才有可能从庞大数据中提取可信度高、具有潜在价值的信息。数据挖掘的实现手段既包括充分利用Wordsmith、AntConc、SPSS、KH Coder等现有工具,也可以通过使用Python、R等编程语言,根据实际需求,编制相应的分析工具。
随后,毛教授通过具体的研究案例生动形象地介绍了数据挖掘技术在日语语言文学研究中的应用。在语言学研究领域,毛教授主要探讨了基于词表比对的高频副词分布特征分析、基于高频词的公司形象研究、基于STTR的词汇密度统计、基于词频统计的词汇使用状况分析等等。在文学研究领域,毛教授主要以夏目漱石、村上春树等作家为例,介绍了数据挖掘技术在作者识别、写作时间推断、作品分析和文本分类等方面的应用。此外,毛教授还介绍了数据挖掘技术在新闻媒体领域的具体应用,如舆情监控等。
提问环节,与会老师们踊跃发言,毛文伟教授一一为大家耐心解答。此次讲座持续了三个多小时,为在场的师生们的学习、教学、科研提供了一种新的方法和思路。
审核:黄双 谢冬 刘芬