投稿指南
一、本刊要求作者有严谨的学风和朴实的文风,提倡互相尊重和自由讨论。凡采用他人学说,必须加注说明。 二、不要超过10000字为宜,精粹的短篇,尤为欢迎。 三、请作者将稿件(用WORD格式)发送到下面给出的征文信箱中。 四、凡来稿请作者自留底稿,恕不退稿。 五、为规范排版,请作者在上传修改稿时严格按以下要求: 1.论文要求有题名、摘要、关键词、作者姓名、作者工作单位(名称,省市邮编)等内容一份。 2.基金项目和作者简介按下列格式: 基金项目:项目名称(编号) 作者简介:姓名(出生年-),性别,民族(汉族可省略),籍贯,职称,学位,研究方向。 3.文章一般有引言部分和正文部分,正文部分用阿拉伯数字分级编号法,一般用两级。插图下方应注明图序和图名。表格应采用三线表,表格上方应注明表序和表名。 4.参考文献列出的一般应限于作者直接阅读过的、最主要的、发表在正式出版物上的文献。其他相关注释可用脚注在当页标注。参考文献的著录应执行国家标准GB7714-87的规定,采用顺序编码制。

当语文学科遭遇算法时代 ——从2018年一道高(4)

来源:数理化学习 【在线投稿】 栏目:期刊导读 时间:2020-07-17 17:42
作者:网站采编
关键词:
摘要:3.1语文是不是一门统一的学科? 高校学科设置中有中文,而中小学有语文,此二者并不重合。我国目前存在着两套学科分类标准,一套依据教育部《学位

3.1语文是不是一门统一的学科?

高校学科设置中有中文,而中小学有语文,此二者并不重合。我国目前存在着两套学科分类标准,一套依据教育部《学位授予和人才培养学科目录》,另一套依据《中华人民共和国学科分类与代码国家标准》。前者是高校学科设置的依据,后者主要为出版和文献行业采用。但无论在哪一标准中,语文都没有出现在学科分类目录之中(无论是一级学科还是二级学科)。如果图书单列的话,则应按主要内容分别归入文学或语言学。

目前中小学的语文学科很难说是单纯的文学教育或是语言教育,只能说是二者在某种意义上的混合。然而这还不是全部,因为语文课程还涉及(尽管相对较少)比如历史、社会、心理、逻辑、哲学、伦理等内容。语文学科无疑是综合的,只要一个对象是通过语言来呈现的,它就可以成为语文课程讲授的内容。就此而言,从当代学术体系来看,语文学科应该更偏向于现代意义上的语言学(见下一小节)。然而一般人对于语文学科的直观体验却是它与文学更为亲近。这恰是80年代一元论的遗产。语文学科的这种状态使得现代的学科规范很难真正渗入到中小学的日常教学之中,为之提供强有力的理论支撑,也使它无法同学术研究的前沿保持一定的互动(这种互动既能帮助教师吸纳一部分已取得学术界公认的研究成果,也能够帮助高中生在进入大学之后迅速地进入学术角色)。语文在人们眼中常常是这样一种形象:谁都能谈上几句,又没有谁能真正说清。其背后的深层原因与此密切相关。

3.2语文学科应该严肃地面对语言学的发展

语文教育亲近文学疏离语言学,这是一个不争的事实。2018年5月,北京语言大学教授、知名语言学家李宇明在的一次演讲中说:“国家储藏的语言知识和语言学知识太少。语言学的学科专业训练严格说是始于硕士阶段,而很多学科的人才培养中学就开始了。在外国语言文学和中国语言文学相关专业的本科培养阶段,多数学生有志于文学,对语言学感兴趣者很少。”[9]这一现状同语言研究表现出的情感和价值中立性很有关系,它显然同人文学科中的理想主义相冲突。但是这只能说是对语言学的一种误解,与国内语言学理论发展相对滞后有关。

众所周知,语言是人类认识的重要基础,但是中国传统的认识范畴始终满足于把语言视为仅仅是指陈性的。这种传统根深蒂固,使得许多人自幼就建立起了一种认识模式,它认为:相对于实在而言,语言是次要。这从“有名无实”“文以载道”一类语汇中也可以看出。然而,随着语言学的发展,人们越来越多地认识到语言的创造性力量,以及它作为思想和文化组分的深刻影响。同时,由于语言与人类思维的直接相关性,今天的神经科学、认知科学都有专门同语言学的接合域。语言学还通过文体学这样的分支把传统的文学研究纳入了自身的范畴。近年来,认知科学也深入到了审美领域,试图就一些人类审美现象给出其脑科学的解释。语言学的这些发展使得传统意义上的文学的边界更为模糊起来。

然而,正如李宇明教授所言,社会整体对语言的关注和认识是非常不足的,而中小学语文课程对语言的关注显然也是不足的,此二者基本上互为因果关系。语文教师往往有这么一种含糊的印象,文学较之语言是更为高级的东西(80年代的传统),语言本身只是“基础”,而对于绝大部分学生而言,一旦离开了高中,他们极有可能从此再无机会系统地认识语言了。

3.3语文学科必须面对一些传统分支的数理化

这一点前文已多处涉及。文体特征是可以通过统计学的方法来测量的,语言风格是可以被算法分析的,更不用说逻辑这一早就和数理紧密结合的学科了。至于有人担心过度的数理化会剥夺对文学作品的鲜活审美感受,并把冰冷的数字视为对人类主体性的威胁。就此,笔者提请大家不要忘记,语文考试所依赖的客观分析法(尽管事实上它们未必客观),早已因为剥夺了审美的个性而屡遭诟病。此类批评不过是强调了文学性的获得主要应该依靠感悟。这是真的吗?2017年11月一篇发表在美国《新科学》(New Science)上的文章,展示了计量文体学能有多么强大,它在分辨文章风格方面可能已经超过了人类。文章提到,亚利桑那大学的计算机科学家陈炘钧提出了“笔纹”的概念,它好比语言的指纹,“是我们写作风格中的细微差异,包括词汇、句长和段落铺陈等的不同”;而一款名叫JStylo程序只要采集6 500字的样本,就能将一段文字和它已经研究过的一批作者做对比甄别,结果能达到80%~85%的准确率[10]。不得不说,新的技术手段对于传统的风格分析法具有潜在的压力。此外,在语言学的其它一些方面,数学建模的方法早已得到广泛应用,目前在语义、语法和篇章的分析方面数理方法已深度介入,这在计算机和人工智能方面表现得尤为突出。笔者个人最近在网络平台“知乎”上有这么一次交往,有人提问:“有很多短句子拆词,如何正确拆出专有名词?”就此笔者给出了一些看法:英语书写的专有名词是有形式标记的——大写。但是在汉语或是一般语言的口语中识别专名的确是比较困难的。因为英语中专名会有意义缺失的特性,比如American,它不具备一般词汇的意义,用克里普克的话说就是:仅仅指称,没有意义。但是遇到一些由一般语汇组合成的专名就很难辨认,比如The United Nation,尽管the是一个标记,但是第一次听到的话其实不易辨认。汉语中组合词很多,比如人名、地名,许多都是由一般语汇或语素组合而成的。比如“河南”,在“村西有河,河南有田,河北有林”中“河南”就不是专有的。所以有的时候机器翻译会出问题,这往往和专名有关,如“我要上海上去”译为I want Shanghai to go up,其实目前几家在线翻译都会译为I want to go to Shanghai,他们的算法里面包含词频的要素。算法目前还很难解决这个问题,它本质上是个语义学问题。笔者带学生读古汉语的时候最难的就是分辨专名,这个必须依靠背景知识,也就是百科知识。如果要深入算法问题的话,笔者觉得这可能最终需要算法分层和语料库的结合。

文章来源:《数理化学习》 网址: http://www.slhxxzz.cn/qikandaodu/2020/0717/374.html



上一篇:作为写作的文学批评
下一篇:人文教育 未来可期

数理化学习投稿 | 数理化学习编辑部| 数理化学习版面费 | 数理化学习论文发表 | 数理化学习最新目录
Copyright © 2018 《数理化学习》杂志社 版权所有
投稿电话: 投稿邮箱: