- 一级建造师考试
- 二级建造师考试
- 三支一扶
- 安全评价师考试
- 保险经纪资格考试
- 报关员资格考试
- 博士入学考试
- 成人高考
- 成人英语三级考试
- 程序员考试
- 出版专业资格考试
- 大学英语三级
- 大学英语四六级考试
- 单证员考试
- 导游证考试
- 电气工程师
- 电子商务设计师考试
- 房地产经纪人考试
- 房地产评估师考试
- 高级会计师资格考试
- 高考
- 高中会考
- 给排水工程师
- 公共英语等级考试
- 公务员考试
- 国际货运代理
- 国际内审师
- 国家司法考试
- 化工师
- 环境影响评价师
- 会计人员继续教育
- 会计职称考试
- 基金从业资格
- 计算机等级考试
- 计算机软件水平考试
- 监理工程师考试
- 教师招聘
- 教师资格
- 结构工程师考试
- 经济师考试
- 考研
- 空姐招聘
- 遴选
- 美术高考
- 普通话考试
- 期货从业资格
- 求职招聘
- 人力资源管理师
- 软件设计师考试
- 商务英语考试(BEC)
- 社会工作者职业水平考试
- 审计师考试
- 事业单位招聘
- 事业单位招聘
- 数据库系统工程师
- 特许公认会计师(ACCA)
- 同等学力
- 统计师考试
- 托福考试(T0EFL)
- 外贸跟单员考试
- 网络工程师考试
- 网络管理员考试
- 网络规划设计师考试
- 系统分析师考试
- 消防工程师
- 小升初
- 校园招聘
- 信息系统管理工程师考试
- 选调生考试
- 雅思考试
- 岩土工程师考试
- 医生招聘
- 艺术高考(艺考)
- 银行从业人员资格
- 银行招聘
- 英语翻译资格考试
- 营销师考试
- 造假工程师考试
- 证券从业资格考试
- 中考
- 注册安全工程师考试
- 注册测绘师考试
- 注册城市规划师考试
- 注册环保工程师考试
- 注册会计师考试
- 注册计量师考试
- 注册建筑师考试
- 注册税务师考试
- 注册资产评估师
- 专升本考试
- 专业英语四级八级考试
- 自考
- 安全员
- 跟单员
- 考试一本通
- 其它资料
一、职称论文检测系统的检测原理
将待评审的职称论文进行学术不端检测是 cnki 学术不端检测系统的一大
新应用,其检测原理是和未发论文检测系统的原理相同,只是检测手段稍有
不同。
(一)检测原理———“文字比对”20 世纪 90 年代后,随着互联网技术的发
展,信息内容迅速增多,复制粘贴变得越来越容易与普遍。文本复制 (抄袭)
是学术不端文献的重要特征。随着内容管理与版权保护的需要,文本复制的
检测研究也得到进一步发展,陆续提出数字指纹、VSM 等检测方法。[3]笔者
通过对检测原理的深入研究发现,目前国内外的学术不端检测系统都是以“文
字比对”———提供文字复制比率为基本原理,也就是说出现了初级的文本复
制类型的抄袭,系统可以轻易地识别。以这种“文字比对”为识别基础的学术
不端检测系统采用的是“外形”对比以及针对文字、字母与数字的排列组合进
行形式上的比对,如果被比对的两段文字的句式、用词、排列顺序相同,就
可以被检测出来。但如果是意义抄袭就比较隐蔽,系统基本无法检测出来。
(二)检测手段的改进将一篇待检测的职称论文放在未发论文检测系统中
会发现全篇皆红,系统会提示这篇论文和该作者的已发表的论文重复率为
100%,也就是说未发论文检测系统是没有办法对已经发表的论文进行检测
的,主要是因为该系统缺少一个时间模块判定功能,即自动删除该文章发表
时间以及以后的“相似”论文。基于此,已发论文检测系统特别设置了论文发
表时间功能,并要求委托人提供论文的发表时间。据此时间,去除了发表时
间在所测论文发表时间之后(含发表时间在同一天)的“相似”论文,最终获得由
系统自动生成的“文字复制比”结论。这个结论虽然不包含所测论文发表时间
之后(含发表时间在同一天)的抄袭结果判定报告,但是对该文章发表之前,
它是否存在抄袭的现象是可以检测的,这部分的功能和未发论文检测系统是
一致的,所以我们可以适当借用未发论文检测系统部分适用的研究成果来探
讨对检测结果的判断。
二、抄袭判断的量化指标
三、影响职称论文检测结果的因素
(一)提供的待检测文档的类型及出处 Cnki 期刊学术不端文献检测系统目
前以“中国学术期刊网络出版总库”为全文比对数据库,当前,可对 DOC、
TXT、CAJ、KDH、NH、PDF 等多种格式的文件进行比对,从词、句子到段
落等方面,可检测抄袭、伪造、一稿多投、篡改、不正当署名、一个成果多
篇发表等多种学术不端行为。[6]同时,职称评审文件中规定:优先从图书馆
“中国知网 CNKI 数据库”中下载 CAJ 或 PDF 格式电子版论文(专著、译著、教
材及外文刊物上发表的论文除外)。如未在该数据库中检索到提交论文,可以
从图书馆其他数据库中继续查找并下载 PDF 格式电子版论文,如仍然没有,
方可提供 WORD 文档。提交论文原件和完整论文的电子版(须 PDF 格式,著
作、教材除外)。[7]经过笔者的了解,在实际操作中,也是按照这个文件的
规定做的,待检测文献的电子文档,并没有一定要求使用 PDF 格式,只要提
供的电子文档能够正常地从中复制出文本来,PDF、DOC、CAJ(及其系列文
档类型)、 RTF 及 DOCX 都可以。首先是从 cnki 学术网络中下载,可是受技
术水平的限制,很多早期的文章是以 PDF 照片———图片的形式存在的,不
能复制文本,还有部分编辑部提供的原稿采用了密码或版权保护也不能复制 ,
另外一种情况是由于编辑部新发论文上网需要一定周期,新发论文也没有原
始文档,只能向送检人索要编辑部的修改文档,当然,非 cnki 下载所得的文
档,所有的文档类型要在检测汇总表中予以说明。由以上的复杂情况来看,
不同类型、不同情况下提供的电子文档,在检测中会出现检测比例的不同。
如一位研究者反映,他在《航空学报》个人比对库中的一篇文章(.docdoc 格式,
为作者提交的录用定稿)已经在中国期刊网上发布(具体采用的比对文件格式
未知),新提交的一篇稿件被检测出与这 2 篇文章有文字重合的问题,但检测
结果中该稿与个人对比库中的稿件间的文字复制比为 46%,而与同一篇文章
在中国期刊网中的版本的文字复制比为 26%,不同的格式竟然造成检测结果
间 20 个百分点的差别。[8]可见不同的文档形式会对检测结果产生较大的影
响,这种现象需被重视。
(二)第三方检测模式毋庸置疑,检测系统在程序上是非常容易操作的,
但任何一种程序设计都会存在一些设计没有考虑周全的部分和现有的技术水
平和使用条件无法达到的要求。检测方式是图书馆的第三方检测,由于学科
的限制,检测者对文章水平没有直观感受只能信赖软件,以系统检测结果出
一份报告。一般来说,检测者不会对检测结果的百分比多少做一个结论,只
是提交结果,评价者是由职称管理部门和专家来确定的。当然学术不端检测
系统是一个初步的检测,后期还有专家评议一个环节来判断文章的优劣。但
是对于一些处于临界值的稿件,如果只是看到其检测结果超标就进行清退对
被检测者是不公平的,因为它已经没有资格进入下一道环节了。第三方检测
者只是在出具汇总报告时添加的一个说明文字,提示一些具体情况,笔者认
为可以使用一些可以共通的原则,对检测结果要出具更具体的修正报告,包
括剔除系统误判的部分和系统未发现问题的部分,为参评者提供公正的服务。
四、对职称论文检测报告的修正
要制定可以通用再研判的标准,首先要搞清楚“文字复制比”与“文字抄袭
率”的关系,我们通常看到的学术不端检测系统提供的是“文字复制比”,但它
绝对不等于“文字抄袭率”。“文字复制比”是系统提供的有抄袭嫌疑的地方,
“文字抄袭率”是我们已经定性的抄袭的文章的比例,两者性质是截然不同的 。
[9] 基于此,笔者认为真正的文章抄袭率应该如下修正:文章抄袭率 =文字复
制比—系统误判+系统漏判这里,“文字复制比”是系统提供的百分比,“系统
误判”是指虽然被系统检测出来有抄袭的嫌疑,但并不能算作抄袭的部分,
“系统漏判”是指虽然系统没有检测出来,但是存在隐性抄袭的部分。
(一)减掉系统误判的抄袭率
2.doc作者误引了抄袭文字,必要时通知作者申诉。对这点,职称检测政策
中规定了“论文中有明确注明为引自其他论文中的内容,不计入”。虽然注意
到了这种情况,但统统减掉还会有漏网之鱼的嫌疑,在后面会具体讨论。
毕业论文中相似的,不计入。博士、硕士论文虽然被收录到了 cnki 文献
库中,但是并不属于印刷及公开发表的文章,对这个原因导致的相似比应剔
除。(3)与本人论文发表后,他人引用本人论文中的内容,不计入。(4)论文中
有明确注明为引自其他论文中的内容,不计入。(5)送检论文中的同一段文字
内容,和其他多篇文章相似的,则该段文字造成的相似比,按一次计入,不
重复累加。以上几种条款起到了保驾护航的作用都应该在检测报告中适当删
减,但也有一些情况虽然没有被系统检测出,但一旦被查到是要严厉指出的。
(二)增补系统漏判的抄袭率:设定各种抄袭情况的权重系数有的文章虽
然检测的抄袭率很低,但是文章若存在以下一些状况,应适当建议增补权重
系数一项,具体为:
1.doc有对句义、观点、主题抄袭现象,无个人观点,及对外文文献套改翻
译抄袭等。这种抄袭手段隐蔽,比较难发现,性质也比较恶劣,对此,可以
增加公示环节,以增强被检测者间互相监督,更有利于发现比较隐蔽的抄袭 ,
一旦发现并查实,在所出具的报告中应明确指出:对检测结果乘以适度的权
重系数,以增加其抄袭率。
3.doc论文中有明确注明为引自其他论文中的内容,不计入,在实际的检测
过程中会发现有的作者明明没有引用,也乱标参考文献引用以显示所看论文
数量较多,对这种情况,发现了一定要在检测报告中明确指出。
4.doc文章的后部重合度(ER)项较高,即在文章中的“解决问题”部分和文章的
核心句子部分抄袭率较高,但全文抄袭率较低。这种情况应视情况加一个权
重系数,拉高全文的抄袭率,因为文章核心部分的抄袭性质比较严重。这一
定要在出具的检测报告中明确指出。Cnki 检测系统是智能很强的系统,能帮
助检测者高效检测稿件,但是,稿件的情况非常复杂,应该具体情况具体分
析,对检测所出具的报告一定要慎重,准确判断报告中哪些是依据原则要减
掉的系统误判百分比,哪些是要增加或建议加重权重的抄袭率,建议有关部
门尽快做出统一的标准供检测者操作。另外对检测结果要实行公示制度和作
者申辩制度,有利于发现比较隐蔽的抄袭,以做到对检测结果的完全的公正
和客观。
温馨提示:如果当前文档预览出现乱码或未能正常浏览,请先下载原文档进行浏览。
发表评论(共0条评论)
下载需知:
1 该文档不包含其他附件(如表格、图纸),本站只保证下载后内容跟在线阅读一样,不确保内容完整性,请务必认真阅读
2 除PDF格式下载后需转换成word才能编辑,其他下载后均可以随意编辑修改
3 有的标题标有”最新”、多篇,实质内容并不相符,下载内容以在线阅读为准,请认真阅读全文再下载
4 该文档为会员上传,版权归上传者负责解释,如若侵犯你的隐私或权利,请联系客服投诉
点击加载更多评论>>