在SCI期刊投稿过程中,重复率(Similarity Index)是衡量论文原创性的核心指标,其计算方式及处理规则直接影响稿件是否被接收。以下是关于SCI重复率计算的完整指南:
SCI期刊普遍使用 iThenticate/CrossCheck(Turnitin旗下专业学术查重系统),其数据库覆盖:
学术文献:PubMed、Scopus、Web of Science等超99%的SCI论文。
网络内容:维基百科、机构网站、预印本平台(arXiv、bioRxiv)。
已出版书籍:Springer、Elsevier等出版社的电子书。
1. 总重复率(Overall Similarity)
定义:论文与数据库内容重复的文本比例(包括引用部分)。
阈值标准:
安全范围:≤15%(理想状态,适用于顶刊)。
可接受范围:15%-25%(需编辑人工核查是否合理引用)。
高风险范围:>25%(可能直接拒稿或要求重写)。
2. 单篇重复率(Single Source Similarity)
定义:与某一篇文献的最高重复比例。
警戒线:
一般要求:单篇重复率<5%(避免过度依赖某一文献)。
方法学部分:允许稍高(如实验步骤描述),但需明确引用。
检测范围:
标题、摘要、正文、参考文献(部分系统会排除参考文献)。
图表标题和描述文字(但图像本身不查重)。
自动排除项:
公式、代码(除非直接复制文本描述)。
引用标注正确的短句(如“Smith et al. (2020) reported that...”)。
重复类型 | 示例 | 处理方式 |
---|---|---|
合理引用 | 引号内的直接引用(正确标注) | 无需修改,但需控制比例(<5%) |
自我抄袭 | 重复本人已发表论文内容 | 需引用原文,或彻底改写 |
方法描述 | 常见实验步骤(如PCR流程) | 精简描述,标注标准方法来源 |
术语/定义 | 学科基础概念(如“DNA”) | 允许少量重复,避免长段落照搬 |
数据/图表 | 直接复制他人图表 | 严格禁止,需引用或重绘 |
改写技术
调整句子结构(主动→被动语态,拆分长句)。
替换同义词(如“demonstrate”→“illustrate”)。
示例:
原文:“The results show that exercise improves cardiovascular health.”
改写:“Our data indicate a significant enhancement of cardiovascular function through physical activity.”
规范引用
直接引用:使用引号并标注来源(如APA格式:Smith, 2020, p.23)。
间接引用:转述核心观点,仍需标注原作者。
处理方法学重复
引用标准协议(如“RNA提取参照Smith et al. (2018)”)。
使用流程图替代文字描述(需原创绘制)。
预查重与润色
投稿前使用正规查重服务(如Turnitin、iThenticate)。
避免使用免费查重工具(易泄露数据,数据库不完整)。
Nature系列:要求重复率<10%,且单篇重复<3%。
IEEE期刊:允许方法部分重复率稍高(如8%-10%)。
医学期刊(如NEJM):对临床数据描述重复零容忍。
案例:某论文因“材料与方法”部分重复率18%被拒。
分析:实验步骤描述与多篇文献雷同,但未标注标准方法来源。
修改:
增加引用:“RNA sequencing was performed as previously described (Lee et al., 2021)”。
精简通用步骤描述,突出本研究独特设置。
翻译陷阱:非英文论文直译后查重率可能异常(需专业润色)。
合作论文:确保所有作者知晓内容,避免团队内部重复发表。
预印本风险:上传至arXiv等平台的论文会被计入查重,投稿时需声明。
赞一个