文献调研无疑是科研工作中最基础、最重要的一环,那么研究者如何在海量文献中高效查找resreach gap呢?
数据库(如Web of science、知网)自带的简易结果分析过于粗糙 。
文献计量分析软件如Citespace、VOSviewer、Bibexcel等功能强大但专业性较强,从数据导出到参数调整足以劝退一部分人 。
号称“最易用”的在线文献计量分析平台bibliometric.com缺乏对结果的精炼 , 可视化效果并不友好 。
今天来给大家介绍一款简单实用的网站——Connected Papers
Connected Papers,顾名思义,将相关领域已发表论文进行关联分析 。这是一款帮助科研工作者完成文献探索和信息挖掘的线上可视化工具,于2020年6月份正式面向大众开放 。
Connected Papers基于Semantic Scholar的数据构建图表 , 不需手动进行文献条目导出 。Semantic Scholar是由微软联合创始人 Paul Allen运用机器学习技术创建的一款免费学术搜索引擎 。该数据库囊括了1.8亿多篇学术论文 , 涉及计算机科学、分子生物学、微生物学和神经科学等多学科领域 。
运用Connected Papers检索文献非常方便 , 目前支持文章标题、DOI号、以及arXiv、Semantic Scholar 和 PubMed多种来源文章的URL检索 。非常适合研究者用来写综述或者初探一个新领域 。
图1. Connected Papers首页
可以用来做什么?
1)初步探索,由点及面 。输入一篇典型文章,获取相关领域的论文可视化图表,辅助我们快速了解该领域的热点、趋势和动态 。
2)深入调研,抓重点文献 。
在某些领域,近期发表的论文由于被引量少较难追踪,但Connected Papers可以让我们轻松发现最近的一些重要文章 。
3)查漏补缺,填补空白 。
从确认需要引用的参考文献开始检索,使用本网站找到其余部分,完善文献调研结果 。
如何操作及解析可视化结果?
1)输入目标文章标题/DOI/URL(关键词亦可)以小编最近在看的一篇2009年发表在Soil biology & biochemistry文章为例 。输入文章标题——“Arbuscular mycorrhizal fungi contribute to 13C and 15N enrichment of soil organic matter in forest soils”
2)点击“Build a graph”来生成可视化图片:
这个过程视相关文章数目而定 , 数目越多耗时越长,一般情况下1-2分钟足矣 。
3)分析结果解读:
如图所示,我们把结果界面划分为3个区块 。
图3 相关文献分析可视化结果
①最左侧为相关文献名列表 。
第一篇文章即我们输入的original article 。默认依据文章与原始文章之间的相似度排序,相似度越大越靠前 。如需查看列表文章的详细属性,可以点击“Expend”转到列表视图 。在此视图下,我们可以根据文章发表年份及被引量等进行重新排序 。若想回到图片视图 , 点击“Collapse”即可 。
图4 文献分析结果的List视图
②中间为可视化图形 。
看不懂图片可以直接点击帮助图标,每一个节点代表一篇文献,节点大小表示文献被引量多寡,节点颜色由浅入深表示年代由远及近,节点之间连线越深暗示两篇文献之间相似度越高,同时相似度高的文献会在图片中聚集在一起 。具黑色环带的节点示原始文献 , 鼠标滑过非原始文献的节点均会产生白色环带予以区分 。
图5 可视化图形案例
(案例展示了相关领域的41篇文章,最早可追溯到1996年 , 其中2006年Rilling等发表的文章“Mycorrhizas and soil structure”被引次数最多)
③最右侧为指定文章的详细信息 。
包含了标题、作者、发表年份、被引量、参考文献数目及摘要 。点击“Paper details”链接到“Semantic Scholar”学术搜索引擎,可以在线预览图表(这一点可以说是非常nice了),甚至可以直接获取全文 。
图6 Semantic Scholar 文献简介界面
有意思的是 , 点击页面左上角的“Prior works”,中间一栏跳转为本文的背景文献,辅助研究者追本溯源 。蓝色部分示意直接引用的文献,而白色部分表示虽未被直接引用但内容密切相关的文献 。点击“Prior works”中的文献名称将在左侧相关文献名列表中高亮所有引用过该文献的文章 。而在左侧点击一篇相关文献,“Prior works”中将高亮该文章所引用的所有文章 。
图7 “Prior works”界面截图
相信大家也都猜到了,点击“Derivative works”可以查看引用了以上图谱中文章的文献,便于我们掌握最新动态 。玩法和“Prior works”类似,不再赘述 。
图8 “Derivative works”界面截图
其背后的原理是什么呢?
据开发团队介绍,每一幅图都是基于大量文献分析创建的,经过对相关领域成千上万篇文献的分析,选择几十篇与原文献关系最密切的论文供用户阅读 。但与文献引用树不同,开发者结合“共被引”和“书目耦合”的数据设置“相似度”这一标准,将文章按照相似度进行排列 。一般认为两篇引用和参考文献高度重叠的论文具有较高的相似度 。
在以上理论基础上 , Connected Papers构建了力导向图布局算法绘图,将相似的文章聚集在一起、差异较大的文章彼此分开 。
【实用!学会这款文献索引神器,3分钟掌握研究领域的热点和动态】当然了,任何一款科研工具都有自己的局限性 。Connected Papers不适用于中文文献调研 , 无法和Citespace等软件一样直观展示研究主题随时间线的变化,须得配合文献综述使用效果更佳!