发现研究方向的重点论文——使用Web Scraper生成引文网络

问题背景

  • 大家有没有那么一种感觉?在一个小的研究方向上准备进行文献调研的时候,总有一种无穷无尽的感觉,看了一篇,这篇又引用了其它的。而且都还介绍的蛮不错,要不是目的特别明确的时候,不知不觉就去看了,看着看着还忘了本来要干什么来着。
  • 其次,在写文献综述的时候,最省事的方法是找一篇比较相近的文献看看它怎么写的,总结了些哪些,然后我们再补充一些最新的。但是,往往还是会有一种不踏实的感觉,因为现在神经网络领域真的是日新月异,在Arxiv上挂出来的文章嗖嗖嗖的往上涨。
  • 最后呢,就是在确定研究方向的时候,往往是从一两篇综述入手可以比较快搞定方向全貌了解。但是要是是一个新的方向,或者特别小的方向,没有综述的时候,该怎么办呢?

视觉对于人类来说,带来的信息量直接从文字的线性序列提升到图像中的平方级别,爆炸增长,所以有“一图胜千言”的说法。在这里,给出一种引文网络的绘制方法,帮助大家把论文的内在关系梳理清楚,找到网络中关键节点,抓住主要矛盾,迅速找到突破点!

Web Scraper

虽然很多人在力推学python然后去爬虫,但是光学好python还不够,我们至少还要有些html,数据结构的知识,才知道我们到底在干嘛。然后为了成功搞下来,还要考虑对方的协议,反爬虫机制,总之是很劝退的东西,这个时候,救星出现了。Chrome的插件,Web Scraper,具体操作和安装大家可以去搜索,我在这里直接介绍如何使用它进行引文关系的爬取。

爬啥啊爬。。。神经病,semanticscholar官方有api,python有库

你可能感兴趣的