CiteSeerX(又称ResearchIndex)是1997年美国普林斯顿大学NEC研究院开发的学术论文数字图书馆,基于自动引文索引(ACI)机制,现由宾夕法尼亚州立大学管理。它可检索超1000万份文档、期刊和论文,主要收录互联网上Postscript和PDF格式的计算机科学领域学术论文,提供免费检索、全文下载、查看引文及相关文献等功能,还能用图表展示文献时间分布,助力推测学科趋势。其换代产品CiteSeerX存储文献更多、功能更强。

功能特点

  • 自动引文索引:借助 ACI 系统,自动定位、解析和索引网络学术文章,链接参考文献与引用文献。

  • 文献检索与下载:免费提供文献检索和下载服务,支持布尔检索,可通过关键词查找文献,查看全文及引用情况。

  • 引文分析与统计:能查看文献引用与被引情况,列出参考文献及被引频次、上下文等,还可计算文献相关度。

  • 图表显示:可用图表呈现某主题、作者或机构发表文献的时间分布。

优势

  • 更新及时:网络上出现学术文献全文后,能自动提取引文并标引至索引系统,比传统引文索引更快反映学术影响。

  • 免费高效:服务完全免费,包括全文下载,且通过自动化处理快速处理大量数据。

数据集应用

CiteSeerX还是文献引用网络数据集,广泛用于图神经网络等研究。它是无向图,节点代表论文,边代表引用关系。

CiteSeerX的检索功能使用方法

基本检索

  • 文献检索:在首页检索框输入关键词,默认检索篇名、作者、摘要、文本内容;搜特定作者论文可选 “Authours” 标签。

  • 引文检索:选 “Include Citations” 选项,搜索范围扩大到文献的参考文献。

高级检索

  • 字段限定:点击 “Advanced Search”,可限定篇名、作者、出版年等字段。

  • 排序规则:结果可按被引次数、相关性、标引日期等排序。

  • 范围限定:能限定文献发表时间、引文最小数目等。

检索规则

  • 支持 “and”“or” 布尔逻辑运算(不区分大小写),不支持 “not”。

  • 支持邻近词运算,默认邻近距离为一个单词。

  • 词干法有效,通配符无效;不支持词组精确匹配,但可用双引号检索完整字句。

检索结果查看

  • 文献详情:点击标题进入论文概况页,可看引用、被引情况及参考文献列表。

  • 相关文献:系统提供相关文献列表,包括活跃参考文献和同被引文献。

  • 图表显示:可查看某主题文献时间分布图表,推测学科热点和趋势。

其他功能

  • 全文下载:多数结果可直接链接下载 PostScript 或 PDF 格式全文。

  • 用户反馈:支持修改文献元数据,完善数据库。

CiteSeerx(图1)

关键问题

  • CiteSeerX是什么性质的平台?

    答:是不断发展的科学文献数字图书馆和搜索引擎。

  • CiteSeerX的搜索范围及数量?

    答:涵盖超过 1000 万份文档、期刊和论文。

  • CiteSeerX由哪个机构支持,时间范围?

    答:由宾夕法尼亚州立大学支持,时间为 2007-2025 年。