OpenAlex是什么

OpenAlex 是一个免费、开放的学术研究知识图谱,覆盖范围广,可用于替代 Scopus Web of Science 这类收费商业数据库。它的覆盖面大,实体关系丰富,适合做宏观的科学计量和国家层面分析。

主要特点

  • 完全免费:无需订阅,API免费版每天限10万次调用

  • 开放源码:代码库开放,可自行集成其他数据源

  • 覆盖广泛:文献覆盖率约95%,高于Scopus(87%)等传统数据库

  • 结构化元数据:书目元数据质量较高且标准化,适合文献计量分析

  • 实时更新:每日网络爬取,持续收录新文献

  • 多语言支持:通过深度学习识别文献语言,便于发现非英语文献

核心数据规模(截至2026年)

  • 文献总量:约4.77亿部学术作品,全球最大的免费开放学术知识图谱

  • 实体类型:涵盖5类学术实体及其关联关系

  • Works(成果):论文、书籍、数据集等

  • Authors(作者):研究者信息

  • Sources(出处):期刊、会议、知识库等

  • Institutions(机构):大学、研究机构等

  • Concepts(概念):学科主题标签,基于Wikidata的65,000多个主题

主要数据来源

  • Microsoft Academic Graph(MAG):已停止运营,OpenAlex是其官方继承者

  • CrossRef:DOI注册机构的核心元数据

  • ORCID:作者身份识别系统

  • PubMed / PubMed Central:生物医学文献

  • Unpaywall:开放获取状态追踪

  • arXiv、Zenodo 等预印本和机构知识库

  • 针对性网络爬取:持续抓取新增学术内容

访问与使用

  1. 访问入口:直接打开 openalex.org。

  2. 基本搜索:在顶部的搜索框中,你可以自由输入需要查找的任何内容,例如一个科研主题(如 “Climate Change”)、一位作者的名字、一个研究机构的名称、或者一篇论文的标题。

  3. 高级筛选:在搜索结果页面,左侧会呈现详细的列表。右侧则提供了丰富的筛选(Filters)功能,例如你可以按文章类型(Article, Book Chapter)、出版年份、开放获取状态等条件进行过滤。

  4. 数据导出:你还可以将选中的结果导出为CSV、RIS等格式,方便在Excel等软件中进行离线分析或引用文献。

竞品对比

对比维度OpenAlexMicrosoft Academic Graph (MAG)ScopusWeb of Science (WoS)
运营状态活跃运营,是MAG的继承者已于2021年12月31日停止运营活跃运营活跃运营
运营机构OurResearch(非营利组织)Microsoft ResearchElsevier(爱思唯尔)Clarivate(科睿唯安)
数据规模(文献总量)~4.77亿部作品(截至2026年)停止更新时约2.5亿+记录~8,800万条记录(截至2024年)~8,600万条记录(截至2024年)
期刊覆盖数覆盖极广(含大量非期刊来源)极广(含大量会议论文、数据集、灰色文献)~28,000种活跃期刊~21,000-22,000种期刊(Core Collection)
覆盖起始年份1800年至今1800年至今1970年(部分回溯至1966年)1900年(部分回溯至1864年)
费用模式完全免费;API 免费版限10万次/日;2026年推出积分计费完全免费(ODC-BY许可)机构订阅制,年费数万至数十万美元(依机构规模)机构订阅制,模块化定价(Core Collection + 附加库),年费高昂
API 访问RESTful API,R包(openalexR),支持批量下载Azure Storage分发、Academic Knowledge API、MAKES私有部署提供API(Scopus API),需订阅授权提供API(Web of Science API),需订阅授权
数据开放程度完全开放(CC0许可),可自由下载完整数据集完全开放,提供完整数据转储封闭商业数据库,元数据不开放下载封闭商业数据库,核心数据不开放
核心数据源MAG遗产数据、CrossRef、ORCID、PubMed、DataCite、Unpaywall、arXiv等Bing搜索引擎爬取、CrossRef、PubMed、arXiv等直接出版商投稿、CrossRef、机构合作直接出版商合作、引文索引传统
实体类型Works, Authors, Sources, Institutions, Concepts, Funders, Publishers, TopicsPapers, Authors, Institutions, Journals, Conferences, Fields of Study文献、作者、机构、期刊、引用文献、作者、机构、期刊、引用、基金
学科分类体系基于Wikidata的65,000+主题层级体系(0-5级)动态Fields of Study层级分类体系(机器学习生成)ASJC学科分类系统(27个一级学科、300+子学科)WoS Categories + Research Areas + ESI 22个学科领域
作者/机构消歧自动机器学习消歧(2026年计划AI重写)机器学习自动消歧(作者、机构)自动+人工审核的Author ID系统ResearcherID / ORCID整合,自动消歧
引用数据覆盖Source references为主,非source references覆盖不全;共享语料库内覆盖率与WoS/Scopus相当最大的开放引用图谱之一,机器学习提取引用关系完整引用数据,包括参考文献列表和引用分析完整引用数据,citation network分析权威
元数据质量摘要覆盖率~87%(低于WoS/Scopus的92%+);语言推断偶有误差;文档类型分类精度待提升高质量元数据,但部分依赖Bing爬取准确性高质量、经过审核的元数据;摘要覆盖率>92%;文档类型分类精确极高标准质量审核;摘要覆盖率>92%;历史数据权威;期刊筛选严格
语言覆盖多语言支持,通过深度学习推断文献语言以英语为主,覆盖多语言以英语为主,但比WoS更多非英语期刊(需有英文摘要)传统上强烈偏向英语;近年增加区域索引但仍以英语为主
地理覆盖偏向全球均衡,对非西方地区覆盖优于商业数据库(如非洲、亚洲期刊)相对全球均衡,但仍有英语偏向相对均衡,但仍偏向北美和西欧;比WoS更多地区性期刊显著偏向北美和西欧;区域索引部分弥补但核心库仍集中
开放获取追踪通过Unpaywall追踪,但OA期刊比例低于Scopus/WoS(因收录更多非OA来源)提供开放获取状态信息追踪开放获取状态,OA期刊比例较高(27%)追踪开放获取,OA期刊比例约27%
主要优势完全免费、覆盖最广、开放透明、全球均衡、API友好、适合大规模文献计量数据完全开放、引用图谱庞大、机器学习驱动的实体消歧、会议论文覆盖强界面现代友好、覆盖均衡、会议论文丰富、CiteScore免费公开、作者追踪工具强历史权威、期刊筛选严格、Impact Factor发源地、引文分析金标准、历史回溯最深
主要劣势元数据精度不如商业库;缺乏用户友好的高级搜索界面;文档类型分类较粗;引用数据不完整已停止更新;部分数据被后续项目继承但不再维护;缺乏持续质量改进商业收费高;对非英语/非西方覆盖仍有限;选择性索引可能遗漏新兴领域覆盖最窄(选择性最强);费用高;界面较老旧;地理和语言偏见明显;对新兴领域反应慢
适用场景开放科学研究、大规模文献计量分析、全球学术公平性研究、预算有限机构历史文献计量研究、已构建的学术工具基础设施(需迁移)综合性文献检索、跨学科研究、作者影响力追踪、期刊评价(CiteScore)高水平学术评价、tenure/promotion考核、历史引文分析、期刊Impact Factor查询
替代关系MAG的官方继承者;Scopus/WoS的免费替代方案被OpenAlex继承并成为其数据基础;数据仍可通过存档访问但无更新与WoS直接竞争;OpenAlex试图替代其免费功能学术评价领域的传统权威;OpenAlex和Scopus均试图挑战其地位