GeoGPT是浙江省杭州市余杭区之江实验室开展的非营利地球科学探索项目,秉持合作、共享、共建的开放科学理念,遵守AI伦理与平等科学原则。目前已开源Llama3.1-70B-GeoGPT等3个基于Llama和Qwen的模型,并公开训练数据。核心功能有解答地球科学问题、优化科研流程、提供智能工具。
GeoGPT核心功能
文献解析与数据提取:快速处理海量地质文献与数据,提取关键信息。
地质图问答与生成:根据输入数据自动绘制高精度地质图,支持地质演化过程动态模拟。
知识图谱构建:GeoGPT可以自动提取地球科学领域知识,建立跨学科关联网络,辅助发现新规律。
个性化知识助手:为科研人员提供定制化知识查询与分析推理服务。
数据处理与可视化:协助用户处理数据并生成可视化图表。
GeoGPT应用场景
古生物学研究:与普渡大学合作,完成《无脊椎动物专著》化石数据数字化,显著提升处理效率。
地质勘查与矿产管理:为地质勘查、矿产资源管理提供AI解决方案。
城市规划与选址:分析城市交通枢纽周边商业设施分布。
环境监测:分析湿地变化趋势,识别潜在退化区域。
智慧物流与路径优化:规划配送点最短路径,输出成本分析图表。
灾害预警与应急响应:模拟洪水风险区,标注人口密集区域。
教育科研与地理教学:作为教学工具,支持学生通过“对话地图”完成空间任务。
GeoGPT使用方法
基本操作
注册登录:访问GeoGPT官网,使用您的电子邮件地址和验证码注册一个帐户。
输入问题:登录后在对话框输入地球科学相关需求(如查询地质知识、请求数据处理等)。
获取结果:系统基于知识库与算法分析,以文本或报告形式输出结果。
高级操作
数据准备:若使用自有数据,需转换为JSON行文件格式(保存为dataset.jsonl)。
脚本运行:按顺序运行数据生成脚本(如gen_instruction_gpt4v_mp.sh等)预处理数据。
模型训练:使用官方或自有代码训练模型,可通过convert_format.sh脚本转换数据集格式。
预训练模型下载:从Hugging Face等平台下载(如LLaVA-1.5-7B-GeoGPT4V),提升模型性能。
常见问题解答
问题:作为非营利项目,GeoGPT如何推动“开放科学”?
答:主要通过三方面:理念上倡导合作、共享、共建,构建全球地球科学研究生态;技术上开源3个模型(Llama3.1-70B-GeoGPT、Qwen2.5-72B-GeoGPT、GeoGPT-R1-Preview);数据上公开模型训练信息,所有资源可通过GitHub、Hugging Face、ModelScope获取,确保可及性与共享性。
问题:GeoGPT哪些智能工具可直接辅助地球科学研究?
答:三类工具:①地质图生成(GeoGPT Map Generator)——绘制专业地质图,满足空间分布可视化需求;②矿石识别(Ore Recognition)——通过图片识别岩石/矿石/矿物,辅助野外勘探与样本分析;③地质图问答(属科研工作流模块)——识别地质图经纬度信息,快速提取关键空间数据。
问题:研究“四川盆地地质结构”可借助哪些功能?操作流程如何?
答:通过三大功能递进操作:①“地球科学问答”——输入需求(如查询相关文献),获取领域文献推荐;②“文档抽取”与“阅读简化”——提取文献关键信息(如地质构造类型、形成年代),快速掌握研究基础;③“地质图生成”绘制盆地地质结构图,结合“个人资源库”存储文献、数据与图表,构建专属研究体系,提升效率。
GeoGPT自2025年4月27日全球开放以来,注册用户超4万,覆盖135个国家。2025年在“人工智能造福人类全球峰会”入选国际电信联盟(ITU)《人工智能向善创新实践案例集》,获优秀创新实践案例奖。