Science Hammer

致力于计算机科学领域的科技文献数据挖掘

借助大数据和自然语言处理技术,从大规模科技文献中,提取结构化信息,构建学术知识图谱,为搜索、人机对话、推荐系统等提供基础支持。

走进学术

数据规模

知识数量

文献数量

实体种类

关系种类

特色服务

Science Hammer 能够快速、高效地从异构文档中挖掘结构化信息。并提供多种特色服务:包括 PDF 文本抽取、命名实体识别、关系抽取、会议论文文摘、论文标题生成、学者关系网络等。

Knowledge Graph

知识图谱

知识图谱是对世界知识的一种抽象,对于构建高质量的人工智能系统具有重要意义。本系统构建的知识图谱涵盖计算机科学的各个细分领域,三元组数量超过 2000 万对。

试一试

Named Entity Recognition

实体识别

实体是自然语言中描述信息的基本单元,是构建知识图谱的基础。本系统根据科技文献的文本特征,结合预训练模型和领域词典,提出了一种低资源实体识别方法,涵盖六类实体。

试一试

Relation Extraction

关系抽取

判断实体之间的关系是构建知识图谱的关键。为了解决传统关系抽取方法效率低的问题,本系统采用规则与深度神经网络相结合的方法进行关系抽取,涵盖七类关系。

试一试

Science Hammer 是一个计算机科学领域的数据挖掘系统,致力于科技文献数据挖掘。