这里强烈建议大家先阅读知乎SimmerChan的文章,里面写的很全很详细,我这里仅做总结。
术语
语义网络
语义网络指Semantic Network,语义网络是由Quillian于上世纪60年代提出的知识表达模式,其用相互连接的节点和边来表示知识。节点表示对象、概念,边表示节点之间的关系。
语义网络的优点:
- 容易理解和展示。
- 相关概念容易聚类。
语义网络的缺点:
- 节点和边的值没有标准,完全是由用户自己定义。
- 多源数据融合比较困难,因为没有标准。
- 无法区分概念节点和对象节点。
语义网和链接数据
语义网和链接数据是万维网之父Tim Berners Lee分别在1998年和2006提出的。
相对于语义网络,语义网和链接数据倾向于描述万维网中资源、数据之间的关系。
其实,本质上,语义网、链接数据还有Web 3.0都是同一个概念,只是在不同的时间节点和环境中,它们各自描述的角度不同。
它们都是指W3C制定的用于描述和关联万维网数据的一系列技术标准,即,语义网技术栈。
语义网是一个更官方的名称,也是该领域学者使用得最多的一个术语,同时,也用于指代其相关的技术标准。
语义网正是为了使得网络上的数据变得机器可读而提出的一个通用框架。
“Semantic”就是用更丰富的方式来表达数据背后的含义,让机器能够理解数据。
“Web”则是希望这些数据相互链接,组成一个庞大的信息网络,正如互联网中相互链接的网页,只不过基本单位变为粒度更小的数据
链接数据起初是用于定义如何利用语义网技术在网上发布数据,其强调在不同的数据集间创建链接。
知识图谱
从某种角度说,知识图谱是对链接数据这个概念的进一步包装。识图谱是由一些相互连接的实体和他们的属性构成的。
换句话说,知识图谱是由一条条知识组成,每条知识表示为一个SPO三元组(Subject-Predicate-Object)。
用更正式的说法,知识图谱是由本体(Ontology)作为Schema层,和RDF数据模型兼容的结构化数据集
RDF
RDF(Resource Description Framework),即资源描述框架,是W3C制定的,用于描述实体/资源的标准数据模型(Data Model)。它提供了一个统一的标准,用于描述实体/资源。
简单来说,就是表示事物的一种方法和手段。RDF形式上表示为SPO三元组,有时候也称为一条语句(statement)RDF图中一共有三种类型,International Resource Identifiers(IRIs),blank nodes 和 literals。
下面是SPO每个部分的类型约束:
- Subject可以是IRI或blank node。
- Predicate是IRI。
- Object三种类型都可以。
目前,RDF序列化的方式主要有:RDF/XML,N-Triples,Turtle(使用较多),RDFa,JSON-LD等几种
RDFS/OWL
RDFS/OWL本质上是一些预定义词汇(vocabulary)构成的集合,用于对RDF进行类似的类定义及其属性的定义。
RDFS/OWL序列化方式和RDF没什么不同,其实在表现形式上,它们就是RDF。
RDFS,即“Resource Description Framework Schema”,是最基础的模式语言。
上面我们提到,RDFS本质上是RDF词汇的一个扩展。后来人们发现RDFS的表达能力还是相当有限,因此提出了OWL。我们也可以把OWL当做是RDFS的一个扩展,其添加了额外的预定义词汇。
OWL,即“Web Ontology Language”,语义网技术栈的核心之一。OWL有两个主要的功能:
-
提供快速、灵活的数据建模能力。
-
高效的自动推理。