0123-知识图谱-Tao

计算实体指称相似度主要有三种方法,一是计算表层特征,这种方法通常是BoW模型的延伸,或者使用CRF模型和n-gram特征。二是基于拓展特征,主要思想就是利用现有的知识库如Wikipedia抽取到实体的各种属性,可以利用这些属性信息来重构聚类,若两聚类指称项使用同一E-Mail地址则可合并这两个聚类。三是使用社会化网络,为实体建立社会化网络,通过图算法来计算实体指称项间的相似度,相关的应用有利用网页链接结构来判断人物实体间的相似度从而实现实体消岐。

评论

© 沉淀书会2020 | Powered by LOFTER