0131-知识图谱-Tao

开放域关系抽取不需要预先定义关系,而是使用上下文中的词语来表示关系。TextRunner作为一个开放域实体关系抽取系统,其主要有三个模块。首先是语料的自动生成和分类器的训练,其使用的是朴素贝叶斯分类器训练。然后是三元组的抽取,最后是可信度计算,合并之前要把相似的三元组合并起来,如(arg1,married,arg2)和(arg1,marries,arg2).

评论

© 沉淀书会2020 | Powered by LOFTER