知识图谱在知识库网站建设中的应用

2019-08-16 标签:知识库网站 浏览数:18

摘要: 文章以华夏文明传承创新视域下对知识谱图在知识库网站建设中的相关应用进行梳理,以便作者对于网站建设中的应用有个综合性了解,为以后的相关研究提供参考。

资讯主图


华夏文明凝聚着中华民族自强不息的精神追求和历久弥新的精神财富,是发展社会主义先进文化的深厚基础,是建设中华民族共有精神家园的重要支撑。甘肃华夏文明传承创新区建设,按照国家关于甘肃发展的战略定位和建设文化大省的总要求,以文化建设为主题,以经济结构战略性调整和经济发展方式根本性转变为主线,确定了围绕“一带”,建设“三区”,打造“十三板块”(简称“1313工程”)的工作布局。其中包括以敦煌文化为核心的河西走廊文化生态区,以形成集遗产保护、景观旅游、事业服务、产业发展、产品交易、文化交流为一体的文化展示研究基地和文化园区。

网站建设是指使用标识语言(markup language),通过一系列设计、建模、和执行的过程将电子格式的信息通过互联网传输,最终以图形用户界面(GUI)的形式被用户所浏览。随着人工智能的发展,网站建设的相关技术也在不断革新。知识谱图因其在建模、推理等方面的强大作用,不断被运用到网站建设中来。本文对知识谱图、以及其在华夏文明视角下知识库网站建设中的相关应用进行梳理,以便作者对于知识图谱的网站建设中的应用有个综合性的了解,为以后的相关研究提供指导。


1 知识图谱

1.1 关于知识图谱

知识图谱(Knowledge Graph)由Google提出,其目标在于改善搜索结果,描述真实世界中存在的各种实体和概念,以及这些实体、概念之间的关联关系。知识图谱本质上是语义网络,具有关联性的知识集合,把所有不同种类的信息连接在一起而得到的关系网络,实现对客观世界的结构化语义描述,提供了从关系的角度去分析问题的能力。在信息搜索领域中,知识图谱可用来描述复杂的关联关系,从语义层面理解用户意图,改进搜索质量。

式中,dij 是i和j之间的距离,Rj是i搜索区(dij

知识图谱主要的目标是用来描述真实世界中间存在的各种实体和概念,以及它们之间的关联关系。知识图谱并不是一个全新的东西,而是在以前的技术或理论上面,进行的一个重新的定义,引入了一个新的概念。

(1)知识图谱本身不是本体的一个替代品,是在本体的基础上面做了一个丰富和扩充,这种扩充主要体现在实体层面。

改革开放初期至1997年是房地产估价行业的诞生和起步阶段。期间,计划经济向市场经济转型,政府部门相继出台有关房地产产权交易等方面的法律法规,国家诸多经济改革行为也随之涉及并产生房地产估价的需要。1994年出台《城市房地产管理法》,规定实行房地产价格评估制度以及房地产价格评估人员资格认证制度,从1995年起,开始实施房地产估价师执业资格制度。

(1) 三点定位采用三角形算法计算出待测点的位置,依赖于AP位置信息和信号传输信道损失。不同环境下的信号传输损耗不同,适用于WIFI环境稳定、干扰较少和单楼层的建筑空间。

(2)本体中突出的主要是概念和概念之间的关联关系,而知识图谱描述的主要是实体,对这些实体我们通常还会去描述它更加丰富的信息。

(3)用一句简单的话来说就是:本体描述了知识图谱的数据模式,本体的动态的特性赋予了知识图谱动态数据模式支持的能力。

这一特性很重要,会用在我们很多的地方,比如说我们在Linked Open Data里面就用到了这种理念,同时我们提到了在后面企业大数据的应用里面,其实也会用到这个特性,它可以支持数据动态变迁的能力。

1.2 知识图谱应用

1.2.1 智能搜索

基于知识图谱的智能搜索是一种基于长尾的搜索,搜索引擎以知识卡片的形式将搜索结果展现出来。用户的查询请求将经过查询式语义理解与知识检索两个阶段。

查询式语义理解。知识图谱对查询式的语义分析主要包括:

(1)对查询请求文本进行分词、词性标注以及纠错;

(2)描述归一化,使其与知识库中的相关知识进行匹配;

(3)语境分析,在不同的语境下,用户查询式中的对象会有所差别,因此,知识图谱需要结合用户当时的情感,将用户此时需要的答案及时反馈给用户;

(4)查询扩展,明确了用户的查询意图以及相关概念后,需要加入当前语境下的相关概念进行扩展。

知识检索。经过查询式语义分析后,标准查询语境进行知识库检索引擎,引擎会在知识库中检索相应的实体以及与其在类别、关系、相关性等方面匹配度较高的实体。通过对知识库的深层挖掘与提炼后,引擎将给出具有重要性排序的完整知识体系。

智能搜索引擎主要以3种形式展现知识:

1.2.2 深度问答

综上,煤样与有机/酸复合溶液之间的化学作用可从微细观上改变煤样的矿物组成与结构,使其产生孔洞、孔隙等,增加其孔隙率,影响其渗透率,进而改变其峰值强度和弹性模量等宏观力学性质,因此,单轴压缩实验能够较好地验证煤样微观破坏机理。

问答系统是信息检索系统的一种高级形式,能够以准确简洁的自然语言为用户提供问题的解答。多数问答系统更倾向于将给定的问题分解为多个小的问题,然后逐一去知识库中抽取匹配的答案,并自动检测其在时间与空间上的吻合度等,最后将答案进行合并,以直观的方式展现给用户。

针对知识图谱在门户网站构建方面的优势,主要运用于数据库构建、数据检索、分析决策中。


2 知识图谱在网站建设中应用

2.1 数据库构建

知识图谱里面有两个基本元素,一个是实体,一个是概念。

我们可以以实体为主体目标,实现对不同来源的数据进行映射与合并,因为企业碰到的数据很大的一个应用场景就是数据在不同的系统里面,但是描述的是同一个事物,怎么去把他们合并起来?可以用实体的机制进行建模,然后通过实体合并相关的技术,把不同数据里描述同一个实体的数据进行融合;

融合后可以利用实体的属性来表示不同数据源中针对实体的描述,即A处过来的数据可以用一部分属性进行描述,B处来的也可以用一些属性进行描述,用属性进行统一描述之后,就会形成对实体全方位的描述,这里面用到属性的映射和归并,因为从不同数据源中来的,可能有些属性是重复的,甚至是冲突的,需要考虑怎么去合并;

其次就是利用知识图谱里面的关联关系去描述各种数据源之间数据的关系,知识图谱里面这种关系是非常灵活的,所以数据间的关系可以很容易的转换成为知识图谱来进行描述,从而支持关联分析,这里面主要用到的就是关系抽取的一个技术;

剩余的数据可能信息抽取也比较难解决,可以通过实体链接的技术,并不一定要把所有文本都转换成为结构化的数据,可以把它们进行链接,比如在做企业知识图谱的时候,可以把企业相关的新闻,不用把新闻的时间、地点、人物都抽取,这块难度较高,但是可以把新闻和实体做关联,即通过实体链接技术,实现围绕实体的多种类型数据的关联存储;

然后还有一个动态的数据,因为现实中间,数据都是在不断动态变化的,这主要通过事件的机制来进行描述,体现事件与实体间的关联,并利用时序的概念来描述事件的发展状况,把历史的事件和当前事件联系起来,有了动态变化之后,可以做时序的预测,这里涉及的技术主要是动态事件的提取相关技术。

2.2 数据提取

智能信息搜索是从知识理解和逻辑推理的角度,分析信息对象与检索请求的搜索方法。智能信息搜索与传统搜索引擎的最大差别在于搜索过程和结果的智能化,通过语义网、知识图谱等技术,能够充分表达信息对象的语义联系,有效地理解用户的信息检索需求和信息对象包含的内容,从而使得搜索引擎具备理解语义和有效推理的能力

2.3 分析决策

知识图谱,通过自然语言等形式的输入,即可迅速调用PB及以上量级数据之间的关系,系统自动推理辅助分析并得出结果。由于知识图谱和本体关系非常密切,所以里面最重要的就是基于本体的知识推理,即知识图谱核心知识内容部分的推理。然后因为知识图谱在大数据应用里面用的非常多,我们可以做知识图谱大数据预测分析与关联挖掘,也就是围绕知识图谱组织的大数据,怎么去做预测分析和关联挖掘。


3 综述

目前,米维信息认为知识图谱在知识库网站构建中主要应用于数据库建设、数据检索、分析决策等相关方面。从华夏文明传承创新角度开展知识库的构建研究,将为华夏文明传承创新区建设提供了有机的组成部分,为华夏文明传承创新区建设的任务和路径选择,提供了新思路。


关键字: 知识库网站建设,衡阳网站建设

提供衡阳微信小程序开发,微信营销功能开发、公众号开发等开发服务