html中rdf属性是,数据开放式Web技术探索

发布关联数据的技术的研究

Laleci,G.B等作者对于内容管理系统中的语义网络进行了研究,文中提出了在现有的内容管理系统对知识库内容进行语义发现。Cardoso等学者研究了XML与OWL之间的映射问题,Hogan,Aidan则研究了通过语义搜索引擎检索开放数据以及数据实体匹配、精简等工作的扩展和分布式方法;Zimmermann则提出了一个呈现、查询开放数据的通用框架。以上学者的研究丰富了开放数据领域的各个细节。而对于现有Web内容进行关联数据发布,则鲜有提及。

在参考了大量文献,并就现有Web内容管理系统进行研究后,我们提出对现有Web内容进行关联数据的发布和聚合,主要有以下几个步骤:

1.建立RDF数据模型描述要发布的数据资源,并用URI来标识该资源;

2.建立现有网站内容类型中的属性到RDF词汇表的映射;

3.利用RDFa在HTML中嵌入RDF属性或标记,生成的页面可以由普通Web浏览器直接访问,页面文本也可以由专门的RDF分析工具进行翻译理解;

4.或者在Web上直接发布RDF文档,并支持HTTP的内容协商机制(ContentNegotiation),根据客户端请求的数据类型(text/html还是application/rdf+xml)来判断返回HTML还是RDF格式的内容;

5.建立SPARQL Endpoint端点。通过提供标准开放的访问接口,允许支持RDF的标准化检索语言SPARQL的系统检索RDF数据库,远程调用本地数据;

6.构建SPARQL查询语句,调用远程的RDF数据,供本地使用(显示、加工、统计等)。

关联数据技术仍然是新兴的技术,支持该技术的实现和工具比较少,但是关联数据的四原则决定了关联数据的实现不依赖具体的技术和工具,只和相关的Web标准(HTTP、URI)有关。因此,关联数据的生成、发布和消费可以不改变原有的内容发布系统的基础上,在原有系统之上架构一层支持关联数据的应用模块即可。上海图书馆的夏翠娟等作者的《关联数据发布技术及其实现–以Drupal为例》、华东师范大学娄秀明的硕士论文《用关联数据技术实现网络知识组织系统的研究》、沈志宏和张晓林的《关联数据及其应用现状综述》等都对关联数据的发布提出了自己的技术方案。在上海海事大学网站中,我们引入了文档属性与RDF映射的机制,在原有的内容管理系统基础上,建立了现有内容到RDF的映射,以及构架SPARQLEndpoint,实现了本地生产、发布关联数据,也可以通过SPARQL View模块来实现消费远程关联数据的功能,如图1所示。

140f7deb85e4b270efd2751f3895a9b2.png

在实践中,我们可以根据数据量的大小、数据的更新频率、数据的存储方式和数据的访问方式的不同,采用以下几种方式来发布关联数据:

1.直接发布纯静态的RDF数据文件,适用于数据更新频率较低的情况;

2.将RDF数据存储在RDF数据库(RDF Store)中(如3store、4store、ARC2等),并创建SPARQL Endpoint来发布数据。进一步,可以采用Pubby等软件作为关联数据服务的前端,适用于数据量较大的情况;

3.自建系统,根据原始数据在线动态生成RDF数据,适用于更新较频繁的情况;

4.D2R建立映射关系,将关系数据库存储的数据内容发布成关联数据。

来源:医药魔方

声明:本站部分文章及图片转载于互联网,内容版权归原作者所有,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!

上一篇 2021年5月2日
下一篇 2021年5月2日

相关推荐