发布关联数据的技术的研究
在参考了大量文献,并就现有Web内容管理系统进行研究后,我们提出对现有Web内容进行关联数据的发布和聚合,主要有以下几个步骤:
1.建立RDF数据模型描述要发布的数据资源,并用URI来标识该资源;
2.建立现有 站内容类型中的属性到RDF词汇表的映射;
3.利用RDFa在HTML中嵌入RDF属性或标记,生成的页面可以由普通Web浏览器直接访问,页面文本也可以由专门的RDF分析工具进行翻译理解;
4.或者在Web上直接发布RDF文档,并支持HTTP的内容协商机制(ContentNegotiation),根据客户端请求的数据类型(text/html还是application/rdf+xml)来判断返回HTML还是RDF格式的内容;
5.建立SPARQL Endpoint端点。通过提供标准开放的访问接口,允许支持RDF的标准化检索语言SPARQL的系统检索RDF数据库,远程调用本地数据;
6.构建SPARQL查询语句,调用远程的RDF数据,供本地使用(显示、加工、统计等)。

在实践中,我们可以根据数据量的大小、数据的更新频率、数据的存储方式和数据的访问方式的不同,采用以下几种方式来发布关联数据:
1.直接发布纯静态的RDF数据文件,适用于数据更新频率较低的情况;
2.将RDF数据存储在RDF数据库(RDF Store)中(如3store、4store、ARC2等),并创建SPARQL Endpoint来发布数据。进一步,可以采用Pubby等软件作为关联数据服务的前端,适用于数据量较大的情况;
3.自建系统,根据原始数据在线动态生成RDF数据,适用于更新较频繁的情况;
4.D2R建立映射关系,将关系数据库存储的数据内容发布成关联数据。
声明:本站部分文章及图片源自用户投稿,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!