LD4PE Competency Index

Version: 2017-06-28 14:34:35

代码 类型 定义
A 主题簇
B 主题
C 指标 知识、技能与思维习惯的主张(140个字符的Tweet长度)。
D 基准 达成相关能力的行动。

说明: 鼠标悬停在代码上可以看到URI. 点击代码可在网站 Achievement Standards Network 上访问其定义全文.

A: RDF(资源描述框架)基础

  • B: RDF中的标识
    • C: 知道在RDF中所有东西(thing)通过唯一资源识别符URIs进行命名,例如,代理、地点、事件、物件与概念等。
    • C: 理解解现实世界中的东西可能需要通过URI来命名,这与关于事物的信息的URI并不是一回事。
    • C: 辨认URIs的归属,通过互联网域名的所有者来判断。
    • C: 知道唯一资源识别符URIs包括唯一资源定位符URLs(用来定位网页),以及与位置无关的物理资源、概念资源与网络资源识别符。
  • B: RDF数据模型
    • C: 知道一个三元组(triple)由“主语-谓语-宾语”组成。
    • C: 理解文本串资源(literal)与非文本串(non-literal)资源之间的差异。
    • C: 理解URIs和文本串(literal)代表现实的、想象的、概念化的事物。
    • C: 理解“资源”通过rdf:type属性来声明为某类(class)的成员(实例)。
    • C: 理解文本串的数据类型与语种标签的使用。
    • C: 解空节点(blank nodes)及其使用方法。
    • C: 理解QNames为长URIs定义了简易前缀。
      • D: 在RDF规范和数据中为URIs使用前缀。
    • C: 明白RDF抽象模型与XML相关的数据模型之间的区别。
    • C: 理解RDF抽象数据模型是一个有向标记图。
    • C: 知道RDF抽象模型的图形化绘制惯例。
      • D: 能够使用绘图或建模软件与他人分享RDF模型。
    • C: 理解RDF中的命名空间(namespace),非正式地用于命名空间URI或RDF词汇。这与面向对象中类的数据属性与功能(方法)的命名空间存在本质区别。
    • C: 理解用于RDF词表或命名空间URI的命名空间是如何用于RDF语境中,在功能上与面向对象类的属性和功能的命名空间的差别。
  • B: 相关数据模型
    • C: 掌握语法验证用途(XML)和推理用途(RDF schema)在模式(schemas)上存在的本质区别。
    • C: 区分层级式文档模型(XML)与图模型(RDF)。
    • C: 理解RDF的类(事物命名集合)与面向对象编程的类的本质区别。面向对象编程的类定义了对象的类型,封装了“状态”(数据值的属性)与“行为”(对状态进行操作的函数)。
  • B: RDF 序列化
    • C: 理解RDF序列号格式是一个给定三元组集合(RDF图)的交换编码格式。
      • D: 使用工具在不同的RDF数据序列号格式之间互转。
    • C: 区分RDF抽象数据模型与具体的RDF数据的序列化格式。
      • D: 用 RDF/XML, N-Triples, Turtle, N3, Trig, JSON-LD, and RDFa对RDF数据序列化表达。

A: 关联数据基础

  • B: 万维网(Web)技术
    • C: 知道万维网(World Wide Web, 1989)的起源,其本身是基于互联网的非线性交互系统或多媒体系统。
    • C: 理解关联数据(Linked Data, 2006)将文档的网络扩展为细粒度数据的网络(关联数据云图)。
    • C: 知道超文本标记语言HTML(1991+)是作为网页内容与多媒体组件的标记化语言。
    • C: 知道HTML的最新版本HTML5(2014)扩展了对复杂网络与移动应用的支持。
    • C: 知道超文本传输协议HTTP(1991+)是用于解析万维网上的超链接与传输数据的基本技术。
    • C: 知道表征状态传输(Representational State Transfer, REST)(2000)是一种软件架构风格,通过浏览器与网络服务器交换数据,通常基于大家所熟悉的HTTP操作。
  • B: 关联数据原则
    • C: 知道Tim Berners-Lee提出的关联数据原则:使用URIs命名事物,使用HTTP URIs解析出有用的信息,与其他事物的URIs建立链接。
    • C: 知道开放数据5星标准:数据上网,优先使用结构化非专属数据格式,使用URIs对事物命名,链接其他数据。
  • B: 关联数据政策与最佳实践
    • C: 知道关联数据标准化相关的主要组织机构。
      • D: 参与标准制定和相关组织(如W3C)的最佳实践。
  • B: 非RDF关联数据

A: RDF词汇与应用纲要

  • B: 发现RDF词汇 * D: [MOVE] 知道如何通过数据门户与注册系统找到RDF词汇。 * D: 查找<关联开放词汇注册系统>LOV中注册的属性(properties)与类(classes),理解它们的版本与依赖关系。
  • B: 设计RDF词汇
    • C: 会用RDF Schema表达词汇表中的语义关系。
      • D: 正确使用子类关系,以支持推理。
      • D: 正确使用子属性关系,以支持推理。
    • C: 重用已发布的可用属性与类。
    • C: Coins namespace URIs, as needed, for any new properties and classes required.
      • D: 草拟类和属性的URI政策。
      • D: 选择基于#号(hash)或斜线(slash)的URI模式,视需求而定。
    • C: 知道网络本体语言OWL(2004)作为一套RDF词汇,扩展了属性与类,以支持表征型(expressive)数据建模与自动推理。
    • C: 知道“本体”一词是模糊的,与RDF词汇有关,但更多是在特定领域中支持推理的OWL类与属性集合。
    • C: 知道简单知识组织系统SKOS(2009),一套对自然语言中标记的概念进行表达的RDF词汇,将概念组织成非正式的层级,形成概念体系。
    • C: 知道SKOS的词汇扩展SKOS-XL(2009),增加了用于描述与关联词汇标签(Label类的实例)的属性集合。
    • C: 理解SKOS概念(concept)不是RDF类(class),而是RDF实例(instance)。因此,SKOS概念并不与实例集合(类的扩展)建立正式关联。
    • C: 理解SKOS能灵活表达概念的相关关系,不需要启用更严格的自动推理。基于类的OWL本体通常需要严格指定推理规则。
    • C: 理解OWL子类链与SKOS概念层级的区别。SKOS概念层级的设计初衷不是层级之间自动形成传递机制,因为这并不是人们思考与组织信息的方式。
    • C: 道RDF属性与类的命名惯例。
  • B: RDF词汇的维护
    • C: 理解持久性保障的策略选项。
      • D: 能起草持久性策略文件。
  • B: RDF词汇的版本控制
    • C: 知道版本的格式、内容与粒度的相关技术选项。
    • C: 理解如何在RDF词汇以定期版本号发布与持续增量发布之间做出权衡。
      • D: 能够撰写与评判一份版本策略文件。
  • B: RDF词汇的发布
    • C: 理解RDF词汇的常用发布格式及其相对优点。
    • C: 理解RDF词汇通过内容协商发布多种数据格式的目的。
    • C: 理解“解引用”(derefencable),即通过URI应该能检索到它所代表的资源的一种表征。
      • D: 确保 Web浏览器解引时,URI返回的资源表征形式是用户可读的HTML。
      • D: 确保RDF应用解引用时,URI返回的资源表征形式是被请求的RDF序列语法。
  • B: RDF词汇映射
    • C: 理解RDF词汇的层级包含属性(rdfs:subProperty子属性和rdfs:subClassOf子类)可用于表达词汇之间的映射关系。
    • C: 理解owl:equivalentProperty等价属性与owl:equivalentClasss等价类分别适用于属性与类的精确等价关系。
    • C: 认识owl:sameAs全等是常见的一种映射属性,带有强大的形式化语义,会引发意想不到的推论。
  • B: RDF应用纲要
    • C: 识别应用领域内真实世界的实体,作为RDF类的备选。
    • C: 识别领域实体间的资源属性与关系,作为RDF属性的备选。
    • C: 调查相同或相似应用领域的RDF建模方法。
      • D: 以文字与图表方式交流领域模型。
      • D: 参与元数据应用纲要的社会化过程。

A: RDF数据的生成与转换

  • B: 统一资源标识符的管理(URIs)
    • C: 理解持久性的含义,即URI必须是稳定的、具有记录含义的,能够永久指向特定资源。
    • C: 理解如何在“不透明”的URIs与那些使用版本号、服务器名、日期、应用程序特定文件扩展、查询字符串及其他过时的URIs之间做出权衡。
    • C: 认识到一个发布的命名空间的政策宣告意味着对重要URIs的持久性与语义稳定性作出机构承诺。
  • B: RDF数据的生成
    • C: 从非RDF数据源中生成RDF数据。
    • C: 知道从表格数据(如CSV,逗号分隔值)生成RDF数据的方法。
    • C: 知道关系型数据直接映射为RDF的方法(2012),从关系模型(键、值、行、列与表)数据转换为RDF图数据。
  • B: RDF数据的版本管理
  • B: RDF数据溯源
  • B: RDF数据的清洗与融合
    • C: 数据集的清洗,包括纠错、去重以及移除不需要的数据。
  • B: RDF数据的映射与丰富
    • C: 将可用资源用于命名实体识别、抽取与融合。

A: 与RDF数据的交互

  • B: 发现RDF数据
    • C: 知道如何查找已有的相关关联数据集资源。
    • C: 在“开放网络”中检索与访问RDF数据。
    • C: 监控与更新 SPARQL Endpoint的状态列表。
    • C: 使用可用的数据集描述词汇,以促进数据集的发现。
    • C: 注册数据集及相关服务,以促进数据集的发现。
  • B: 使用编程语言处理RDF数据。
    • C: 理解RDF数据模型的各个组件(数据集、图、陈述及各种节点类型)如何使用特定编程语言的RDF 库进行表达。例如,构造为面向对象的类。
      • D: 使用RDF编程库支持的语法对RDF数据进行序列化。
      • D: 使用RDF编程方法迭代RDF数据组件。
      • D: 使用RDF编程库的特定方法表征常见的RDF词汇,例如RDF、DC与SKOS。
    • C: 以编程方式在前缀中加入相关的命名空间,主要用于RDF序列生成和解析SPARQL查询两种情况。
      • D: 使用RDF编程库,从CSV文件、数据库或网页中提取RDF数据。
      • D: 使用RDF编程库,在内存、硬盘持久地存储三元组,或与RDF存储库(Triplestore)交互。
      • D: 以编程方式通过自定义的函数或方法对三元组进行推理。
    • C: 理解SPARQL查询匹配的模式能够使用RDF编程库中功能等价的构造方法表达。
      • D: 使用RDF编程方法查询RDF数据,存储查询结果用于后续处理。
      • D: 使用工具与便利的功能为经常使用的模式设置快捷方式。例如,匹配真实数据中的多个标签属性。
      • D: 使用RDF编程库处理各种类型的SPARQL查询结果。
  • B: RDF数据的查询
    • C: Understands that a SPARQL query matches an RDF graph against a pattern of triples with fixed and variable values.
    • C: 理解SPARQL查询的基本语法。
      • D: 使用尖括号来界定URIs。
      • D: 使用问号表示变量。
      • D: 对基地址(base URIs)使用前缀(PREFIX)。
    • C: 演示SPARQL结果集的格式与用法的操作命令(SELECT、CONSTRUCT、DESCRIBE与ASK)。
      • D: 使用SELECT子句识别查询结果表中出现的变量。
      • D: 使用WHERE子句提供的图模式匹配相应的图数据。
      • D: 在SELECT与WHERE子句中通过变量获得一张查询结果表。
      • D: 使用ASK对查询模式的匹配进行真/假测试。
      • D: 使用DESCRIBE提取单个图,其包含相应资源的RDF数据。
      • D: 根据指定的图模板,使用CONSTRUCT抽取结果并将其转换为单个RDF图。
      • D: 使用FROM构造URLs查询与本地文件查询。
    • C: 理解如何使用操作符(如UNION、OPTIONAL、FILTER与MINUS)对图模式进行组合与过滤。
      • D: 使用UNION构造多种可能的图模式查询。
      • D: 使用OPTIONAL构造查询,返回可用的可选变量的值。
      • D: 使用FILTER构造查询,用于结果集过滤。
      • D: 使用NOT EXISTS判断数据中是否存在特定的图模式。
      • D: 使用MINUS删除两个模式评估之后的结果匹配。
      • D: 使用NOT IN限定一个变量不出现在既定的值集合。
    • C: 理解SPARQL结果集的主要修饰符,例如,对结果限制数量或排序,或返回不重复的结果。
      • D: 使用ORDER BY根据变量、函数调用或表达式来定义排序条件。
      • D: 使用DISTINCT确保查询结果的取值是唯一的。
      • D: 使用OFFSET控制从整体查询结果的哪条记录(基准点)开始处理。
      • D: 使用LIMIT限制查询结果的返回个数。
      • D: 使用投影将结果序列变换为只保留其中一些变量的新结果序列。
    • C: 理解SPARQL函数与操作符的用法。
      • D: 使用正则表达式(regex())匹配字符串。
      • D: 使用聚集函数对结果进行分组、投影以及过滤等。
      • D: 使用lang()函数返回RDF文本串的语种标签。
      • D: 使用langMatches()函数匹配语言范围的语种标签。
      • D: 使用xsd:decimal(expn)函数将表达式转换为数值。
      • D: 使用GROUP BY子句对结果集进行转换,每个分组变量集只显示一行。
      • D: 使用HAVING子句在分组之后对结果集进行过滤。
    • C: 区分默认图与命名图,使用GRAPH子句构造查询。
      • D: 在本地数据上使用FROM NAMED与GRAPH构造高级查询。
      • D: 在远程数据上使用FROM NAMED构造高级查询。
      • D: 在包含空白节点的数据上构造高级查询。
      • D: 使用子查询构造高级查询。
    • C: 使用临时变量扩展查询。
    • C: 理解属性路径的作用,以及如何通过类似正则表达式的操作符谓词组合而成。
    • C: 理解联邦检索的概念。
      • D: 使用SERVICE指令在远程SPARQL Endpoint上构造高级查询。
      • D: 使用联合查询对本地图数据库或多个SPARQL Endpoint进行查询。
      • D: 使用SERVICE指令从不同的SPARQL Endpoint上获取数据。
    • C: 根据第三方工具与APIs的具体格式需要,转换/操作SPARQL查询结果输出(RDF-XML、JSON)。
    • C: 阅读与理解数据集的类与属性的高级描述,以便于编写查询。
    • C: 使用可用的工具、服务器与Endpoint,对数据集进行查询。
      • D: 使用Jena ARQ命令行工具执行SPARQL查询。
      • D:使用ARQ查询多个本地数据文件。
      • D: 使用ARQ评估本地数据上的查询。
      • D: 使用Fuseki服务器评估数据集上的查询。
      • D: 使用Fuseki查询多个数据文件。
      • D: 访问DBpedia的SNORQL/SPARQL Endpoint,提交简单的查询。
  • B: RDF数据的可视化
    • C: 使用公开可用的工具可视化数据。
      • D: 使用Google的Fusion Tables生成地图与图表。
    • C: 从大型数据集中提取数据,以用户友好的方式可视化。
    • C: 根据第三方工具与APIs的具体格式需要,转换/操作SPARQL查询结果输出(RDF-XML、JSON)。
  • B: 基于RDF数据进行推理
    • C: 解推理的原理与实践。
    • C: 使用常见的蕴涵机制并理解它们的用法。
    • C: 理解推理中形式化声明的定义域与值域的作用。
    • C: 理解如何在集成的多元化数据集上进行推理。
    • C: 知道网络本体语言(Web Ontology Language, OWL)在表达能力、推理方面以及涉及数据库与业务规则的应用中具有较好的适用性。
    • C: 理解OWL Full支持所有可用的构造,若不考虑推理性能问题的话,则OWL Full是最佳选择。
  • B: 评估 RDF数据质量
  • B: RDF数据分析
    • C: 会用可获取的本体浏览工具,探索特定数据集中的本体。
  • B: RDF数据处理
    • C: 知道SPARQL 1.1更新语言,对图数据库中的RDF图进行更改、创建与删除。
      • D: 使用INSERT/DELETE更改三元组。
      • D: 执行INSERT/DELETE操作之前,使用CONSTRUCT查询提前预览变化。
    • C: 知道SPARQL 1.1 图数据库以RESTful风格,通过HTTP协议更新网络服务器上的图。
      • D: 使用GET从默认图或命名图中检索三元组。
      • D: 使用PUT向新图或替代已有图插入一个新的三元组集合。
      • D: 使用DELETE删除RDF图。
      • D: 使用POST向已有图添加三元组。
      • D: 针对具体媒介类型使用恰当的语法,例如,Turtle。
    • C: 理解SQL查询语言(操作的是数据库表)与SPARQL查询语言(操作的是RDF图)之间的差异。

A: 关联数据应用的开发

  • B: RDF数据的存储