累计积分:790

发布书摘:32

此书摘本创建于:2017-06-23

元数据

元数据是关于数据的数据,我们身边的一切信息和资源都可以用元数据来描述。元数据会从资源中抽取用来说明其特征和内容的结构化数据,用于组织、管理、保存、检索信息和资源。虽然我 …… [ 展开全部 ]
  • 作者:Jeffrey Pomerantz
  • 出版社:中信出版集团股份有限公司
  • 定价:CNY 49.00
  • ISBN:9787508670782
已发布177183条书摘
按时间排序 按页码排序
  • 2018-11-12 摘录
    本书大部分内容来自我分别在2013年秋季和2014年春季为北卡罗来纳州大学查佩尔山校区通过 Courser平台开设的M0OC“元数据:组织和探索信息”( Meta-data: Organizingd Discovering Information)。虽然在线教学不算新奇的想法,但是无论学术界内外的MOOC都极为关注这种教学方式。大规模在线公开课从2011年起开始见诸报端。尽管那时我已经从事在线教学多年,单凭一门MOOC就能面向如此之大的受众群体仍然吸引了我。我开始思考,如果信息科学专业的教学活动完全采用在线形式会是什么样子。无论是当时还是现在,我始终认为任何信息科学课程大纲中的第一门课程应该是元数据,因为信息科学领域的一切都以元数据为基础,而这个主题可以延伸到这个领域的大多数问题的讨论之中。
    mooc名称
    +1
    0条评价 收藏 分享
     

    这条书摘已被收藏 0

  • 2018-11-12 摘录
    叙词表是一种层级,其中实体之间的关系一般来说十分简单,往往是“IS A”关系:水上出租车是轮渡,轮渡是客轮。
    叙词表中的其他常见关系包括:“PART”关系(部分关系),例
    如芬奇镇是佛罗伦萨的一部分,佛罗伦萨是意大利托斯卡纳区
    的一部分;“ INSTANCE”关系(实例关系),例如约翰·泰勒是美国总统的实例;“ PART- WHOLE”关系(局部整体关系)例如肘部是胳膊的一部分。原则上来说,叙词表中的关系可以是任何类型。

    基于叙词表的本体论:本体同样是实体和实体之间关系的集合,同样以层级的形式组织,往往同样采用受控词汇表或其他编码体系来命名实体和关系。实际上,本体论与叙词表如此相似,以至这两个术语往往可以互换身份,但这样做并不对。

    本体与叙词表的差别在于,前者会包含一个规则集。家谱之所以是一个恰当的例子,是因为其具有直接易懂的层级结构。层级结构中的实体可能会有子实体,而家谱中会有名副其实的父子关系。在家谱中,实际上有两层父关系—父亲与母亲,以及两种子关系—女儿与儿子。认清这一点后,我们可以创建以下规则:如果A是女性,那么A就可以是B的母亲;或者反过来说,如果A是B的母亲,那么A就是女性。“女性”是种可以分配给实体的特点,而根据这一特点就能推理出接受分配的实体与其他实体之间的关系。反而言之,如果我们了解两个实体之间的关系,则能在多个实体之中对一个或多个实体的特点进行推理。推理位于叙词表层级结构的最上层,通过这种形式将有关世界的知识整合到其中。
    就像开发软件一样,关于世界的这种知识可以编码成行动规则。例如,系谱学应用中可能存在以下规则:如果B是女性,那么B与任何子实体之间的默认关系就是母亲,并且应该在B的名字旁标记“♀”符号。
    本体论与叙词表、家谱进行对比。 本体论包含了一个规则集,这一点与家谱很相似,家谱里就包含了两种规则和关系,一是父关系,包括父亲与母亲的关系,一是子关系包括女儿与儿子。所以家谱有一个明确的规则体系而叙词表只是一个词语的罗列,其中并没有层级关系。
    +1
    0条评价 收藏 分享
     

    这条书摘已被收藏 0

  • 2018-11-12 摘录
    本体论
    在哲学中,本体论研究的是现实的本质以及所存在事物的类型。而在信息科学中,本体论则是对在某一具体领域的宇宙中所有现存事物的形式表达。两种本体论研究路径之间的共同之处在于,两者都是为了阐明实体领域以及实体之间的关系…即使在小领域中也是如此。
    本体论也是为了阐明了实体领域范围以及实体之间的关系
    +1
    0条评价 收藏 分享
     

    这条书摘已被收藏 0

  • 2018-11-12 摘录
    +1
    0条评价 收藏 分享
     

    这条书摘已被收藏 0

  • 2018-11-12 摘录
    由一条边连接两个节点是网络最为基本的单位,上文中称这种三段式关系为“主谓宾三元组”。这样看来,一条元数据描述的主语和宾语都是节点,而谓语是边。
    在网络的这个例子中,我们能很快将《蒙娜丽莎》关联到宾夕法尼亚州的阿伦敦蒙娜丽莎时装公司(Mon
    malisa Fashions)所在地,而这两个实体之间往往没有什么关联。
    随着加入的实体和关系越来越多,网络会快速发展。实际上,随着聚集的实体和关系越来越多,这种扩张的趋势根本
    没有停止的可能,最终导致根本无法映射整个宇宙中所有事物之间的关系网络。在大多数情况下,这样的映射并不可行(见图2-4)。我们在第六章介绍关联数据时,将回到有关映射的讨论上。
    简而言之,网络中的节点可以是任何类型的实体,边则是实体之间任何类型的关系。当然,(计算机、社交、神经等)网络的本质支配着网络中存在的实体类型、主语创作者和关系类平n者虚到边可以是仟何类型的关系,我们必须先来探讨本体论的问题。
    网络是由节点和边构成的,最简单的是由一条边连接两个节点。 网络中的节点可以是任何类型的实体,而边则代表实体之间的关系。
    +1
    0条评价 收藏 分享
     

    这条书摘已被收藏 0