nb88新博注册

如何将原始元数据附加到Internet上的每张照片,Meme和GIF

2015年1月8日,为庆祝David Bowie的68岁生日,英国插画家Helen Green在Tumblr上发布了音乐家的 。 一年多一点之后,鲍伊去世了,格林的动画肖像改变了他在互联网上的职业生涯。 在撰写本文时,反向图像搜索引擎TinEye为GIF产生了28页的结果。 该文件的许多版本已经缩小,有些版本已被拉伸,而其他版本则被裁剪以从右下角移除Green的签名。 在分享GIF时,粉丝必须搜寻艺术家以表彰她,如果她要获得报酬甚至承认,格林必须警惕地追踪将其用于商业目的的人。

在讨论在线准确归因的必要性时引用了Green。 联合创始人兼工程师Denis Nazarov说:“一个形象变得病毒式传播,数百万人看到它,但最大的不连接是关于你所看到的东西的信息丢失了。” Mediachain Labs于2014年12月由Nazarov和Jesse Walden推出,正在建立一个同名协议,将图像与相关信息联系起来。 TinEye或Google Images会告诉您可以找到图像的网页; Mediachain告诉你谁创造了这个图像,它的标题是什么,何时生成,以及更多。 由于它是一个开放的协议,Mediachain还允许开发其他应用程序,例如让艺术家通过网络跟踪他们的工作的服务。

“无论媒体分布在哪里,创作者都能突然与观众建立联系,”瓦尔登说。

原始详细信息(例如创建者,标题和生产年份)通常通过称为元数据的注释附加到图像。 问题是,随着图像在网络中传播,元数据经常会丢失。 例如,将Bowie的Green的GIF上传到Facebook将剥离其元数据文件。 为了保留该连接,图像及其元数据可以一起存储在数据库中。 通过使用类似TinEye的工具,可以在数据库中搜索它的图像或衍生物,这将检索相关的元数据。 因此,你可以知道格林创造了Bowie GIF,即使她的签名被裁掉了。

这听起来像是一个很好的解决方案,但它需要Mediachain Labs来创建和维护图像和元数据的集中数据库。 虽然这种方法适用于Shazam,它通过在其专有的音乐库中搜索歌曲来识别歌曲,但是建立这样的图像数据库将是费力的,昂贵的并且可能是徒劳的,因为在线的图片数量绝大。 虽然Shazam使用了1100万首歌曲,但每天仍有18亿张照片上传到互联网。

Mediachain协议通过分散的数据库来回避这一问题。 参与者不是将公司充当集线器,而是提供对自己的图像和元数据的访问。 因此,Mediachain可以提供有关其合作伙伴之一的现代艺术博物馆档案的信息,而所有这些信息仍然由MoMA控制。 该数据库也是开放的,这意味着任何人,从Green到MoMA的主管,都可以添加,提交GIF或提供历史照片的出处。 由于权力下放和开放性,该协议将看似不可能的收集信息转变为协作 - 因此可行的努力。 Mediachain Labs已经积累了200万张图像的元数据,用于在7月推出其首个测试网络。

虽然这是开始处理已经发布的非常长的积压图片的开始,但Mediachain也正在处理每天上传的新图像的大量涌现。 Nazarov和Walden希望开发人员能够利用他们的开放协议来创建一个工具,允许用户轻松地将他们的作品添加到数据库中。 纳扎罗夫指出,作者身份是一种强有力的激励因素。 “在一个完美的世界里,如果人类已经开始使用Mediachain,”他笑着说,“如果手机上有唯一的相机,你登录的地方,你拍的每张照片都是自动加盖时间戳的,那么就会有没有办法让某人在你之前主张某事。“

虽然之前的任务仍然庞大,但Mediachain Labs赢得了一些令人印象深刻的支持者。 今年6月,该公司宣布已从Union Square Ventures(Twitter的早期投资者,Foursquare和Kickstarter)以及为Skype,Facebook和Airbnb提供资金的风险投资公司Andreessen Horowitz筹集了150万美元。 除了现代艺术博物馆,Mediachain Labs还可以将Getty Images,Europeana和美国 (DPLA)列为其合作伙伴。

对互联网用户如何更多地了解数字图像的问题采用不同的方法是 。 IIIF,发音为“三重IF”,是一个致力于共享资源或“互操作”的博物馆,图书馆和大学联盟。许多此类机构以各种格式维护其数字档案,图像和元数据通过各种形式传递,并且通常不兼容,意思是。 这给研究人员或开发人员带来了困难,他们希望以统一的方式从多个来源中提取材料。 IIIF于2010年开始解决这个问题。

互操作挑战最直接的方法是让每个机构都采用标准的图像和元数据传输格式,但这种情况不会发生。 普林斯顿大学图书馆的IIIF编辑和应用程序开发经理Jon Stroop说:“没有人会替换他们的数字图像基础设施只是为了在一些中世纪手稿或其他任何东西上进行互操作。” (IIIF起初是中世纪手稿研究人员更好地获取材料的一种方式。)

IIIF不是要求每个机构重新设计其图像和元数据流动的渠道,而是要求一个额外的,统一格式化的流。 一些组织已经采用了IIIF,因此开发人员也可以根据其规范进行工作。 IIIF社区由60多个文化遗产机构组成。 除普林斯顿大学和盖蒂大学外,其中包括哈佛大学,维基百科和DPLA。 根据IIIF规范制作的应用程序的示例是 ,包括元数据显示的图库查看器,以及 ,其允许不可能详细地观看大图像。

作为Mediachain实验室和IIIF的合作伙伴,DPLA在衡量每个组织方法的优势和局限性方面处于独特的地位。 DPLA汇集了美国文化遗产机构的在线资源并使互联网用户可以访问,使Mediachain Labs能够访问其图像和元数据,并倡导在其“中心” - 图书馆,博物馆中采用IIIF和汇总其材料的档案。

DPLA的主要枢纽中有近20%拥有某种版本的IIIF。 “令我惊讶的是IIIF的发展速度有多快,”DPLA技术总监Mark Matienzo说。 他还暗示了一个可能的困难,他说:“我真的很有兴趣看到IIIF在文化遗产领域获得更大的吸引力。”IIIF的社区名册包括大学,图书馆和博物馆,但很少有商业实体。

Matienzo认为Mediachain Labs在采用方面面临着类似的挑战。 尽管该公司与DPLA合作产生结果还为时过早,但他仍然充满希望。 “Mediachain是最有希望的东西,”他说。 “但我也很想知道他们将采取什么样的合作伙伴关系。”他的担忧集中在分散的数据库上,他认为该数据库正在流血,足以避免广泛使用,提出了如何协议将与网络的其余部分集成。

Mediachain Labs有几个答案。 除了之前提到的两个应用程序(一个让艺术家通过网络跟踪他们的工作,另一个让他们的作品注册到分散的数据库),Nazarov描述了协议如何组合各种在线Creative Commons库,而Walden想象它与博客整合当然,平台可以让作者访问使用授权的图像 - 所有这些都具有自动归属功能。 他们对第三方开发人员的依赖可能似乎对愤世嫉俗的人们抱怨和妄想,但Mediachain实验室已经在其开源社区拥有200多名成员,跟随或协助该协议工作,该公司没有别的办法向前。 Nazarov和Walden在开发更完全构建的应用程序之前一直在努力实现这一点,首先,有必要建立一个开放协议作为基础。

“我们可能想把自己看作是创造性的天才,但是比我们提出这种伟大经验更重要的是为任何人建立一个平台,让他们想出一种他们认为有价值的体验,”瓦尔登说。 而且,他可能想补充一点,让他们为此获得荣誉。