你好,游客 登录 注册 发布搜索
背景:
阅读新闻

谷歌开放图像数据集并行下载工具,5 天速度最高超过 200 M

[日期:2016-12-06] 来源:新智元  作者: [字体: ]

谷歌开放图像数据集并行下载工具可用于并行下载并缩放谷歌的开放图像数据集(Open Data Image)的 py2/py3 脚本。

如图可见,它在5天里最高达到200Mpbs以上的速率。

谷歌的开放图像数据集(Open Data Image)是一个含有约 900 万个图像URL的数据集,所有数据都经过标记,被分为超过6000个类别。访问地址:https://github.com/openimages/dataset

  1. 新发布的预训练 Inception v3模型 

  2. BigQuery 新 OpenImages 标记

  3. tzatter 非新预训Inception v3模型发布。

  4. BigQuery上的新OpenImages注释

所有标签均由 Google Inc.根据 CC BY 4.0 许可证书授予许可。这个库里的内容使用 Apache 2许可证发布。

设置

安装依赖项,运行:

按照 open image data repo 文件的指南得到图像 url 列表。

用法

两个要求参数是input 和output。input 是开放图像数据集的 url 的 csv 文件,output 是缩放后的图像的保存目录。

默认设置下,图像会以 256 的最小维度缩放(由 min-dim 参数控制)。为了提高效率,保存的图像会放在子目录中(数量由 sub-dirs参数控制)。已保存图像的名称对应 Google 数据集的ImageID,可用于在开放图像数据集中查找标签。

使用 --help 可以查看其他可选参数。

收藏 推荐 打印 | 录入:admin | 阅读:
相关新闻      
本文评论   查看全部评论 (0)
表情: 表情 姓名: 字数
点评:
       
评论声明
  • 尊重网上道德,遵守中华人民共和国的各项有关法律法规
  • 承担一切因您的行为而直接或间接导致的民事或刑事法律责任
  • 本站管理人员有权保留或删除其管辖留言中的任意内容
  • 本站有权在网站内转载或引用您的评论
  • 参与本评论即表明您已经阅读并接受上述条款