你好,游客 登录
背景:
阅读新闻

微软研究院开源项目盘点

[日期:2017-01-09] 来源:码农网  作者: [字体: ]

  2016年9月GitHub报告显示,微软已在这一全球最大代码托管网站上拥有16419位开源贡献者,成为GitHub上排名第一的开源贡献者。对于这个全球最大的代码存放网站和开源社区而言,微软的贡献不仅使Github上又拥有了一大批帅气美丽聪慧乐于奉献的程序员(严肃脸),还使得开源界的力量更为壮大。对开发者个人而言,更多的开源项目也将帮助他们节省大量造轮子的时间,从而专注于性能表现与用户体验的优化。

总结|微软研究院开源项目盘点

  如何利用好微软提供的这些开源工具包资源呢?这篇合集介绍了微软研究院过去两年的几个重要开源项目,如深度学习领域的微软认知工具包(原名CNTK)等。大家只需点击每个项目后所附的链接就可以轻松访问。

  微软研究院近期开源工具包一览

  1. 微软认知工具包(Microsoft Cognitive Toolkit)

总结|微软研究院开源项目盘点

  微软认知工具包(原名CNTK) 是微软出品的开源深度学习工具包。新版的微软认知工具包在原有CNTK的基础上增加了对Python的支持,同时在性能方面也有所提高。而经实验室测试表明,微软认知工具包的性能在同等主流工具中表现突出。其设备要求相对灵活,同时支持CPU和GPU模式。因此没有GPU,或者神经网络比较小的实验,可以直接使用CPU版的微软认知工具包。微软认知工具包将神经网络描述成一个有向图的结构,叶子节点代表输入或者网络参数,其他节点计算步骤,它同时支持卷积神经网络和递归神经网络。

  其开源项目主页是:https://www.microsoft.com/en-us/research/product/cognitive-toolkit/

  Github主页地址为:https://github.com/microsoft/cntk。

  2. LightGBM

总结|微软研究院开源项目盘点

  由微软亚洲研究院DMTK(分布式机器学习工具包)团队在在GitHub上开源了性能超越其他boosting工具的LightGBM,在三天之内GitHub上被star了1000 次,fork了200 次。LightGBM(Light Gradient Boosting Machine)是一个实现GBDT算法的框架,支持高效率的并行训练,它的主要优势表现在训练方面的高效性、较低的内存占用、更高的准确率、进行并行学习与大规模数据处理的能力。公开数据表明LightGBM相较于同类工具,其学习效率和准确性都表现突出。此外,实验也表明LightGBM通过使用多台机器进行特定设定的训练能取得线性加速。

  LightBGM的开源项目地址参见:https://github.com/Microsoft/LightGBM

  3.Project Malmo

总结|微软研究院开源项目盘点

  微软研究院曾在不久前演示过用游戏《我的世界》来训练人工智能的实验性项目。现在这款项目Project Malmo通过GitHub正式开源。研究者可以通过《我的世界》测试人工智能算法,指导人工智能学习并完成一些复杂任务。这一计划可以通过游戏中的人完成现实生活中的计划任务。当微软研究员团队在利用这个工具训练人工智能的角色学习如何爬到虚拟世界的最高点时,这些角色使用的是与人类学习新任务时相同类型的资源。也就是说,这个由科学家研究的小人与普通的人类玩家并无区别,是真正的以人为基础进行的仿真。这样的仿真使研究者完全不需要开发人工智能实体,因此也不再要求研究者有机器人方面的开发背景,就可以进行一些原来只能靠机器人或通过极高成本才能进行的工作。

  项目主页可打开连接:https://github.com/Microsoft/malmo

  4. SDN

总结|微软研究院开源项目盘点

  分布式服务器中的多台服务器该如何连接?连接之后又该如何确保数据传送效率和实时支撑呢?SDN(Software Defined Network)由此应运而生,它颠覆了传统网络搭建的逻辑,采用虚拟化技术,根据应用数据的不同使用方式,动态调整和分配资源,优化数据的存贮和转移。据此,SDN技术可以为不同的用户群建立不同的虚拟网络,实现不同的资源配置,从而使得物理网络的能力被更加合理的利用。微软现已开发SDN工具帮助开发者快速部署起一套SDN平台。

  该项目源码与具体应用方式可打开连接:https://github.com/Microsoft/SDN

  5. Sora

总结|微软研究院开源项目盘点

  微软亚洲研究院开源的软件无线电项目Sora是一个完全可编程的高性能软件无线电系统,能够快捷而有效地实现当前最前沿的无线通信技术。软硬件平台的创新使Sora在PC上就可以完成高性能的无线信号处理。自2009年首次发表以来,Sora已在学术界获得多项最佳论文和演示大奖。目前已有50多家大学和科研机构在教学和科研中使用Sora。为满足研究者们日益迫切的研究需求,完全开源的Sora系统提供了大量特性,其中包括:支持定制的射频前端,RCB和通信模式。

  Github主页:https://github.com/Microsoft/Sora

  6. GraphView

总结|微软研究院开源项目盘点

  2015年12月16日,微软亚洲研究院系统算法组开发的图数据库GraphView通过GitHub平台开源。GraphView是一款中间件软件,方便用户使用关系数据库SQL Server 或Azure SQL Database高效地管理和处理大规模图数据。GraphView 在物理数据表达以及系统运行行为上和原生图数据库完全一致,填补了关系数据库和图数据库之间的鸿沟。它还继承了关系数据库领域数十年的科研成果,可以提供市面上原生图数据库难以媲美的性能。GraphView的功能包括:完备的查询语言,索引,事物处理和系统管理等等。

  GitHub主页为:https://github.com/Microsoft/GraphView

  项目更多介绍可访问:http://research.microsoft.com/en-us/projects/graphview/

  7. Graph Engine

总结|微软研究院开源项目盘点

  2015年5月20日,微软亚洲研究院Graph Engine 1.0预览版正式发布。Graph Engine是一个基于内存的分布式大规模图数据处理引擎,能够帮助用户更方便地构建实时查询应用和高吞吐量离线分析平台。Graph Engine在学术界有个更广为人之的名称,叫做Trinity。此外,Graph Engine 还可与强大的集成开发环境Visual Studio以及微软云计算平台Azure无缝集成。无论本地开发还是云端部署,Graph Engine都可以给开发者带来极佳的用户体验。

  Github主页源码:https://github.com/Microsoft/GraphEngine

 

  项目主页:https://ww

收藏 推荐 打印 | 录入:admin | 阅读:
相关新闻      
本文评论   查看全部评论 (0)
表情: 表情 姓名: 字数
点评:
       
评论声明
  • 尊重网上道德,遵守中华人民共和国的各项有关法律法规
  • 承担一切因您的行为而直接或间接导致的民事或刑事法律责任
  • 本站管理人员有权保留或删除其管辖留言中的任意内容
  • 本站有权在网站内转载或引用您的评论
  • 参与本评论即表明您已经阅读并接受上述条款