你好,游客 登录
rss订阅 手机访问 
学习算法
一文理清区块链里那些容易混淆的概念

我们在研究区块链的过程中发现,区块链的发展和云计算有非常多的相似之处,因此便有了此文,带领大家从宏观的角度认识区块链和云计算。前两期我们介绍了区块链和云计算的底层三要素及类型(连载1| 连载2),这期再换个角度,我们从各自的形态上来看有什么特点。 云计算 IaaS(Infrastructure-as-a-Service,基础设施即服务)
第一层叫做IaaS,有时候...
日期:09月09日 作者:
干货:c与大数据开发实践

大数据是使用工具和技术处理大量和复杂数据集合的术语。能够处理大量数据的技术称为MapReduce。
何时使用MapReduce
MapReduce特别适合涉及大量数据的问题。它通过将工作分成更小的块,然后可以被多个系统处理。由于MapReduce将一个问题分片并行工作,与传统系统相比,解决方案会更快。
大概有如下场景会应用到MapReduce:
1...
日期:09月09日 作者:
4种提高多维数据分析的方法
作者: Buxing JIANG
联机分析处理(OLAP)需要有即时的响应,因此其性能是至关重要的。虽然其结构较为简单,但是在处理各种大的数据立方体(data cubes)时,会涉及到大量的计算。
常被称为OLAP(联机分析处理)的多维分析是一种交互式的数据分析过程,它包括:对于数据立方体(data cube)进行旋转(rotation)、切片与切块(slice and dice)、钻取(drill-down)等执行操作...
日期:09月07日 作者:
哔哩哔哩大数据采集服务—Lancer系统设计与实践
哔哩哔哩(以下简称B站)的日志采集肩负了B站的所有业务的日志收集并传输,提供离线数据和实时数据以满足离线或实时计算以及业务方订阅的需求。B站日志收集系统是基于Flume设计和搭建而成的。
日期:09月07日 作者:
Web 开发者需要知道的 12 个终端命令
终端是开发人员的军火库中最重要的生产力工具之一。把它掌握好了可以对你的工作产生非常积极的影响,比如许多的日常任务就可以简化到只需要编写简单的命令然后按一下 Enter 就可以了。
日期:09月06日 作者:
基于AWS使用深度学习的10个Linux命令
在AWS上执行大规模的深度学习处理是一个廉价而且有效的学习和开发方式。花少量的钱就可以使用数十GB的内存,数十个CPU,多个GPU,这是值得推荐的。
日期:09月06日 作者:
学界 | 神经优化器搜索:利用强化学习自动搜索最优化方法
本论文通过强化学习的方式采样不同的更新规则而得出更加优秀的优化方法,这些不同的优化规则通过采样的概率和其在子网络的性能而得出该规则的重要性。本文提出的这种优化方法可以移植到不同的神经网络架构中,并有十分优秀的性能。机器之心对该论文进行了简要地介绍。
日期:09月06日 作者:
为何Python攀上数据科学巅峰?KDnuggets2017调查Python超越R
根据 KDnuggets 2017 年最新调查,Python 生态系统已经超过了 R,成为了数据分析、数据科学与机器学习的第一大语言。本文对 KDnuggets 的此项调查结果做了介绍,并补充了一篇文章讲解为何 Python 能成为数据科学领域最受欢迎的语言。
日期:09月06日 作者:
资源 | GitHub万星:适用于初学者的TensorFlow代码资源集
这套资源可以通过示例让你轻松学习 TensorFlow。至于可读性,它可以作为包括笔记本和注释的源代码教程,适合想寻找清晰准确的 TensorFlow 示例的初学者。除了传统的「原始」TensorFlow 实现之外,你还可以找到最新的 TensorFlow API 实践(如层、估计器、数据集等)。
日期:09月02日 作者:
22个免费的数据可视化和分析工具推荐

当你分析和可视化数据前,常需要“清理”工作。比如一些输入性列表“New York City” ,同时其他人会说”New York, NY” 。因此你需要标准化这些工作,使看到统一的样式。下面的两个工具被用来帮助使数据处于最佳的状态。
日期:09月02日 作者:
10 行 Python 代码创建可视化地图
作者:renwofei423
import vincent
world_countries = r'world-countries.json'world = vincent.Map(width=1200, height=1000)
world.geo_data(projection='winkel3', scale=200, world=world_countries)
world.to_json(path)
当我开始建造Vincent时, 我的一个目的就是使得地图的建造尽可能合理化. 有一些很棒的python地图库-参见Basemap 和 Kartogra...
日期:08月31日 作者:
22个免费的数据可视化和分析工具推荐

本文总结推荐22个免费的数据可视化和分析工具。列表如下:
数据清理(Data cleaning)
当你分析和可视化数据前,常需要“清理”工作。比如一些输入性列表“New York City” ,同时其他人会说”New York, NY” 。因此你需要标准化这些工作,使看到统一的样式。下面的两个工具被用来帮助使数据处于最佳的状态。
日期:08月30日 作者:
Python超过R,成为数据科学和机器学习的最常用语言
近期,数据挖掘资讯网站KDnuggets开展了一项调查,问题是“2016年和2017年,在数据分析、数据科学和机器学习工作中,你使用R、Python、两者都用,还是其他工具?”
日期:08月30日 作者:
深度 | 从Boosting到Stacking,概览集成学习的方法与性能
集成学习(Ensemble learning)通过组合几种模型来提高机器学习的效果。与单一模型相比,该方法可以提供更好的预测结果。正因为如此,集成方法在许多著名的机器学习比赛(如 Netflix、KDD 2009 和 Kaggle 比赛)中能够取得很好的名次。
日期:08月29日 作者:
五大理由从 Python 转到 Go 语言
“ Python 是非常强大的,特别是 Python3 有了异步功能,但是 GO 将完全取代它在大企业中的存在…”如果你真正理解了引号中的话,你可能会去尝试 Go 编程语言。我认为 Go 是很简单的编程语言,并且适应任何的应用环境,甚至比 Javascript 编程还要简单,这可能是 GO 编程语言能在这几年很快流行起来的原因吧。 我们在使用 Go 语言编程之前有什么呢?
日期:08月29日 作者: