yarn

Posted by 夏泽民

什么是YARN Apache Hadoop YARN (Yet Another Resource Negotiator,另一种资源协调者)是一种新的 Hadoop 资源管理器,它是一个通用资源管理系统,可为上层应用提供统一的资源管理和调度。它将资源管理和处理组件分开,它的引入为集群在利用率、资源统一管理和数据共享等方面带来了巨大好处。



余弦夹角 和 欧氏距离 Jaccard相似系数和皮尔逊相关系数

Posted by 夏泽民

我们把两组样本近似线性数据的距离称为相关系数。相关系数是衡量相似度的主要指标之一。



MapReduce

Posted by 夏泽民

原 MapReduce 程序的流程及设计思路:



php_kafka

Posted by 夏泽民

https://github.com/edenhill/librdkafka https://github.com/arnaud-lb/php-rdkafka https://github.com/weiboad/kafka-php 一、安装以及使用shell命令终端操作kafka 环境配置 1、下载最新版本的kafka: kafka_2.11-1.0.0.tgz http://mirrors.shu.edu.cn/apache/kafka/1.0.0/kafka_2.11-1.0.0.tgz



KM算法

Posted by 夏泽民

二分图的概念 二分图又称作二部图,是图论中的一种特殊模型。 设G=(V, E)是一个无向图。如果顶点集V可分割为两个互不相交的子集X和Y,并且图中每条边连接的两个顶点一个在X中,另一个在Y中,则称图G为二分图。



Search

Popular posts

Anything in here will be replaced on browsers that support the canvas element

Recent posts

This blog is maintained by 夏泽民

Get in touch with me at 465474307@qq.com

Subscribe to our mailing list

* indicates required