DBSCAN算法详解

DBSCAN算法详解 DBSCAN是基于密度空间的聚类算法,在机器学习和数据挖掘领域有广泛的应用,其聚类原理通俗点讲是每个簇类的密度高于该簇类

实时预警

实时预警 针对互联网数据中涉及某些话题的数量进行实时预警。例如当在某段时间,例如20分钟内,某规则我 + (蟾蜍 | 蛤蟆 | 青蛙王子) 命中数据(可自行

louvain算法详解

louvain算法 在社交网络中,有的用户之间的连接较为紧密,有的用户之间的连接关系较为稀疏,在这样的的网络中,连接较为紧密的部分可以被看成一

Modularity详解

Modularity 模块度是一种常用的衡量节点分组质量的标准。模块度越高说明所检测到的社团越符合“内紧外松”的特征,分组质量越好。 定义 $Q=\displaystyle \frac{1}{2m}* \displaystyle \sum_{ij}{[A_{ij}-\displaystyle \frac{k_

LDA算法详解

LDA算法 潜在狄利克雷分布(Latent Dirichlet allocation)用于推测文档的主题分布,它可以将文档集中每篇文档的主题以概率分布的形式给出,

DT算法详解

决策树算法 决策树(Decision Tree)是在已知各种情况发生概率的基础上,通过构成决策树来求取净现值的期望值大于等于零的概率,评价项目风

文本表示(二)

文本表示(二) 文本表示的意思是把字词处理成向量或矩阵,以便计算机能进行处理。 文本表示按照细粒度可划分:字级别、词语级别、句子级别的文本表示。

文本表示(一)

文本表示(一) 文本表示的意思是把字词处理成向量或矩阵,以便计算机能进行处理。 文本表示按照细粒度可划分:字级别、词语级别、句子级别的文本表示。

卷积神经网络

CNN CNN(卷积【对两个实变函数的一种数学运算】神经网络)主要由两部分组成: 1、特征提取(卷积、激活函数、池化)【从概率分布的视角看(baye