DBSCAN Clustering
集群检测。
类型: DBSCANClusterer
图书馆中的路径:
|
说明
DBSCAN 聚类器*程序块使用基于空间点密度的算法(DBSCAN)对信号数据进行聚类,以对抗噪声。DBSCAN 聚类器*程序块可以对任何类型的数据进行聚类。该程序块还可以定义聚类阈值(ε),并消除二维数据的模糊性。
端口
输入
X - 输入数据
P` 上的实矩阵 N
输入数据为 P 上的实数矩阵 N,其中 N 是要聚类的数据点数。P 是特征维数。
DBSCAN 算法可以对任何类型的数据进行聚类,只需适当设置*聚类中的最小点数*和*聚类阈值ε*。
数据类型: Float16
, Float32
, Float64
, Int8
, Int16
, Int32
, Int64
, UInt8
, UInt16
, UInt32
, UInt64
更新 - 启用自动ε更新
假(默认)` | `true
启用自动更新ε估计,设置为 false
或 true
。
-
true
- 首先以 k-NN 搜索曲线所有曲率的平均值来估计ε阈值。然后,将估计值添加到由*群集阈值epsilon 历史长度*参数指定的大小为 L 的缓冲区中。最终的ε值计算为长度为 L 的ε历史缓冲区的平均值。如果*集群阈值epsilon历史长度*参数设置为1,则估算是无内存的。无记忆意味着每次epsilon估计值都会立即使用,移动平均值不会被平滑。 -
false "表示使用前一个ε估计值。ε估计的计算量很大,不建议用于大型数据集。
依赖关系
要使用此端口,请将*群集阈值ε参数的来源*设置为 "自动",并设置*"自动 "ε的最大点数*。
数据类型: bool
AmbLims - 模糊界限
1乘2的实数向量字符串 | 2乘2的实数矩阵
以 1 乘 2 的实数矢量字符串或 2 乘 2 的实数矩阵形式给出的模糊边界。
对于一个自由度,以 1×2 向量"[MinAmbiguityLimitDimension1,MaxAmbiguityLimitDimension1]"指定界限。对于两个自由度,将限制指定为 2-by-2 矩阵`[MinAmbiguityLimitDimension1, MaxAmbiguityLimitDimension1; MinAmbiguityLimitDimension2, MaxAmbiguityLimitDimension2]`。
聚类可以跨边界进行,以确保模糊检测在两个维度上适当聚类。X 端口输入数据的相关列使用 模糊维度索引 * 参数定义。*AmbLims 参数以 X 输入数据的 *模糊维度指数 * 列中使用的相同单位定义最小和最大模糊界限。
依赖关系
要使用此端口,请选择*启用标注消歧*复选框。
数据类型: Float16
, Float32
, Float64
, Int8
, Int16
, Int32
, Int64
, UInt8
, UInt16
, UInt32
, UInt64
输出
Idx--群集索引
数字向量列 N 乘 1
以 N 乘 1 的整数向量列形式返回的聚类索引。 聚类标识符代表 DBSCAN 算法的聚类结果。等于"-1 "的值表示 DBSCAN 噪音点。正值 Idx 对应于符合 DBSCAN 聚类标准的聚类。
依赖关系
要使用这个端口,请将 Define outputs for block 参数设置为 "Index "或 "Index and ID"。
数据类型: Float16
, Float32
, Float64
, Int8
, Int16
, Int32
, Int64
, UInt8
, UInt16
, UInt32
, UInt64
*集群*是可选的集群标识符
整数向量字符串 1 by N`
以 1 乘 N 正整数的整数向量形式返回的备选集群标识符。每个值代表一个指向假定目标簇的唯一标识符。该参数包含所有点的唯一正集群标识符,包括噪声。与此参数不同,输出参数 Idx 会用数值 -1
标记噪声点。
依赖关系
要使用此端口,请将 Define outputs for block 参数设置为 Cluster ID
或 Index and ID
。
数据类型: Float16
, Float32
, Float64
, Int8
, Int16
, Int32
, Int64
, UInt8
, UInt16
, UInt32
, UInt64
参数
定义 Engee 块的输出 - 群集数据输出类型
索引和ID(默认) |集群ID |索引
群集数据输出类型,指定为
-
Index 和 ID
- 包括 Idx 和 Clusters 输出端口。 -
集群 ID` - 仅包括 集群 输出端口。
-
Index
- 只包括 Idx 输出端口。
群集阈值 epsilon 的来源 - epsilon 的来源
属性(默认) | `自动
群集阈值的ε来源:
-
Property
- ε的来源是*群集阈值ε*参数。 -
自动"--使用 k 近邻(k-NN)搜索自动计算ε。搜索计算的 k 值范围从参数值 聚类中最小点数 减一到参数值 "自动 "epsilon 的最大点数 减一。减一是必要的,因为点的邻域包括点本身。
聚类阈值 epsilon - 聚类邻域大小
10.0(默认值) | 正标量 | P 上的正实数向量字符串 1
搜索查询的聚类邻域大小,以 P 上字符串 1 的正标量或实向量表示。P 是输入数据 X 的聚类维数。
Epsilon 定义了计算检测次数的点周围半径。如果 Epsilon 是一个标量,那么所有聚类特征测量都会使用相同的值。通过在 P 上指定 1 的实数矢量字符串,可以为不同的聚类测量指定不同的epsilon 值。使用矢量字符串可以创建多维椭圆搜索区域,这在数据列具有不同物理值(如范围和多普勒)时非常有用。
集群的最小点数 - 集群所需的最小点数
3(默认)"|"正整数
聚类所需的最小点数指定为正整数。在确定一个点是否为参考点时,该参数定义了簇中的最小点数。
自动 "epsilon*的最大点数*--聚类所需的最大点数
10(默认值)"|"正整数"。
群集中的最大点数,指定为正整数。当对象执行 k-NN 搜索时,该属性用于估算ε。
依赖关系
要使用该参数,请将 "群集阈值ε的来源 "参数设置为 "自动"。
群集阈值 epsilon 历史长度 - 群集阈值 (epsilon) 历史长度
10(默认值) | `正整数
存储的群集阈值(epsilon)历史长度,指定为正整数。如果设置为 1
,则历史记录不需要内存。然后,每个epsilon 分数都会立即使用,不会进行移动平均平滑处理。如果值大于 1,epsilon 值将在指定的历史长度内平均。
例如5
启用尺寸消歧 - 启用无歧义测量
已禁用(默认) | 已启用
启用尺寸消歧的复选框。
如果选中,将在运行时根据输入端口 AmbLims 值定义的边界进行聚类。模棱两可的检测会相应地进行聚类。
使用*模糊维度索引*参数指定可能出现模糊的*X*列索引。最多允许两个模糊维度。不建议对大型数据集启用不匹配功能。
Indices of ambiguous dimensions - 含混维度的索引
1(默认)` | | |正整数
| |`1乘2的正整数向量
模糊维数的索引,指定为正整数或正整数 1 乘 2 的向量。
该属性指定可能出现不匹配的 X 输入端口数据列的索引。一个正整数对应输入数据矩阵 X 中的一个模糊维数。一个 1×2 的字符串向量对应两个不明确的测量值。模糊维度索引*的大小和顺序必须与 AmbLims 输入端口的值相匹配。
*例如`[3 4]`
依赖关系
要使用此参数,请选择 启用尺寸消歧 复选框。