DBSCAN Clustering

集群检测。

模块类型: DBSCANClusterer

库中的路径:

/Radar/DBSCAN Clustering

说明

DBSCAN 聚类器*程序块使用基于空间点密度的算法（DBSCAN）对信号数据进行聚类，以对抗噪声。DBSCAN 聚类器*程序块可以对任何类型的数据进行聚类。该程序块还可以定义聚类阈值（ε），并消除二维数据的模糊性。

端口

输入

X - 输入数据
P` 上的实矩阵 N

输入数据为 P 上的实数矩阵 N，其中 N 是要聚类的数据点数。P 是特征维数。

DBSCAN 算法可以对任何类型的数据进行聚类，只需适当设置 聚类中的最小点数 和 聚类阈值ε。

数据类型: Float16, Float32, Float64, Int8, Int16, Int32, Int64, UInt8, UInt16, UInt32, UInt64

更新 - 启用自动ε更新
假（默认）` | `true

启用自动更新ε估计，设置为 false 或 true。

true - 首先以 k-NN 搜索曲线所有曲率的平均值来估计ε阈值。然后，将估计值添加到由*群集阈值epsilon 历史长度*参数指定的大小为 L 的缓冲区中。最终的ε值计算为长度为 L 的ε历史缓冲区的平均值。如果*集群阈值epsilon历史长度*参数设置为1，则估算是无内存的。无记忆意味着每次epsilon估计值都会立即使用，移动平均值不会被平滑。
false "表示使用前一个ε估计值。ε估计的计算量很大，不建议用于大型数据集。

依赖关系

要使用此端口，请将 群集阈值ε参数的来源 设置为 "自动"，并设置 "自动 "ε的最大点数。

数据类型: bool

AmbLims - 模糊界限
1乘2的实数向量字符串 | 2乘2的实数矩阵

以 1 乘 2 的实数矢量字符串或 2 乘 2 的实数矩阵形式给出的模糊边界。

对于一个自由度，以 1×2 向量"[MinAmbiguityLimitDimension1,MaxAmbiguityLimitDimension1]"指定界限。对于两个自由度，将限制指定为 2-by-2 矩阵`[MinAmbiguityLimitDimension1, MaxAmbiguityLimitDimension1; MinAmbiguityLimitDimension2, MaxAmbiguityLimitDimension2]`。

聚类可以跨边界进行，以确保模糊检测在两个维度上适当聚类。X 端口输入数据的相关列使用 模糊维度索引 * 参数定义。*AmbLims 参数以 X 输入数据的 *模糊维度指数 * 列中使用的相同单位定义最小和最大模糊界限。

依赖关系

要使用此端口，请选择 启用标注消歧 复选框。

数据类型: Float16, Float32, Float64, Int8, Int16, Int32, Int64, UInt8, UInt16, UInt32, UInt64

输出

Idx--群集索引
数字向量列 N 乘 1

以 N 乘 1 的整数向量列形式返回的聚类索引。聚类标识符代表 DBSCAN 算法的聚类结果。等于"-1 "的值表示 DBSCAN 噪音点。正值 Idx 对应于符合 DBSCAN 聚类标准的聚类。

依赖关系

要使用这个端口，请将 Define outputs for block 参数设置为 "Index "或 "Index and ID"。

数据类型: Float16, Float32, Float64, Int8, Int16, Int32, Int64, UInt8, UInt16, UInt32, UInt64

集群是可选的集群标识符
整数向量字符串 1 by N`

以 1 乘 N 正整数的整数向量形式返回的备选集群标识符。每个值代表一个指向假定目标簇的唯一标识符。该参数包含所有点的唯一正集群标识符，包括噪声。与此参数不同，输出参数 Idx 会用数值 -1 标记噪声点。

依赖关系

要使用此端口，请将 Define outputs for block 参数设置为 Cluster ID 或 Index and ID。

数据类型: Float16, Float32, Float64, Int8, Int16, Int32, Int64, UInt8, UInt16, UInt32, UInt64

参数

定义 AnyMath 块的输出 - 群集数据输出类型
索引和ID（默认） |集群ID |索引

群集数据输出类型，指定为

Index 和 ID - 包括 Idx 和 Clusters 输出端口。
集群 ID` - 仅包括 * 集群* 输出端口。
Index - 只包括 Idx 输出端口。

群集阈值 epsilon 的来源 - epsilon 的来源
属性（默认） | `自动

群集阈值的ε来源：

Property - ε的来源是* 群集阈值ε*参数。
自动"--使用 k 近邻（k-NN）搜索自动计算ε。搜索计算的 k 值范围从参数值 聚类中最小点数 * 减一到参数值 *"自动 "epsilon 的最大点数 减一。减一是必要的，因为点的邻域包括点本身。

聚类阈值 epsilon - 聚类邻域大小
10.0（默认值） | 正标量 | P 上的正实数向量字符串 1

搜索查询的聚类邻域大小，以 P 上字符串 1 的正标量或实向量表示。P 是输入数据 X 的聚类维数。

Epsilon 定义了计算检测次数的点周围半径。如果 Epsilon 是一个标量，那么所有聚类特征测量都会使用相同的值。通过在 P 上指定 1 的实数矢量字符串，可以为不同的聚类测量指定不同的epsilon 值。使用矢量字符串可以创建多维椭圆搜索区域，这在数据列具有不同物理值（如范围和多普勒）时非常有用。

集群的最小点数 - 集群所需的最小点数
3（默认）"｜"正整数

聚类所需的最小点数指定为正整数。在确定一个点是否为参考点时，该参数定义了簇中的最小点数。

自动 "epsilon*的最大点数*--聚类所需的最大点数
10（默认值）"｜"正整数"。

群集中的最大点数，指定为正整数。当对象执行 k-NN 搜索时，该属性用于估算ε。

依赖关系

要使用该参数，请将 "群集阈值ε的来源 "参数设置为 "自动"。

群集阈值 epsilon 历史长度 - 群集阈值 (epsilon) 历史长度
10（默认值） | `正整数

存储的群集阈值（epsilon）历史长度，指定为正整数。如果设置为 1，则历史记录不需要内存。然后，每个epsilon 分数都会立即使用，不会进行移动平均平滑处理。如果值大于 1，epsilon 值将在指定的历史长度内平均。

例如5

启用尺寸消歧 - 启用无歧义测量
已禁用（默认） | 已启用

启用尺寸消歧的复选框。

如果选中，将在运行时根据输入端口 AmbLims 值定义的边界进行聚类。模棱两可的检测会相应地进行聚类。

使用 模糊维度索引 参数指定可能出现模糊的 X 列索引。最多允许两个模糊维度。不建议对大型数据集启用不匹配功能。

模糊维数的索引，指定为正整数或正整数 1 乘 2 的向量。

该属性指定可能出现不匹配的 X 输入端口数据列的索引。一个正整数对应输入数据矩阵 X 中的一个模糊维数。一个 1×2 的字符串向量对应两个不明确的测量值。模糊维度索引 的大小和顺序必须与 *AmbLims 输入端口的值相匹配。

*例如`[3 4]`

依赖关系

要使用此参数，请选择 启用尺寸消歧 复选框。

DBSCAN Clustering

说明

端口

输入

输出

参数

实例