博客
关于我
Symbolic Aggregate approXimation(SAX,符号聚合近似)介绍-ChatGPT4o作答
阅读量:795 次
发布时间:2023-02-26

本文共 802 字,大约阅读时间需要 2 分钟。

Symbolic Aggregate Approximation(SAX)

SAX(符号聚合近似)是一种用于时间序列数据处理的方法,通过符号化和降维将复杂的时间序列转换为一组有限符号的序列,便于分析和检索。


SAX 的基本思想

SAX通过两步处理将时间序列转换为符号序列:

  • 分段均值表示(Piecewise Aggregate Approximation, PAA)

    首先将时间序列按一定规则分段,并对每个分段计算均值,减少数据的维度。

  • 符号化(Symbolization)

    将每个分段的均值映射为一组离散符号(如字母 a、b、c),以表示每个分段的区间位置。

  • 通过这两步,SAX能够压缩原始时间序列为符号序列,同时保留其全局趋势特性,使数据在符号空间中便于比较。


    SAX 的具体步骤

    假设输入一个时间序列 ( T = (t_1, t_2, \dots, t_n) ),长度为 ( n ),目标是将其转换为符号序列 ( S = (s_1, s_2, \dots, s_w) ),长度为 ( w )。

    步骤 1:标准化(Normalization)

    为了消除不同时间序列在幅度上的差异,首先对时间序列进行标准化,使其均值为 0,标量范围缩放到适当范围(如 [-1, 1] 或 [0, 1])。

    步骤 2:分段均值表示(PAA)

    将标准化后的时间序列按一定步长分段(如固定的窗口大小或动态调整窗口),对每个分段计算均值,得到一组均值值。

    步骤 3:符号化

    将每个均值值映射为离散符号,例如:

    • 如果均值值落在区间 [0, 0.33),映射为符号 'a';
    • 如果均值值落在 [0.33, 0.66),映射为符号 'b';
    • 如果均值值落在 [0.66, 1),映射为符号 'c'。

    最终得到一组符号序列 ( S )。


    SAX是一种高效的时间序列处理方法,能够将复杂的连续数据压缩为有限符号序列,便于后续分析和检索。

    转载地址:http://lgpfk.baihongyu.com/

    你可能感兴趣的文章
    Objective-C实现获取文件头的50个字符(附完整源码)
    查看>>
    Objective-C实现随机图生成器算法(附完整源码)
    查看>>
    OJ中常见的一种presentation error解决方法
    查看>>
    OK335xS UART device registe hacking
    查看>>
    ok6410内存初始化
    查看>>
    OKR为什么到今天才突然火了?
    查看>>
    ollama本地部署DeepSeek(Window图文说明)
    查看>>
    onCreate()方法中的参数Bundle savedInstanceState 的意义用法
    查看>>
    one_day_one--mkdir
    查看>>
    ONI文件生成与读取
    查看>>
    oobbs开发手记
    查看>>
    OPEN CASCADE Curve Continuity
    查看>>
    Open vSwitch实验常用命令
    查看>>
    Open WebUI 忘了登入密码怎么办?
    查看>>
    open-vm-tools-dkms : 依赖: open-vm-tools (>= 2:9.4.0-1280544-5ubuntu3) 但是它将不会被安装
    查看>>
    Openbox-桌面图标设置
    查看>>
    opencart出现no such file or dictionary
    查看>>
    opencv Mat push_back
    查看>>
    opencv waitKey() 函数理解及应用
    查看>>
    OpenCV 中的图像转换
    查看>>