基于RFID与基因表达式编程的经济统计时序挖掘

摘要:为解决基因表达式编程(GEP)在符号回归、RFID分类及经济领域中对时序数据的挖掘速度和精度还不够的问题,提出了统计基因、统计染色体和统计时序一适应度的定义,并针对传统GEP经济时序模型进行了综合改进;提出了新颖的单变量时序和多变量时序挖掘算法,提高了GEP统计时序挖掘的速度和精度;实验表明,与传统GEP、单变量GEP时序算法相比,多变量GEP时序算法挖掘速度快,其预测精度比单变量时序算法高出5%以上。该算法同样适用于RFID以及其他经济系统中的时序数据挖掘。

基于RFID与基因表达式编程的经济统计时序挖掘

关键词:经济统计时序预测模型;单变量时序;多变量时序;GEP函数挖掘

GEP经济统计时序挖掘算法涉及到时序基因、时序染色体和适应度函数等概念,作者提出的GEP时序挖掘模型是针对历年的经济统计时序数据,例如对成都市国民经济和社会发展总量与速度等经济指标时间序列进行预测。针对经济统计时序数据特点,在传统GEP概念的基础上¨。J,提出了—C,ene、和Statistical—Fitness等新概念和技术。

1、问题描述

为了形式化描述GEP时间序列的统计指标序列数据对象,引入下列定义:

定义l GEP时序中的统计基因是一个5元组。

定义2统计时序一适应度。

2、统计数据的时序GEP算法

目前GEP与遗传算法和遗传编程一样,还存在未成熟收敛和收敛精度差的难题m 8l。为解决其精度差问题,对GEP时间序列模型进行了综合改进。

1)GEP浮点数系数编码在GEP算法中,对于数值编码采用了浮点数编码的方法。经过实际应用,发现浮点数编码能提高了GEP运算效率,适合精度较高应用。