code the life 拥抱AI 多用AI
文章   段子   关于   友链   站内搜索  

最新文章
Java 机器学习库
箱体理论及量化实战
python量化项目
springboot3 应用启动 报错 找不到 com.mybatisflex.core.service.IService
ETF 动量和反转策略
《股票多因子模型实战:Python 核心代码解析》 笔记
股票多因子模型实战
python @classmethod 和 @staticmethod 区别
均值回归策略实例
量化策略研发全流程

更多文章...     热门文章     文章分类

最新段子
波段操作布林线口诀
三线向上,买在中轨
三线向下,卖在中轨 ,买在下轨首阳
三线走平,下轨买,上轨卖
三线张口向上,赶紧买
三线张口向下,赶紧卖
三线收口,耐心等方向
不会被 URLEncoder 编码且适合作为自定义分隔符的字符;
String str = "a-b_c.d~e";
String encoded = URLEncoder.encode(str, "UTF-8");
System.out.println(encoded); 
输出:a-b_c.d~e(无编码)
量化因子挖掘
主成分分析(PCA)
对300个原始因子降维,提取解释力最强的10个主成分
案例:Fama-French五因子模型扩展
特征重要性排序:XGBoost/LightGBM分析因子对收益率的贡献度
深度学习:LSTM挖掘高频订单簿动态特征
聚类分析(K-means):发现另类因子组合(如“高ROE+低波动”簇)
自编码器(Autoencoder):压缩Tick数据生成隐含因子
新闻情感分值(基于BERT模型)
单因子测试
IC(信息系数)
Rank IC:因子值与下期收益的Spearman相关系数(>0.03显著)
ICIR(IC信息比率):IC均值/标准差(>0.5可持续)
分组回测
按因子值分组,观察Top组 vs Bottom组超额收益
Java 机器学习库 
Spark MLlib 
Deeplearning4j(DL4J) 
Smile(Statistical Machine Intelligence and Learning Engine)
大数据场景:优先选 Spark MLlib(分布式能力强,API 易上手);
深度学习 + 传统 ML:选 DL4J(一站式解决,无需跨语言);
中小型数据集、高性能要求:选 Smile(轻量、速度快);
这些库均能覆盖 sklearn 的核心功能,且完全适配 Java 生态,可根据项目规模、场景复杂度选择。
其他辅助库 Apache Commons Math,ND4J(数值计算库)
ND4J   N-Dimensional Arrays for Java ,
可以看作是 Java 生态中的 NumPy。
它是由 Skymind(后并入 Eclipse Foundation 的  Deeplearning4j 项目)
开发的高性能科学计算库,专为 JVM环境设计。
Spark Core和Spark SQL可以嵌入到Java应用中独立使用,无需Hadoop或Yarn集群。
通过本地模式(local[*]),可以在单个JVM进程中利用多核CPU进行并行计算,
非常适合量化因子挖掘这种计算密集型的任务
etf-factor-mining
data-acquisition    # 数据获取层
data-storage        # 数据存储层  
factor-computation  # 因子计算层
backtesting-engine  # 回测引擎
factor-evaluation   # 因子评估层
visualization       # 可视化层
Smile提供了从基础统计到高级机器学习的完整工具链,
特别适合在Java生态中进行金融数据分析。
集成Smile库,可以获得一个高性能、功能丰富的量化因子挖掘系统
Smile 库凭借原生 Java、轻量高效、算法全面的特性,
能无缝落地 ETF 量化因子挖掘的全流程。
从基础因子计算到有效性检验,再到多因子模型构建,
无需依赖 Python 生态,可直接集成到 Java 量化交易系统中
哑变量也叫虚拟变量,
是用0和1表示分类属性的人工变量,比如性别男=1女=0。
它能把无法量化的变量如职业、血型等引入回归模型,
通常用k-1个哑变量表示k个类别,避免共线性,同时保持模型简洁。
更多段子...
访问量 6830393
浙ICP备18041652号-1
浙公网安备 33011002013572号