1、海量数据存储技术
针对不同应用场景满足海量数据存储管理需求,提供异构数据统一管理,支持关系数据库、分布式文件系统、分布式数据库、图数据库的数据存储。
2、多种计算模式的海量数据并行计算技术

针对不同数据处理需求特征,提供涵盖批量计算、流式计算、图计算多种计算模式,为大规模数据高效挖掘分析提供计算支撑。提供批处理计算框架、流处理计算框架、图计算框架等计算引擎,并对集群的大规模计算资源进行统一管理。
3、大数据挖掘引擎技术
实现大数据挖掘平台技术,为业务分析人员提供图形化大数据挖掘算法运行、监控功能以及图形化大数据挖掘流程构建与运行功能;为分布式开发人员提供大数据挖掘算法开发基础软件环境以及工具库;提供大数据挖掘算法、流程管理功能,集成Mahout、MLib开源分布式挖掘算法,支持分布式挖掘算法注册与搜索。
4、大数据交互式分析技术
实现海量数据交互式内容分析,一方面提供交互式数据操作接口,支持select、join、insert、union、avg、group等典型SQL操作;另一方面封装数据分析典型需求,支持全局有序数据重组、数据统计、数据抽样等一键式数据分析。降低数据分析人员的分析复杂度,提升数据内容分析效率。