Data Collection
數(shù)據(jù)采集
· 多源異構數(shù)據(jù)支持、基于分布式系統(tǒng)的數(shù)據(jù)采集、主動感知的數(shù)據(jù)增量更新 · 這些是數(shù)據(jù)類型:SQL、Apache Parquet、{JSON}、HIVE、CSV、dBase、HBASE、PostgreSQL、 Hadoop HDFS、Data is stored
數(shù)據(jù)存儲
· 支持多樣化存儲,包括關系型數(shù)據(jù)庫Mysql、Impala……, · 非結(jié)構化數(shù)據(jù)HDFS, · 半結(jié)構化數(shù)據(jù)mongodb、HBase、memcached, · 文檔數(shù)據(jù)庫solr。滿足不同場景的不同需求。Data Governance
數(shù)據(jù)治理
· 對多源異構數(shù)據(jù)進行分拆、合并、清洗、轉(zhuǎn)換 · 多維數(shù)據(jù)分析 · 網(wǎng)絡關聯(lián)圖挖掘