大数据

国产化 网络安全 数字化 人工智能

大数据

  • 一种新颖的方法将数据湖仓分析的所有优势与数据仓库的高性能完美结合。译自How to Get Data Warehouse Performance on the Data Lakehouse,作者 Sida Shen 是CelerData的产品营销经理。他拥有机器学
    2023-12-13大数据0312
  • 许多企业并没有意识到大数据服务的潜在好处。尽管大肆宣传,要么没有意识到自己存在大数据问题,要么不这么认为。当数据量、种类和速度突然增长,并且企业当前的数据库和应用无法再处理负载时,大数据技术通常十分有用。如果处理不当,大数据问题可能会增加开支,并对生产力和竞争力产
    2023-12-11大数据0331
  • 很多同学表示想看RFM,今天它来了。RFM是很传统的数据分析模型,几乎所有文章都会提到它,然而市面上流传的各种乱用、错用也非常多。今天我们系统讲一下。 1 、RFM基本原理RFM是三个单词的缩写:最近一次消费时间 (Recency),取数的时候
    2023-12-11大数据0315
  • 一、Alluxio Edge 产生的背景首先来介绍一下现代数据技术栈的演变历程。10 年前,Hadoop 拥有一个紧密耦合的 MapReduce 和 HDFS 架构。HDFS 在本地部署,计算资源多由 YARN 管理。今天,技术栈的丰富带给我们
    2023-12-11大数据0308
  • 继上次盘点《数据科学家95%的时间都在使用的11个基本图表》之后,今天将为大家带来数据科学家95%的时间都在使用的11个基本分布。掌握这些分布,有助于我们更深入地理解数据的本质,并在数据分析和决策过程中做出更准确的推断和预测。1. 正态分布正态分布(Normal
    2023-12-08大数据0325
  • 在数据科学和机器学习领域,许多模型都假设数据呈现正态分布,或者假设数据在正态分布下表现更好。例如,线性回归假设残差呈正态分布,线性判别分析(LDA)基于正态分布等假设进行推导。 因此,了解如何测试数据正态性的方法对于数据科学家和机器学习从业者至关重要。本文将介绍测
    2023-12-07大数据0332