-
课程丨大数据分析专题Hadoop/MapReduce/Hive原理及应用
所属栏目:[大数据] 日期:2021-01-10 热度:86
? 课程目的 1.掌握Hadoop,Hive以及MapReduce的基本原理及应用; 2.学会在本地与AWS进行交互,并利用AWS Elastic MapReduce进行实战数据分析。 ? 课程项目图 ? 讲师介绍 Eason 卡内基梅隆大学硕士。热衷于研究各类大数据框架,拥有数年AWS开发经验。现就职于[详细]
-
机器学习中的相似性度量!
所属栏目:[大数据] 日期:2021-01-10 热度:133
在做分类时常常需要估算不同样本之间的相似性度量(Similarity Measurement),这时通常采用的方法就是计算样本间的“距离”(Distance)。采用什么样的方法计算距离是很讲究,甚至关系到分类的正确与否。 本文的目的就是对常用的相似性度量作一个总结。 本文目[详细]
-
HDOJ 1042 N! 大数
所属栏目:[大数据] 日期:2021-01-10 热度:89
Given an integer N(0 ≤ N ≤ 10000),your task is to calculate N!? Input One N in one line,process to the end of file.? Output For each N,output N! in one line.? Sample Input 123 Sample Output 126 思路:没啥思路[详细]
-
[收藏] 值得关注的12大开源大数据分析应用软件
所属栏目:[大数据] 日期:2021-01-10 热度:174
数据挖掘与数据分析 本文来自 51CTO快译, 介绍的这些开源工具是大数据处理、商业智能、机器学习和预测分析等领域的佼佼者。 对于许多大企业来说,开源大数据分析已经成为日常业务中一个必不可少的组成部分。据New Vantage Partners公司对《财富》1000强公司[详细]
-
收藏丨值得关注的12大开源大数据分析应用软件
所属栏目:[大数据] 日期:2021-01-10 热度:153
对于许多大企业来说,开源大数据分析已经成为日常业务中一个必不可少的组成部分。据New Vantage Partners公司对《财富》1000强公司的高层主管开展的调查显示,如今62.5%的企业在生产环境中至少运行一种大数据工具或应用软件。这比2013年给出同样回复的企业数[详细]
-
nuoj 114 大数
所属栏目:[大数据] 日期:2021-01-10 热度:171
数列A满足An = An-1 + An-2 + An-3,n = 3? 编写程序,给定A0,A1 和 A2,计算A99 Input 输入包含多行数据? 每行数据包含3个整数A0,A1,A2 (0 = A0,A2 = 32767)? 数据以EOF结束 Output 对于输入的每一行输出A99的值 Sample Input 1 1 1 Sample Output 6908744247[详细]
-
机器学习和数据分析Python 与 R 编程之间的对比
所属栏目:[大数据] 日期:2021-01-10 热度:86
转载: https://opensource.com/article/16/11/python-vs-r-machine-learning-data-analysis Machine learning and data analysis are two areas where open source has become almost the de facto license for innovative new tools. Both the Python and[详细]
-
时空维度挖掘(二)之 leaflet
所属栏目:[大数据] 日期:2021-01-10 热度:154
概述 本文是时空维度挖掘系列的第二篇,将引进空间挖掘中的重量级嘉宾 leaflet。在互联网竞争日益激烈的今天,一方面,online业务蓝海越来越少,扩展成本也越来越高,许多互联网企业开始介入地推,甚至出现了比如望京扫码一条街这样的经典案例;另一方面,of[详细]
-
完整数据团队Tips(关于BI系统、数据仓库、数据挖掘和数据实验的
所属栏目:[大数据] 日期:2021-01-02 热度:86
参考The Strong Data Science Audit: How does your organization's data strategy stack up?一文 分析和仪表盘 使用第三方获取用户行为的工具? 使用Google Analytics、Segment、Heap之类的工具。 有没有明确的用户行为定义,还是说只有PV? 查看PV是了解用[详细]
-
36早报|扎克伯格创造了钢铁侠里的贾维斯 警方用大数据分析抓获18
所属栏目:[大数据] 日期:2021-01-02 热度:124
Hi,早上好,亲爱的小伙伴们,昨天是冬至节,你有吃饺子吗? 都说冬至节不吃饺子耳朵会被冻掉哦~先上一张我小时候吃饺子的照片,有没有满满的既视感→→? 过完了冬至节,马上就要迎来平安夜,圣诞节,元旦节,春节…… 好吧,这似乎和大数据没啥关系?不不[详细]
-
大数据处理分析工具
所属栏目:[大数据] 日期:2021-01-02 热度:107
hadoop Hadoop 是一个能够对大量数据进行分布式处理的软件框架。但是 Hadoop 是以一种可靠、高效、可伸缩的方式进行处理的。Hadoop 是可靠的,因为它假设计算元素和存储会失败,因此它维护多个工作数据副本,确保能够针对失败的节点重新分布处理。Hadoop 是[详细]
-
bfprt算法,中位数的中位数算法,O(n)时间复杂度求解第k大数
所属栏目:[大数据] 日期:2021-01-02 热度:101
215. Kth Largest Element in an Array 题目地址 https://leetcode.com/problems/kth-largest-element-in-an-array/ 题目描述 Find the kth largest element in an unsorted array. Note that it is the kth largest element in the sorted order,not the kt[详细]
-
棋盘覆盖。大数
所属栏目:[大数据] 日期:2021-01-02 热度:75
棋盘覆盖 时间限制: 3000 ?ms ?|? 内存限制: 65535 ?KB 难度: 3 描述 在一个2 k ×2 k (1=k=100)的棋盘中恰有一方格被覆盖,如图1(k=2时),现用一缺角的2×2方格(图2为其中缺右下角的一个),去覆盖2 k ×2 k 未被覆盖过的方格,求需要类似图2方格总[详细]
-
BI入门经典
所属栏目:[大数据] 日期:2021-01-02 热度:55
【前言】 ?????昨天论坛的SQL Server大版新增了一个BI板块,大家讨论得热火朝天,由于此前因为客户环境的问题,一直在使用sql 2000,没怎么关注这一块的东西,最近刚好要做购物篮的分析,所以到网上搜集了一些资料。为了跟大家保持“步调一致”,也写点或转[详细]
-
为什么说OLAP产品毁了BI?
所属栏目:[大数据] 日期:2021-01-02 热度:128
? ? ? ?企业为了确定经营战略和市场战略所进行的经营活动,在BI项目的分析决策过程中,需要基于多种报告和报表进行分析。理想的市场活动展开,大多需要各个营业点的销售报表,每种商品按季节销售的业绩图表等,这就需要大量准确的并且易于判断的数据。 然而[详细]
-
大道至简的数据处理工具-(Microsoft Power Query入门)
所属栏目:[大数据] 日期:2021-01-02 热度:166
大道至简的数据处理工具-Microsoft Power Query 告别复杂的excel函数,excel VBA编程,让一切回归简单与职能。 什么样的人群适合这样的一个工具: 1、出纳、会计、统计、仓管、数据分析等与数据打交道的的岗位。 2、不想学处理数据的函数、VBA编程等复杂的功[详细]
-
数据处理方式与控制程序方式不同
所属栏目:[大数据] 日期:2021-01-02 热度:116
结构化方法是直接通过程序来处理数据,处理完毕后即可显示处?理结果,在控制程序方式上是按照设计调用或返回程序不能自由导航,?各模块程序之间存在着控制与被控制的关系;面向对象方法将数据与?对应的代码封装成一个整体,原则上其它对象不能直接修改其数据[详细]
-
如何用大数据实现用户价值的最大化
所属栏目:[大数据] 日期:2021-01-01 热度:53
来源:易观智库 1 大数据中的用户分析 首先,我们为什么要去做用户分析? 面临繁琐的数据之中,需要做什么分析?怎么去提取数据?在建立用户画像模型的过程中,区分用户特征的关键点是什么?应该从哪些方面去寻找用户的特征?其实这个问题扩大化以后需要解决[详细]
-
算法提高 大数加法
所属栏目:[大数据] 日期:2021-01-01 热度:106
问题描述 输入两个正整数a,b,输出a+b的值。 输入格式 两行,第一行a,第二行b。a和b的长度均小于1000位。 输出格式 一行,a+b的值。 样例输入 4 2 样例输出 6 #includestdio.h#includestring.hvoid fun(int n,int sum[]){int temp,i;for(i=0;in;i++){temp=s[详细]
-
[bigdata-031] python3+selenium 做抓取
所属栏目:[大数据] 日期:2021-01-01 热度:123
1. 安装 1.1 pip3 install -U selenium 1.2 下载 https://github.com/mozilla/geckodriver/releases/download/v0.13.0/geckodriver-v0.13.0-linux64.tar.gz? 解压缩,然后放到/usr/bin目录 2. 抓取豆瓣 #!/usr/bin/env python3#!-*- coding:utf-8 -*-import[详细]
-
logminer挖掘
所属栏目:[大数据] 日期:2021-01-01 热度:132
1.???? Logminer介绍 LogMiner 是Oracle公司从产品8i以后提供的一个实际非常有用的分析工具,使用该工具可以轻松获得Oracle 重做日志文件(归档日志文件)中的具体内容,LogMiner分析工具实际上是由一组PL/SQL包和一些动态视图组成,它作为Oracle数据库的一[详细]
-
BI工具选型指标,如何选择好的BI工具
所属栏目:[大数据] 日期:2021-01-01 热度:135
随着信息化的发展,越来越多的企业将商业智能 BI 的部署列入了企业信息化建设的下期目标, BI 市场需求的日益旺盛,也催生了 BI 厂商激烈的市场竞争,带动了国内 BI 工具技术的发展及成熟。 那么作为一个正在或者即将要进行 BI 工具选型的企业,面对百花齐放[详细]
-
如何正确理解商业智能(BI)?
所属栏目:[大数据] 日期:2021-01-01 热度:52
为了让读者更加清晰地把BI与MIS系统区别开来,本文讨论了BI与DSS(决策支持系统)、EIS(经理执行系统)的主要区别。最后,本文分析了制约BI健康发展的若干因素。 引言 ??? 商业智能(BI)是目前在国外企业界和软件开发界受到广泛关注的一个研究方向。可以用[详细]
-
BI选型流程建议
所属栏目:[大数据] 日期:2021-01-01 热度:80
一、成立选型小组 ? ? ? ? 成立选型小组是企业确定进行软件选型所需要做的第一步。选型小组将负责整个软件选型过程的执行。选型小组成员至少包括公司副总以上领导一名、 CIO 一名、业务负责人一名。 二、评估需求 ? ? ? ? 评估需求是指企业成立 BI 选型小组[详细]
-
BI离不了报表
所属栏目:[大数据] 日期:2021-01-01 热度:144
前不久写了一篇文章:报表 ?VS BI ,指出,报表不等于 BI 。这几天碰到一个客户,让我不得不说出另外的一句话,那就是, BI 离不了报表。 ? ? ??演示中,客户的领导发表意见:你们这个还是报表,我们要的不是报表。比如库存,不同的地方的库存标准是不一样的[详细]
