发布网友 发布时间:2022-04-01 01:13
共5个回答
热心网友 时间:2022-04-01 02:43
一、hadoop
Hadoop 是一个能够对大量数据进行分布式处理的软件框架。但是 Hadoop 是以一种可靠、高效、可伸缩的方式进行处理的。Hadoop 是可靠的,因为它假设计算元素和存储会失败,因此它维护多个工作数据副本,确保能够针对失败的节点重新分布处理。Hadoop 是高效的,因为它以并行的方式工作,通过并行处理加快处理速度。Hadoop 还是可伸缩的,能够处理 PB 级数据。此外,Hadoop 依赖于社区服务器,因此它的成本比较低,任何人都可以使用。
Hadoop带有用 Java 语言编写的框架,因此运行在 Linux 生产平台上是非常理想的。Hadoop 上的应用程序也可以使用其他语言编写,比如 C++。
二、HPCC
HPCC,High Performance Computing and Communications(高性能计算与通信)的缩写。1993年,由美国科学、工程、技术联邦协调理事会向国会提交了“重大挑战项目:高性能计算与 通信”的报告,也就是被称为HPCC计划的报告,即美国总统科学战略项目,其目的是通过加强研究与开发解决一批重要的科学与技术挑战问题。HPCC是美国实施信息高速公路而上实施的计划,该计划的实施将耗资百亿美元,其主要目标要达到:开发可扩展的计算系统及相关软件,以支持太位级网络传输性能,开发千兆 比特网络技术,扩展研究和教育机构及网络连接能力。
三、Storm
Storm是自由的开源软件,一个分布式的、容错的实时计算系统。Storm可以非常可靠的处理庞大的数据流,用于处理Hadoop的批量数据。Storm很简单,支持许多种编程语言,使用起来非常有趣。Storm由Twitter开源而来,其它知名的应用企业包括Groupon、淘宝、支付宝、阿里巴巴、乐元素、 Admaster等等。
Storm有许多应用领域:实时分析、在线机器学习、不停顿的计算、分布式RPC(远过程调用协议,一种通过网络从远程计算机程序上请求服务)、 ETL(Extraction-Transformation-Loading的缩写,即数据抽取、转换和加载)等等。Storm的处理速度惊人:经测 试,每个节点每秒钟可以处理100万个数据元组。Storm是可扩展、容错,很容易设置和操作。
四、Apache Drill
为了帮助企业用户寻找更为有效、加快Hadoop数据查询的方法,Apache软件基金会近日发起了一项名为“Drill”的开源项目。Apache Drill 实现了 Google's Dremel。该项目将会创建出开源版本的谷歌Dremel Hadoop工具(谷歌使用该工具来为Hadoop数据分析工具的互联网应用提速)。而“Drill”将有助于Hadoop用户实现更快查询海量数据集的目的。
通过开发“Drill”Apache开源项目,组织机构将有望建立Drill所属的API接口和灵活强大的体系架构,从而帮助支持广泛的数据源、数据格式和查询语言。
五、RapidMiner
RapidMiner是世界领先的数据挖掘解决方案,在一个非常大的程度上有着先进技术。它数据挖掘任务涉及范围广泛,包括各种数据艺术,能简化数据挖掘过程的设计和评价。
六、 Pentaho BI
Pentaho BI 平台不同于传统的BI 产品,它是一个以流程为中心的,面向解决方案(Solution)的框架。其目的在于将一系列企业级BI产品、开源软件、API等等组件集成起来,方便商务智能应用的开发。它的出现,使得一系列的面向商务智能的产品如Jfree、Quartz等等,能够集成在一起,构成一项项复杂的、完整的商务智能解决方案。
Pentaho BI 平台构建于服务器,引擎和组件的基础之上。这些提供了系统的J2EE 服务器,安全,portal,工作流,规则引擎,图表,协作,内容管理,数据集成,分析和建模功能。这些组件的大部分是基于标准的,可使用其他产品替换之。
热心网友 时间:2022-04-01 04:01
数据为王的时代,人人都需要掌握一些数据分析技能。不懂SQL,不懂数据库,Excel不精通,VBA不敢碰,这些都是横亘在面前的一道坎。
然而,企业数据分析日益上涨,数据人才供不应求,为了降低入门门槛,近几年市面上大量涌现了一批自助式BI工具。
自助式BI工具其实就是指大数据前端分析工具。简单安装,方便使用是其主要特征。
目前的自助式BI工具,已经将维度的选择集成到控件组件的拖选操作,自动建模技术避免了手动建立数据模型。这样一来,数据分析工作能很好地落地到业务分析员手中,一方面能更快速地响应业务的需求,另一方面业务与数据的快速结合能提高决策效率。
对于很多企业来说,自助式BI工具的使用,可以帮助企业实现相互部门之间的协作,帮助企业看到问题所在以及分析产生的原因。
Tableau
Tableau是最强劲的可视化工具,这一点毋庸置疑。
Tableau提供了丰富多变的可视化图表,独具特色,可以实现Dashboard和动态数据更新。
同属于自助式分析工具的tableau,学习起来也很容易上手,如果英文不错,对照着帮助文档和学习论坛能学到更多的图表分析制作。
FineBI
唯一上榜的国内产品。依托了10年报表开发领域的经验的,其最大优势在于分析速度的简单与快。凭借大数据引擎,用户只需在dashboard中拖拽分析的维度和指标,自行完善可视化的布局,无需编辑代码和脚本,就能呈现一个完整的数据报告。
针对以主题的分析,FineBI提供了在现有报告上进行维度切换的操作,防止分析分析报告制做不严谨带来的偏差。FineBI的可视化采用的是目前主流的H5图表,而非插件,能够适应各种大小类型的屏幕,从手机端、PC端、大屏幕都能够完美的适应。
Qlikview
Qlikview相比上面两者,商业性质更重。定位是商业分析软件,使开发者和分析者能够快速部署分析引用,类似于报表工具FineReport,Qlikview可集成在产品里做报表、监控、和仪表盘分析。
其专利技术AQL构架,在分析一定数据量时,可避免使用数据库和OLAP,提供灵活、强大的分析功能。
Power BI
Power BI是微软公司的一款商BI分析软件,提供了强大的组件和功能,对于爱好Excel的朋友是一大福音。数据表制作类似Excel,建立多表关系类似Access,可视化方面在Excel的基础上增加了一系列可直接使用的图表,数据源可配置自动更新,实现实时的仪表板展现,目前提供了在线、移动、桌面三个版本。
这样四款自助式BI工具涵盖了个人使用到商用,在前端可视化分析上可谓是数据分析领域的新一代突破,也是未来前景。有数据分析需求的朋友或企业,不妨一试!
热心网友 时间:2022-04-01 05:35
付费内容限时免费查看回答1、Disco
Disco最初由诺基亚开发,这是一种分布式计算框架,与Hadoop一样,它也基于MapRece。它包括一种分布式文件系统以及支持数十亿个键和值的数据库。
支持的操作系统:Linux和OSX。
2、HPCC
作为Hadoop之外的一种选择,HPCC这种大数据平台承诺速度非常快,扩展性超强。除了免费社区版外,HPCCSystems还提供收费的企业版、收费模块、培训、咨询及其他服务。
支持的操作系统:Linux。
3、Lumify
Lumify归Altamira科技公司(以*技术而闻名)所有,这是一种开源大数据整合、分析和可视化平台。你只要在Try、Lumify、io试一下演示版,就能看看它的实际效果。
支持的操作系统:Linux。
4、Pandas
Pandas项目包括基于Python编程语言的数据结构和数据分析工具。它让企业组织可以将Python用作R之外的一种选择,用于大数据分析项目。
支持的操作系统:Windows、Linux和OSX。
5、Storm
Storm现在是一个Apache项目,它提供了实时处理大数据的功能(不像Hadoop只提供批任务处理)。其用户包括*、美国天气频道、WebMD、阿里巴巴、Yelp、雅虎日本、Spotify、Group、Flipboard及其他许多公司。
支持的操作系统:Linux。
热心网友 时间:2022-04-01 07:27
Excel
Excel简单实用好操作,对于个人的工作汇报和日常工作的数据整理帮助特别大。但是其可供选择的统计图样式有点难看,好看的需要付费。另外,Excel不足以支撑TB级别的数据分析需求。
亿信华辰—一站式数据分析平台(ABI)
亿信ABI融合了数据源适配、ETL数据处理、数据建模、数据分析、数据填报等功能,采用轻量级SOA架构设计、B/S模式,各模块间无缝集成。数据整合模块支持可视化的定义ETL过程,完成对数据的清洗、装换、处理。数据分析模块支持报表分析、敏捷看板、即席报告、幻灯片、酷屏、数据填报、数据挖掘等多种分析手段对数据进行分析、展现、应用。
神策数据—神策分析
神策分析的产品有完整的使用文档,每个模块都有详细的使用说明以及示例,降低了用户的学习成本。而且支持私有部署、任意维度的交叉分析,并帮助客户搭建专属的数据仓库。工具需要付费使用。
帆软—FineBI
FineBI分为数据处理、可视分析和分享公用三大功能模块。分析页面由控件和组件组成,控件和组件的数量是可以添加至任意多个,但是布局的交互比较僵硬,且使用逻辑有点乱,引导不明确。需要安装本地客户端才能使用。
永洪科技—永洪BI
永洪BI是一款可在前端进行*分析和报表展现的BI软件。支持拖拽操作,数据源格式多样,提供不同级别的查询支持,支持跨库跨源连接。不过其产品用户体验一般,主题样式虽多但是给人感觉样式还是很传统。
热心网友 时间:2022-04-01 09:35
hadoop,特点不多赘述,百度吧。