问答1 问答5 问答50 问答500 问答1000
网友互助专业问答平台

大数据分析应该掌握哪些基础知识?

提问网友 发布时间:2022-04-23 05:32
声明:本网页内容为用户发布,旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。
E-MAIL:1656858193@qq.com
3个回答
热心网友 回答时间:2022-04-07 20:28

Java基础语法

· 分支结构if/switch

· 循环结构for/while/do while

· 方法声明和调用

· 方法重载

· 数组的使用

· 命令行参数、可变参数

IDEA

· IDEA常用设置、常用快捷键

· 自定义模板

· 关联Tomcat

· Web项目案例实操

面向对象编程

· 封装、继承、多态、构造器、包

· 异常处理机制

· 抽象类、接口、内部类

· 常有基础API、集合List/Set/Map

· 泛型、线程的创建和启动

· 深入集合源码分析、常见数据结构解析

· 线程的安全、同步和通信、IO流体系

· 反射、类的加载机制、网络编程

Java8/9/10/11新特性

· Lambda表达式、方法引用

· 构造器引用、StreamAPI

· jShell(JShell)命令

· 接口的私有方法、Optional加强

· 局部变量的类型推断

· 更简化的编译运行程序等

MySQL

· DML语言、DDL语言、DCL语言

· 分组查询、Join查询、子查询、Union查询、函数

· 流程控制语句、事务的特点、事务的隔离级别等

JDBC

· 使用JDBC完成数据库增删改查操作

· 批处理的操作

· 数据库连接池的原理及应用

· 常见数据库连接池C3P0、DBCP、Druid等

Maven

· Maven环境搭建

· 本地仓库&*仓库

· 创建Web工程

· 自动部署

· 持续继承

· 持续部署

Linux

· VI/VIM编辑器

· 系统管理操作&远程登录

· 常用命令

· 软件包管理&企业真题

Shell编程

· 自定义变量与特殊变量

· 运算符

· 条件判断

· 流程控制

· 系统函数&自定义函数

· 常用工具命令

· 面试真题

Hadoop

· Hadoop生态介绍

· Hadoop运行模式

· 源码编译

· HDFS文件系统底层详解

· DN&NN工作机制

· HDFS的API操作

· MapRece框架原理

· 数据压缩

· Yarn工作机制

· MapRece案例详解

· Hadoop参数调优

· HDFS存储多目录

· 多磁盘数据均衡

· LZO压缩

· Hadoop基准测试

Zookeeper

· Zookeeper数据结果

· 内部原理

· 选举机制

· Stat结构体

· *

· 分布式安装部署

· API操作

· 实战案例

· 面试真题

· 启动停止脚本

HA+新特性

· HDFS-HA集群配置

Hive

· Hive架构原理

· 安装部署

· 远程连接

· 常见命令及基本数据类型

· DML数据操作

· 查询语句

· Join&排序

· 分桶&函数

· 压缩&存储

· 企业级调优

· 实战案例

· 面试真题

Flume

· Flume架构

· Agent内部原理

· 事务

· 安装部署

· 实战案例

· 自定义Source

· 自定义Sink

· Ganglia监控

Kafka

· 消息队列

· Kafka架构

· 集群部署

· 命令行操作

· 工作流程分析

· 分区分配策略

· 数据写入流程

· 存储策略

· 高阶API

· 低级API

· *

· 监控

· 高可靠性存储

· 数据可靠性和持久性保证

· ISR机制

· Kafka压测

· 机器数量计算

· 分区数计算

· 启动停止脚本

DataX

· 安装

· 原理

· 数据一致性

· 空值处理

· LZO压缩处理

Scala

· Scala基础入门

· 函数式编程

· 数据结构

· 面向对象编程

· 模式匹配

· 高阶函数

· 特质

· 注解&类型参数

· 隐式转换

· 高级类型

· 案例实操

Spark Core

· 安装部署

· RDD概述

· 编程模型

· 持久化&检查点机制

· DAG

· 算子详解

· RDD编程进阶

· 累加器&广播变量

Spark SQL

· SparkSQL

· DataFrame

· DataSet

· 自定义UDF&UDAF函数

Spark Streaming

· SparkStreaming

· 背压机制原理

· Receiver和Direct模式原理

· Window原理及案例实操

· 7x24 不间断运行&性能考量

Spark内核&优化

· 内核源码详解

· 优化详解

Hbase

· Hbase原理及架构

· 数据读写流程

· API使用

· 与Hive和Sqoop集成

· 企业级调优

Presto

· Presto的安装部署

· 使用Presto执行数仓项目的即席查询模块

Ranger2.0

· 权限管理工具Ranger的安装和使用

Azkaban3.0

· 任务调度工具Azkaban3.0的安装部署

· 使用Azkaban进行项目任务调度,实现电话邮件报警

Kylin3.0

· Kylin的安装部署

· Kylin核心思想

· 使用Kylin对接数据源构建模型

Atlas2.0

· 元数据管理工具Atlas的安装部署

Zabbix

· 集群监控工具Zabbix的安装部署

DolphinScheler

· 任务调度工具DolphinScheler的安装部署

· 实现数仓项目任务的自动化调度、配置邮件报警

Superset

· 使用SuperSet对数仓项目的计算结果进行可视化展示

Echarts

· 使用Echarts对数仓项目的计算结果进行可视化展示

Redis

· Redis安装部署

· 五大数据类型

· 总体配置

· 持久化

· 事务

· 发布订阅

· 主从复制

Canal

· 使用Canal实时监控MySQL数据变化采集至实时项目

Flink

· 运行时架构

· 数据源Source

· Window API

· Water Mark

· 状态编程

· CEP复杂事件处理

Flink SQL

· Flink SQL和Table API详细解读

Flink 内核

· Flink内核源码讲解

· 经典面试题讲解

Git&GitHub

· 安装配置

· 本地库搭建

· 基本操作

· 工作流

· 集中式

ClickHouse

· ClickHouse的安装部署

· 读写机制

· 数据类型

· 执行引擎

DataV

· 使用DataV对实时项目需求计算结果进行可视化展示

sugar

· 结合Springboot对接百度sugar实现数据可视化大屏展示

Maxwell

· 使用Maxwell实时监控MySQL数据变化采集至实时项目

ElasticSearch

· ElasticSearch索引基本操作、案例实操

Kibana

· 通过Kibana配置可视化分析

Springboot

· 利用Springboot开发可视化接口程序

热心网友 回答时间:2022-04-07 21:46
如果是分析师方向,那么建议最基础的sql需要熟练掌握,另外需要掌握一些大数据组件的使用,比如hive,spark sql,presto等等,当然了,excel的常用透视等等也是基本功。对于分析人员来说,思维能力的训练尤其重要
热心网友 回答时间:2022-04-07 23:21
1,计算机语言:python语言,Java语言二选一。!提示(想要处理千万级别的数据量,还是得会Java语言)

2,基本的高数知识,线性代数知识,概率论知识。
3,对常用的数据类型要能进行灵活转换,数据结构是基础。
4,数据处理,万级数据量,可以选择使用Excel。十万级数据量可以使用python。更大数据量使用Java处理。
5,可视化,有Excel,echarts,pyecharts,html这些方式,根据数据量的大小来自行选择。
6,最后,希望我的回复能对您有所帮助,祝你成功!

本文如未解决您的问题请添加抖音号:51dongshi(抖音搜索懂视),直接咨询即可。

电费单价是否从2018年4月进行下调? 如何学习成为一名数据分析师? 收到通知说电费下调0.58分是怎么回事? 出租房电费1.5元一度合法吗? 电费下调了吗? 请问2018年7月份电价是否有进行调整? 家用充电桩的电费时间段、电价是多少? 电费单价是从2018年4月进行下调吗? 数据分析师需要学那些东西? 请问深圳市商业用电收0.9后,加收0.4用电服务费是什么意思? 数据分析师要学什么来提升自己? 电费异常增多该怎么投诉? 请问如果想要从事数据分析工作,应该要学习哪些内容呢? 2018年租房电费1.2元一度贵不贵的,水费3元一吨? 多少钱一度电 《西游记》中,是谁在玉帝面前推荐二郎神去降服孙悟空? 中国神话传说中劈山救母的到底是沉香还是二郎神 深圳电费多少钱一度? 水费又是多少钱? 《西游记》中,玉帝为什么要调二郎神来降服孙悟空呢? 不用的怎么解除手机绑定 租房单间,房东收电费一元一度,合法么? 一般工商业电价将会降低吗? 电费是多久收一次? 电费多长时间交一次? 现中山市居民用电是多少钱一度 电费是每个月结的嘛? 下载腾讯手机管家垃圾清理 水电费要是晚交了几天会怎样? 供电局电费单一期是一个月还是两个月??? 手机管家清理垃圾真的有用吗? 可以用手机管家来清理手机里的垃圾吗? 什么手机清理软件能彻底清理垃圾? 手机管家极速版下载安装底每天清除垃圾等要付费吗? 现在那个手机管家清理垃圾好用,推荐个 问下2020年,2021年及2022上半年厦门GDP增长比率是多少? 2021年福建各市gdp排名? 2007福建上上半年gdp排名 有谁知道福建各地市2007年的人口数,gdp和财政收入?? 厦门gdp2019是多少? 厦门2019GDP是多少?
Top