Big Data 9 min read

Comprehensive Big Data Interview Questions and Topics

This article compiles a wide range of interview questions covering JVM garbage collection, Hadoop, Hive, Flink, HBase, data warehousing, real‑time processing, and HR topics, providing a thorough preparation guide for candidates targeting senior big‑data positions.

Big Data Technology & Architecture
Big Data Technology & Architecture
Big Data Technology & Architecture
Comprehensive Big Data Interview Questions and Topics

This is a recent interview guide for a student who successfully secured an offer at a leading company.

Some content related to project privacy has been removed.

Framework Section

JVM垃圾回收机制<br/>HashMap与HashTable区别<br/>Hbase中rowkey设计原则?工作中怎么设计rowkey的<br/>Flink提交流程<br/>Flink水位线机制<br/>Flink状态与状态后端<br/>Flink如何实现精准一次语义<br/>Flink的checkpoint机制<br/>Hadoop中MR工作原理相关<br/>Hive的分区表和分桶表区别<br/>Hive的四个by<br/>Hive的优化<br/>Hive数据倾斜<br/>HDFS读写流程<br/>Doris优化<br/>Doris的架构原理<br/>

Project Section

有没有做过数据治理?都做过什么?<br/>离线或实时数仓的分层架构?每一层都做了什么<br/>实时数仓和离线数仓的不同<br/>离线或实时工作中遇到过数据倾斜么?<br/>工作中最难或最有意义的项目是哪个? 有什么困难的点?<br/>实时数仓中遇到过背压么?一旦产生背压会影响什么?怎么解决的?结合实际工作说说<br/>离线工作中遇到过大表join大表慢的情况么? 怎么解决的? 说一个实际场景<br/>实时计算中多流join怎么解决<br/>什么叫主题域,数仓中数据域、主题和主题域的区别?<br/>工作中是怎么进行业务建模的?<br/>数据湖和流批一体了解么?<br/>实时任务一旦失败或者丢数了,如何修复?<br/>实时数据怎么保证准确性一致性?<br/>各个部门之间怎么保证数据口径一致<br/>Hbase热点问题遇到过么?<br/>数仓为什么分层,有什么好处<br/>页面上实时展示历史累计去重值或者周期性最大最小值,说一下全链路的处理思路,考虑高并发<br/>

HR Questions

想了解一下为什么离职或跳槽<br/>我们公司最吸引你的地方是什么?<br/>工作期间最让你成长最有收获的事情<br/>某个项目中遇到最大的挑战是什么?<br/>当时加入某司的时候,你自己希望有的一些发展或者说成长是什么?那现在回头回过头来看,你的一些成长和发展是实际来看是怎么样子?<br/>下一份工作的一些成长发展的诉求或期待是什么样子的?或者说职业规划是什么?<br/>

If this article helped you, don’t forget to "watch", "like", and "bookmark".

Promotional Image
Promotional Image

Related resources:

300万字!全网最全大数据学习面试社区等你来!

全网首发|大数据专家级技能模型与学习指南(胜天半子篇)

互联网最坏的时代可能真的来了

我在B站读大学,大数据专业

我们在学习Flink的时候,到底在学习什么?

193篇文章暴揍Flink,这个合集你需要关注一下

Flink生产环境TOP难题与优化,阿里巴巴藏经阁YYDS

Flink CDC我吃定了耶稣也留不住他!| Flink CDC线上问题小盘点

我们在学习Spark的时候,到底在学习什么?

在所有Spark模块中,我愿称SparkSQL为最强!

硬刚Hive | 4万字基础调优面试小总结

数据治理方法论和实践小百科全书

标签体系下的用户画像建设小指南

4万字长文 | ClickHouse基础&实践&调优全视角解析

【面试&个人成长】社招和校招的经验之谈

大数据方向另一个十年开启 |《硬刚系列》第一版完结

我写过的关于成长/面试/职场进阶的文章

当我们在学习Hive的时候在学习什么?「硬刚Hive续集」

FlinkHiveHadoop
Big Data Technology & Architecture
Written by

Big Data Technology & Architecture

Wang Zhiwu, a big data expert, dedicated to sharing big data technology.

0 followers
Reader feedback

How this landed with the community

Sign in to like

Rate this article

Was this worth your time?

Sign in to rate
Discussion

0 Comments

Thoughtful readers leave field notes, pushback, and hard-won operational detail here.