Comprehensive Big Data Interview Questions and Topics
This article compiles a wide range of interview questions covering JVM garbage collection, Hadoop, Hive, Flink, HBase, data warehousing, real‑time processing, and HR topics, providing a thorough preparation guide for candidates targeting senior big‑data positions.
This is a recent interview guide for a student who successfully secured an offer at a leading company.
Some content related to project privacy has been removed.
Framework Section
JVM垃圾回收机制<br/>HashMap与HashTable区别<br/>Hbase中rowkey设计原则?工作中怎么设计rowkey的<br/>Flink提交流程<br/>Flink水位线机制<br/>Flink状态与状态后端<br/>Flink如何实现精准一次语义<br/>Flink的checkpoint机制<br/>Hadoop中MR工作原理相关<br/>Hive的分区表和分桶表区别<br/>Hive的四个by<br/>Hive的优化<br/>Hive数据倾斜<br/>HDFS读写流程<br/>Doris优化<br/>Doris的架构原理<br/>Project Section
有没有做过数据治理?都做过什么?<br/>离线或实时数仓的分层架构?每一层都做了什么<br/>实时数仓和离线数仓的不同<br/>离线或实时工作中遇到过数据倾斜么?<br/>工作中最难或最有意义的项目是哪个? 有什么困难的点?<br/>实时数仓中遇到过背压么?一旦产生背压会影响什么?怎么解决的?结合实际工作说说<br/>离线工作中遇到过大表join大表慢的情况么? 怎么解决的? 说一个实际场景<br/>实时计算中多流join怎么解决<br/>什么叫主题域,数仓中数据域、主题和主题域的区别?<br/>工作中是怎么进行业务建模的?<br/>数据湖和流批一体了解么?<br/>实时任务一旦失败或者丢数了,如何修复?<br/>实时数据怎么保证准确性一致性?<br/>各个部门之间怎么保证数据口径一致<br/>Hbase热点问题遇到过么?<br/>数仓为什么分层,有什么好处<br/>页面上实时展示历史累计去重值或者周期性最大最小值,说一下全链路的处理思路,考虑高并发<br/>HR Questions
想了解一下为什么离职或跳槽<br/>我们公司最吸引你的地方是什么?<br/>工作期间最让你成长最有收获的事情<br/>某个项目中遇到最大的挑战是什么?<br/>当时加入某司的时候,你自己希望有的一些发展或者说成长是什么?那现在回头回过头来看,你的一些成长和发展是实际来看是怎么样子?<br/>下一份工作的一些成长发展的诉求或期待是什么样子的?或者说职业规划是什么?<br/>If this article helped you, don’t forget to "watch", "like", and "bookmark".
Related resources:
300万字!全网最全大数据学习面试社区等你来!
全网首发|大数据专家级技能模型与学习指南(胜天半子篇)
互联网最坏的时代可能真的来了
我在B站读大学,大数据专业
我们在学习Flink的时候,到底在学习什么?
193篇文章暴揍Flink,这个合集你需要关注一下
Flink生产环境TOP难题与优化,阿里巴巴藏经阁YYDS
Flink CDC我吃定了耶稣也留不住他!| Flink CDC线上问题小盘点
我们在学习Spark的时候,到底在学习什么?
在所有Spark模块中,我愿称SparkSQL为最强!
硬刚Hive | 4万字基础调优面试小总结
数据治理方法论和实践小百科全书
标签体系下的用户画像建设小指南
4万字长文 | ClickHouse基础&实践&调优全视角解析
【面试&个人成长】社招和校招的经验之谈
大数据方向另一个十年开启 |《硬刚系列》第一版完结
我写过的关于成长/面试/职场进阶的文章
当我们在学习Hive的时候在学习什么?「硬刚Hive续集」
Big Data Technology & Architecture
Wang Zhiwu, a big data expert, dedicated to sharing big data technology.
How this landed with the community
Was this worth your time?
0 Comments
Thoughtful readers leave field notes, pushback, and hard-won operational detail here.
