Tagged articles

failover

156 articles · Page 2 of 2

Aug 23, 2020 · Databases

Simplify MySQL HA with MariaDB MaxScale: Consul‑MHA Alternative and Step‑by‑Step Setup

This guide explains how to replace the traditional MHA/Keepalived high‑availability setup with MariaDB MaxScale integrated with Consul, providing a simpler, fully automated HA solution, complete with configuration files, installation commands, and detailed failover, switchover, and rejoin procedures.

ConsulGTID ReplicationMariaDB

0 likes · 15 min read

Simplify MySQL HA with MariaDB MaxScale: Consul‑MHA Alternative and Step‑by‑Step Setup

Aikesheng Open Source Community

Aug 21, 2020 · Databases

MySQL 8.0.20 Group Replication Overview and Practical Guide

This article introduces MySQL 8.0.20 Group Replication, covering single‑master and multi‑master modes, monitoring, failover procedures, abnormal recovery, flow control, performance testing, encountered issues, and limitations, and provides a downloadable PDF with detailed documentation hosted on Baidu Cloud.

Baidu CloudGroup Replicationdatabase

0 likes · 1 min read

MySQL 8.0.20 Group Replication Overview and Practical Guide

Programmer DD

Aug 10, 2020 · Backend Development

How to Build a Reliable Redis‑Based Distributed Lock (Lessons from a 2013 Implementation)

This article explains the design, pitfalls, and improvement ideas of a Redis‑based distributed lock used since 2013, covering lock acquisition and release processes, expiration handling, high‑availability strategies, and practical lessons for building robust concurrency control in distributed systems.

Javaconcurrencyfailover

0 likes · 7 min read

How to Build a Reliable Redis‑Based Distributed Lock (Lessons from a 2013 Implementation)

Efficient Ops

Jul 19, 2020 · Databases

Mastering Oracle ADG: Fast Disaster Recovery Strategies for Critical Systems

This article explains what Oracle Active Data Guard (ADG) is, outlines its basic deployment architecture, and provides detailed step‑by‑step emergency response procedures for four common network and server configurations to ensure rapid failover and business continuity.

ADGOracledatabase

0 likes · 6 min read

Mastering Oracle ADG: Fast Disaster Recovery Strategies for Critical Systems

MaGe Linux Operations

Jul 14, 2020 · Operations

How Keepalived Enables High-Availability Load Balancing with VRRP

Keepalived, originally designed for LVS load balancing, provides VRRP-based high‑availability by managing LVS nodes, performing health checks, and offering failover for services like Nginx, HAProxy, and MySQL, while also addressing split‑brain scenarios and non‑preemptive configurations.

KeepalivedOperationsVRRP

0 likes · 10 min read

How Keepalived Enables High-Availability Load Balancing with VRRP

Java Architecture Diary

Jun 8, 2020 · Backend Development

Enable Adaptive Cluster Topology Refresh in Spring Boot 2.3 for Seamless Redis Failover

This article demonstrates how to set up a Redis cluster, connect it with Spring Boot 2.3 using Lettuce, simulate a node failure, and configure Spring Boot's adaptive topology refresh to achieve automatic failover without application downtime.

Adaptive RefreshRedis ClusterSpring Boot

0 likes · 9 min read

Enable Adaptive Cluster Topology Refresh in Spring Boot 2.3 for Seamless Redis Failover

Top Architect

Apr 14, 2020 · Databases

Designing a High‑Availability Redis Service with Sentinel

This article explains how to build a highly available Redis service by analyzing failure scenarios, comparing single‑instance, master‑slave with one or multiple Sentinel processes, and finally presenting a three‑Sentinel architecture that ensures continuous service despite node or network outages.

High AvailabilityRedisSentinel

0 likes · 11 min read

Designing a High‑Availability Redis Service with Sentinel

21CTO

Apr 6, 2020 · Operations

How Alipay Achieved Near‑Zero Downtime with Multi‑Datacenter Failover Architecture

This article explains the evolution of Alipay's high‑availability and disaster‑recovery architecture—from a simple single‑datacenter design to a multi‑datacenter, unit‑based system with failover and blue‑green deployment—highlighting the challenges, solutions, and operational benefits that enable continuous service during massive traffic spikes.

Alipay architectureBlue-Green DeploymentDisaster Recovery

0 likes · 17 min read

How Alipay Achieved Near‑Zero Downtime with Multi‑Datacenter Failover Architecture

dbaplus Community

Mar 22, 2020 · Backend Development

Designing Multi‑Data‑Center Redis Cache with Strong Consistency and Failover

This article walks through the evolution of a Redis‑based cache layer for multi‑data‑center deployments, addressing consistency, safety, performance, disk‑space, data loops, timestamp versioning, master‑slave failover, and global numeric aggregation, and culminates in a ready‑to‑use middleware solution.

Cache consistencyLogical ClockRedis

0 likes · 19 min read

Designing Multi‑Data‑Center Redis Cache with Strong Consistency and Failover

Architecture Digest

Feb 23, 2020 · Operations

Configuring Keepalived for High Availability with Nginx Load Balancing

This guide explains how to install Keepalived, configure VRRP‑based high‑availability for Nginx load balancers, modify master and backup configuration files, test failover scenarios, and add a Bash watchdog script to ensure seamless service continuity.

KeepalivedVRRPfailover

0 likes · 8 min read

Configuring Keepalived for High Availability with Nginx Load Balancing

Big Data Technology Architecture

Feb 11, 2020 · Databases

JDHBase Multi‑Active Architecture and Asynchronous Replication Practices

This article describes JDHBase’s large‑scale KV storage architecture, its HBase‑based asynchronous replication mechanism, multi‑active cluster design, client‑side routing via Fox Manager, automatic failover strategies, dynamic replication tuning, and serial replication techniques to ensure data consistency across geographically distributed data centers.

Distributed storageDynamic TuningHBase Replication

0 likes · 12 min read

JDHBase Multi‑Active Architecture and Asynchronous Replication Practices

Java High-Performance Architecture

Dec 17, 2019 · Backend Development

Understanding Kafka Topic Architecture: Partitions, Replication, and Failover

This article explains Kafka's topic architecture, detailing how topics are split into partitions for scalability and parallelism, the role of logs, key-based and round-robin partitioning, replication with leaders, followers, ISR, and how these mechanisms enable fault‑tolerance and high‑performance consumer failover.

PartitionTopicbackend

0 likes · 7 min read

Understanding Kafka Topic Architecture: Partitions, Replication, and Failover

dbaplus Community

Dec 11, 2019 · Databases

How Alibaba Scales HBase for High Availability: 10‑Year Lessons from Production

This article reviews Alibaba's decade‑long evolution of HBase high‑availability, covering large‑cluster design, MTTF/MTTR metrics, disaster‑recovery strategies, traffic switching, and performance optimizations that together enable millions of requests per second with near‑zero downtime.

Alibaba CloudHBaseHigh Availability

0 likes · 21 min read

How Alibaba Scales HBase for High Availability: 10‑Year Lessons from Production

360 Zhihui Cloud Developer

Jul 30, 2019 · Databases

How QiYun Enhances OpenStack Trove for Seamless Master‑Slave Database Deployment

This article explains OpenStack Trove’s role as a Database-as-a-Service platform, outlines its core components, and details QiYun’s custom enhancements—including automated backup, monitoring, and a streamlined single-API master-slave instance creation with isolated networks and VIP-based failover for improved security and availability.

Cloud ComputingDatabase-as-a-ServiceMaster‑Slave

0 likes · 5 min read

How QiYun Enhances OpenStack Trove for Seamless Master‑Slave Database Deployment

58 Tech

Jul 8, 2019 · Databases

Design and Implementation of WMHA: A Modified MySQL High‑Availability Solution

This article explains the need for high‑availability MySQL services, critiques the original in‑house HA approach, and details how the mature MHA framework was extended into WMHA with added VIP monitoring, enhanced failover procedures, richer notifications, and a reorganized deployment structure to improve reliability and reduce DBA intervention.

Database operationsHigh AvailabilityMHA

0 likes · 9 min read

Design and Implementation of WMHA: A Modified MySQL High‑Availability Solution

Big Data Technology & Architecture

Jun 13, 2019 · Fundamentals

Comparison of Kafka and Pulsar Stream Consumption Models and Rebalance Mechanisms

The article explains Kafka's consumer‑group rebalance and Pulsar's unified queue/stream subscription models, compares their partition assignment strategies, and demonstrates both with Docker‑based Pulsar setups, Java consumer code, and practical failover and exclusive scenarios.

Consumer GroupPulsarRebalance

0 likes · 6 min read

Comparison of Kafka and Pulsar Stream Consumption Models and Rebalance Mechanisms

MaGe Linux Operations

Mar 8, 2019 · Operations

Mastering High‑Availability Clusters: Resources, Constraints, and Failure Handling

This article explains the principles and components of high‑availability (HA) clusters, covering active/standby nodes, resource stickiness and constraints, heartbeat and quorum mechanisms, split‑brain avoidance, failure detection methods, and the minimal setup required for a reliable web‑service HA deployment.

ClusteringHigh AvailabilityOperations

0 likes · 14 min read

Mastering High‑Availability Clusters: Resources, Constraints, and Failure Handling

UC Tech Team

Oct 23, 2018 · Operations

Understanding Faults and Fault Isolation Strategies in Distributed Systems

The article explains what constitutes a fault, introduces key metrics such as RPO and RTO, and describes various fault isolation principles, patterns, and practical examples—including dependency degradation, failover, dynamic adjustment, fast‑fail, caching, rate limiting, and resource isolation—to improve system reliability.

OperationsRPORTO

0 likes · 14 min read

Understanding Faults and Fault Isolation Strategies in Distributed Systems

Qunar Tech Salon

Jul 13, 2018 · Operations

Automated Network Failure Detection and Intelligent Switching System at Qunar

This article describes Qunar's automated network outage detection and intelligent traffic switching system, detailing the problem background, solution architecture, component functions, workflow, optimization steps, and future plans for more precise, multi‑level failover handling.

AI OpsDNSMonitoring

0 likes · 10 min read

Automated Network Failure Detection and Intelligent Switching System at Qunar

ITPUB

Jun 22, 2018 · Databases

How to Build a Highly Available Redis Service with Sentinel and Virtual IP

This article explains how to design and implement a highly available Redis deployment using master‑slave replication, multiple Redis Sentinel instances, and a virtual IP to provide seamless failover while maintaining simple client connectivity, covering failure scenarios, architecture choices, and practical configuration tips.

High AvailabilityRedisSentinel

0 likes · 12 min read

How to Build a Highly Available Redis Service with Sentinel and Virtual IP

21CTO

May 9, 2018 · Operations

How Alipay Built Seamless High Availability and Disaster Recovery for Millions of Transactions

This article examines Alipay's evolution from a simple single‑datacenter setup to a multi‑active‑active, unit‑based architecture, detailing the technical challenges of high availability, disaster recovery, failover design, blue‑green deployment, and how these solutions enable continuous service during massive traffic spikes like Double 11.

AlipayBlue-Green DeploymentDisaster Recovery

0 likes · 17 min read

How Alipay Built Seamless High Availability and Disaster Recovery for Millions of Transactions

Architecture Digest

May 9, 2018 · Operations

High Availability and Disaster Recovery Architecture: The Evolution of Alipay’s System Design

This article examines the importance of high‑availability and disaster‑recovery architectures, tracing Alipay’s evolution from a simple load‑balanced setup through multi‑datacenter, failover, and unit‑based designs that address scalability, data consistency, and continuous service delivery challenges.

Disaster RecoveryHigh Availabilitydistributed systems

0 likes · 16 min read

High Availability and Disaster Recovery Architecture: The Evolution of Alipay’s System Design

ITPUB

Apr 14, 2018 · Databases

Designing a Highly Available Redis Service with Sentinel and Multi‑Sentinel Architecture

This article explains how to define high availability for Redis, enumerates typical failure scenarios, compares four deployment patterns—from a single instance to a three‑sentinel setup—and provides practical steps, diagrams, and tips for achieving reliable Redis service using Sentinel and virtual IP failover.

RedisSentinelarchitecture

0 likes · 14 min read

Designing a Highly Available Redis Service with Sentinel and Multi‑Sentinel Architecture

Architecture Digest

Apr 5, 2018 · Databases

Designing a Highly Available Redis Service Using Sentinel

This article explains how to build a highly available Redis deployment by defining HA requirements, analyzing failure scenarios, and progressively implementing solutions from a single instance to a three‑sentinel architecture with virtual IP failover for seamless client access.

High AvailabilitySentinelfailover

0 likes · 11 min read

Designing a Highly Available Redis Service Using Sentinel

Architecture Digest

Mar 29, 2018 · Databases

Designing a High‑Availability Redis Service with Sentinel

This article explains how to build a highly available Redis deployment using Redis Sentinel, compares several architectural options, and details the final three‑sentinel design that tolerates node, process, and network failures while keeping client access simple.

High AvailabilitySentinelfailover

0 likes · 12 min read

Architecture Digest

Dec 27, 2017 · Backend Development

Handling Transactions, Failover, and Exactly‑Once Semantics in Distributed Systems

This article explores how distributed systems determine node liveness, manage failover and recovery, and implement at‑most‑once, at‑least‑once, and exactly‑once processing guarantees—including opaque transactions and two‑phase commit—using examples from Kafka, Zookeeper, and big‑data pipelines.

Big DataExactly-onceTransaction

0 likes · 15 min read

Handling Transactions, Failover, and Exactly‑Once Semantics in Distributed Systems

MaGe Linux Operations

Dec 21, 2017 · Operations

Mastering High Availability Clusters: Key Concepts, Resource Management, and Failure Handling

This article explains how high‑availability (HA) clusters provide redundancy for directors, RS‑servers, databases and storage, covering active‑passive node roles, resource stickiness, constraints, quorum voting, split‑brain avoidance, failure detection methods, and essential configuration tips.

High AvailabilityOperationsResource Management

0 likes · 12 min read

Mastering High Availability Clusters: Key Concepts, Resource Management, and Failure Handling

JD Retail Technology

Oct 16, 2017 · Databases

Design and Evolution of JD Elastic Database: Architecture, Sharding, and Automatic Failover

This article details the evolution of JD's Elastic Database, describing the challenges of scaling MySQL, the staged solutions including sharding, JProxy, and the final elastic architecture with services like Topology, JED‑Gate, and JED‑Tablet, and explains its query processing, dynamic resharding, and automatic failover mechanisms.

DatabasesElastic ArchitectureQuery Processing

0 likes · 11 min read

Design and Evolution of JD Elastic Database: Architecture, Sharding, and Automatic Failover

Architecture Digest

Jun 16, 2017 · Databases

Redis High‑Availability Architecture and Best Practices

This article explains Redis fundamentals, details the Sentinel mechanism, compares several high‑availability deployment patterns—including Sentinel with DNS or VIP, client‑direct connections, Keepalived/Haproxy, Redis Cluster, Twemproxy, and Codis—provides their advantages and drawbacks, and offers practical best‑practice recommendations for reliable production use.

Database ArchitectureRedisSentinel

0 likes · 12 min read

Redis High‑Availability Architecture and Best Practices

ITPUB

May 24, 2017 · Databases

How to Build a Redis High‑Availability Cluster with Sentinel and VIP

This guide walks through setting up a Redis high‑availability solution using master‑slave replication, Redis Sentinel for automatic failover, and a floating VIP to provide a stable endpoint, covering environment preparation, configuration files, firewall rules, testing, and client integration.

High AvailabilityLinuxSentinel

0 likes · 10 min read

How to Build a Redis High‑Availability Cluster with Sentinel and VIP

Architecture Digest

May 22, 2017 · Databases

Building a High‑Availability Redis System with Sentinel and VIP

This guide demonstrates how to configure a highly available Redis deployment using master‑slave replication, Redis Sentinel for automatic failover, and virtual IP (VIP) migration, covering environment setup, configuration files, firewall adjustments, testing procedures, and client connection strategies.

RedisSentineldatabase

0 likes · 11 min read

Building a High‑Availability Redis System with Sentinel and VIP

dbaplus Community

Mar 9, 2017 · Databases

Why Redis Redlock May Not Be Safe: A Deep Dive into the Redlock Debate

An in‑depth review of the heated debate between Redis creator antirez and distributed‑systems expert Martin Kleppmann over the safety of Redis’s Redlock algorithm, covering single‑node lock pitfalls, failover issues, timing assumptions, fencing tokens, and practical recommendations for when to use Redlock versus simpler locks.

Distributed LockRedisRedlock

0 likes · 25 min read

Why Redis Redlock May Not Be Safe: A Deep Dive into the Redlock Debate

MaGe Linux Operations

Dec 26, 2016 · Databases

Mastering MySQL High Availability with MHA: Step‑By‑Step Setup Guide

This article introduces MHA (Master High Availability) for MySQL, explains its architecture, outlines required hardware and software configurations, provides detailed commands to set up master and slave nodes, create configuration files, and demonstrates how to start and verify the high‑availability cluster.

High AvailabilityLinuxMHA

0 likes · 8 min read

Mastering MySQL High Availability with MHA: Step‑By‑Step Setup Guide

360 Zhihui Cloud Developer

Nov 17, 2016 · Operations

Why Large Redis Instances Cause Disasters and How to Prevent Them

This article examines the operational challenges of oversized Redis instances—including slow failover, prolonged slave resynchronization, network‑induced avalanches, and persistence blocking—and offers practical mitigation strategies such as key expiration, data compression, and using high‑performance alternatives like Pika.

Database operationsMemory ManagementPerformance Optimization

0 likes · 9 min read

Why Large Redis Instances Cause Disasters and How to Prevent Them

dbaplus Community

Nov 4, 2016 · Databases

Mastering Oracle Data Guard: Semi‑Automated Setup, DG Broker, Failover & Migration Tips

This article walks through semi‑automated Oracle Data Guard deployment, when and how to use DG Broker, practical failover, switchover and archive‑recovery scenarios, Oracle 12c enhancements like Far Sync and VALIDATE, a real‑world standby query failure case, and using Data Guard for database migration.

12cDG BrokerData Guard

0 likes · 16 min read

Mastering Oracle Data Guard: Semi‑Automated Setup, DG Broker, Failover & Migration Tips

ITPUB

Oct 28, 2016 · Databases

Step‑by‑Step Oracle Data Guard Switchover and Failover Guide

This article provides a detailed, hands‑on walkthrough of Oracle Data Guard switchover in normal operation and the subsequent steps to convert the original primary to a standby, including all necessary SQL commands, instance restarts, and verification queries.

Data GuardOracleSQL

0 likes · 6 min read

Step‑by‑Step Oracle Data Guard Switchover and Failover Guide

dbaplus Community

Aug 23, 2016 · Databases

How to Install, Configure, and Test MaxScale for MySQL Read/Write Splitting and Failover

This guide walks through setting up a MySQL master‑slave cluster, installing MaxScale, configuring authentication, monitoring, routing and logging plugins, testing read/write split and load balancing, and handling single‑ or multiple‑slave failures with automatic failover.

ConfigurationDatabase ProxyMaxScale

0 likes · 10 min read

How to Install, Configure, and Test MaxScale for MySQL Read/Write Splitting and Failover

Java High-Performance Architecture

Aug 17, 2016 · Databases

How to Build a High-Availability MySQL Cluster with MHA: Step‑by‑Step Guide

This tutorial walks through setting up a MySQL master‑slave replication cluster, configuring password‑less SSH, installing MHA‑node and MHA‑manager, creating the MHA configuration, validating the setup, and testing automatic failover when the master goes down.

High AvailabilityLinuxMHA

0 likes · 7 min read

How to Build a High-Availability MySQL Cluster with MHA: Step‑by‑Step Guide

Java High-Performance Architecture

Aug 16, 2016 · Databases

How MaxScale Handles MySQL Slave Failures and Automatic Failover

This article demonstrates how MaxScale manages MySQL read/write splitting when one or both slave servers fail, showing log configurations, state changes, and how to configure a stable master to maintain service continuity even when all slaves are down.

Database ProxyHigh AvailabilityMaxScale

0 likes · 6 min read

How MaxScale Handles MySQL Slave Failures and Automatic Failover

Architecture Digest

Aug 5, 2016 · Backend Development

Implementation Principles and Architecture of the Diamond Configuration Management System

The article explains Diamond, a simple, reliable, and easy‑to‑use distributed configuration management system used inside Taobao, detailing its features, persistence and disaster‑recovery mechanisms, overall architecture, client‑side subscription code, and the internal processes that keep configuration data synchronized.

Javabackendconfiguration management

0 likes · 10 min read

Implementation Principles and Architecture of the Diamond Configuration Management System

MaGe Linux Operations

Jul 31, 2016 · Databases

Mastering MySQL HA: How MHA Automates Failover and Online Master Switching

This article explains how MHA provides automated master monitoring, rapid failover within 10‑30 seconds, online master switching, various failover modes, extensible scripts, key commands, and best‑practice workflows to achieve high‑availability MySQL replication without performance impact.

AutomationHigh AvailabilityMHA

0 likes · 23 min read

Mastering MySQL HA: How MHA Automates Failover and Online Master Switching

dbaplus Community

Jul 29, 2016 · Databases

Mastering MySQL High Availability: MHA Failover and MaxScale Load Balancing

This guide walks through MySQL high‑availability architectures, comparing failover solutions like MMM and MHA, detailing MHA installation, configuration, and testing, and exploring MaxScale's read/write splitting, routing strategies, and integration with MHA for seamless failover.

High AvailabilityMHAMaxScale

0 likes · 11 min read

Mastering MySQL High Availability: MHA Failover and MaxScale Load Balancing

dbaplus Community

Jul 21, 2016 · Databases

How MHA Delivers Fast, Zero‑Data‑Loss MySQL High Availability

This article explains MHA’s architecture, failover workflow, comparison with other MySQL HA solutions, and its six key advantages, showing how it can switch masters within seconds while preserving data consistency without altering MySQL settings or adding many servers.

High AvailabilityMHAfailover

0 likes · 9 min read

How MHA Delivers Fast, Zero‑Data‑Loss MySQL High Availability

ITPUB

Jun 25, 2016 · Operations

Why Large Redis Deployments Fail: Failover, Scaling, and Memory Pitfalls

The article examines how oversized Redis instances cause catastrophic failures during primary node crashes, scaling bursts, and network issues, explains the costly re‑synchronization steps, presents real‑world timing data, and offers practical memory‑reduction strategies to keep Redis operations reliable.

Redisfailoverscaling

0 likes · 8 min read

Why Large Redis Deployments Fail: Failover, Scaling, and Memory Pitfalls

Practical DevOps Architecture

Jun 24, 2016 · Operations

Huawei Router Configuration for Automatic ISP Traffic Separation and Failover

This guide explains how to configure a Huawei router to automatically differentiate China Telecom and China Unicom traffic, route each to its respective ISP, and enable seamless failover to the Telecom line if the Unicom link fails, using NAT, ACLs, and policy routing.

ACLHuaweiNAT

0 likes · 10 min read

Huawei Router Configuration for Automatic ISP Traffic Separation and Failover

21CTO

May 8, 2016 · Databases

Which MySQL High‑Availability Architecture Is Right for You? A Comprehensive Guide

The article reviews common MySQL high‑availability solutions—including shared‑storage SAN, DRBD disk replication, keepalived/heartbeat, MHA, ZooKeeper‑based HA, Galera/PXC clusters, and proxy middleware—detailing their architectures, advantages, limitations, and suitability for different business and operational requirements.

HA ArchitectureHigh Availabilitycluster

0 likes · 19 min read

Which MySQL High‑Availability Architecture Is Right for You? A Comprehensive Guide

dbaplus Community

Apr 25, 2016 · Databases

How to Build a Reliable Dual‑Master MySQL HA with Keepalived and Shell Scripts

This article presents a practical dual‑master MySQL high‑availability solution using keepalived and custom shell scripts that reliably detect master health, perform graceful VIP failover, and safely switch back after repairs, while ensuring data consistency and minimal downtime.

Database operationsDual MasterHigh Availability

0 likes · 9 min read

How to Build a Reliable Dual‑Master MySQL HA with Keepalived and Shell Scripts

ITPUB

Apr 19, 2016 · Databases

Mastering SQL Server Log Shipping: Setup, Jobs, and Troubleshooting

This comprehensive guide explains how SQL Server log shipping works, details the roles of primary, secondary, and monitor servers, walks through each job type, discusses execution intervals and data‑loss implications, and provides step‑by‑step failover and troubleshooting procedures.

Backup JobsDisaster RecoveryLog Shipping

0 likes · 26 min read

Mastering SQL Server Log Shipping: Setup, Jobs, and Troubleshooting

21CTO

Mar 11, 2016 · Databases

How to Build Reliable MySQL HA: Replication, Monitoring, and Failover Strategies

This article explores practical MySQL high‑availability solutions, covering asynchronous and semi‑synchronous replication, monitoring with keepalived or Zookeeper, failover decision criteria, GTID and pseudo‑GTID techniques, and lessons learned from real‑world deployments.

GTIDHAPseudo GTID

0 likes · 13 min read

How to Build Reliable MySQL HA: Replication, Monitoring, and Failover Strategies

Efficient Ops

Mar 2, 2016 · Databases

How DBMP Automates MySQL Management and Cuts DBA Workload

This article explains why the DBMP platform was created to automate MySQL operations, describes its architecture and key features such as host management, instance groups, backup, slow‑query handling, and scheduled tasks, and outlines future optimization directions and common technical Q&A.

Database AutomationMonitoringbackup

0 likes · 14 min read

How DBMP Automates MySQL Management and Cuts DBA Workload

dbaplus Community

Oct 26, 2015 · Databases

Build a Two‑Node PostgreSQL HA Cluster with Streaming Replication and Dual VIPs

This guide explains how to create a high‑availability PostgreSQL cluster on two hosts using streaming replication, automatic failover and failback, dual virtual IPs, heartbeat monitoring, and stress testing, with full configuration scripts and practical test results.

HAPostgreSQLStreaming Replication

0 likes · 10 min read

Build a Two‑Node PostgreSQL HA Cluster with Streaming Replication and Dual VIPs

Architects' Tech Alliance

Sep 8, 2015 · Operations

Advanced Load Balancing and Link Failover for DDBoost

The article explains how to create an application‑level interface group for DDBoost to aggregate multiple Data Domain IP interfaces into a private network group, achieving load balancing, fault‑tolerant data transfer, and notes performance considerations such as avoiding mixed‑capacity links.

DDBoostData Domainfailover

0 likes · 3 min read

Advanced Load Balancing and Link Failover for DDBoost

Architect

Aug 31, 2015 · Databases

MySQL High Availability: Replication, Monitoring, and Failover Strategies

This article discusses MySQL high‑availability solutions, covering asynchronous and semi‑synchronous replication, monitoring with keepalived, Zookeeper, and custom agents, failover procedures using binlog positions, GTID and pseudo‑GTID techniques, and the author's practical experiences and future plans.

GTIDdatabasefailover

0 likes · 17 min read

MySQL High Availability: Replication, Monitoring, and Failover Strategies

Java High-Performance Architecture

Aug 23, 2015 · Databases

How Redis Sentinel Ensures Automatic Failover and High Availability

Redis Sentinel provides a high‑availability solution for Redis by continuously monitoring master and replica servers, automatically promoting a replica to master when the original master fails, and seamlessly handling failover and recovery to keep the system operational without manual intervention.

Sentineldatabasefailover

0 likes · 3 min read

How Redis Sentinel Ensures Automatic Failover and High Availability

Ctrip Technology

Oct 28, 2014 · Operations

Why Zookeeper Is Essential for Master/Slave High Availability in Distributed Systems

The article explains why Zookeeper is a crucial component for implementing master‑slave high‑availability architectures in distributed systems, detailing how temporary nodes, sequence numbers, and cluster coordination eliminate single points of failure and enable reliable failover for write services.

Master‑SlaveZookeeperfailover

0 likes · 6 min read

Why Zookeeper Is Essential for Master/Slave High Availability in Distributed Systems

Baidu Tech Salon

Apr 22, 2014 · Operations

Baidu's Optimization of MooseFS and Redis: Architecture Improvements and Performance Enhancement

At Baidu’s 49th Technical Salon, Cheng Yishi explained how the company revamped its MooseFS and Redis systems by adding a Shadow Master to split reads from writes, introducing Slave nodes for failover, and deploying a Redis proxy middleware, thereby dramatically improving performance, scalability, and high‑availability for critical services.

BaiduDistributed storageHigh Availability

0 likes · 6 min read

Baidu's Optimization of MooseFS and Redis: Architecture Improvements and Performance Enhancement