Tagged articles

Operations

3329 articles · Page 8 of 34

Aug 29, 2024 · Databases

Database Server Ops: Hardware, Tuning, Backup & Security Best Practices

This guide outlines comprehensive best practices for database server operations, covering hardware selection, OS and kernel tuning, storage choices, MySQL configuration, performance monitoring, backup strategies, security measures, high availability, automation, and systematic maintenance procedures to ensure optimal reliability and efficiency.

DatabasesOperationsbackup

0 likes · 7 min read

Database Server Ops: Hardware, Tuning, Backup & Security Best Practices

DevOps

Aug 28, 2024 · Operations

Observability: From Traditional Monitoring to Full‑Stack Observability in Modern SRE Practices

This article explains the concept of observability, contrasts it with traditional monitoring, outlines its benefits for system stability, reliability and performance, and provides practical guidance on building a full‑stack observability platform using logs, metrics, tracing and modern cloud‑native tools.

OperationsSREcloud-native

0 likes · 15 min read

Observability: From Traditional Monitoring to Full‑Stack Observability in Modern SRE Practices

JD Cloud Developers

Aug 27, 2024 · Cloud Computing

Deploy Black Myth: Wukong on the Cloud for Smooth Steam Streaming

This guide walks you through creating a cloud‑based service that bundles Black Myth: Wukong, the Steam client, and a remote desktop tool, detailing instance setup, remote configuration, streaming steps, and troubleshooting to achieve a seamless gaming experience.

CloudDeploymentGaming

0 likes · 9 min read

Deploy Black Myth: Wukong on the Cloud for Smooth Steam Streaming

Data Thinking Notes

Aug 25, 2024 · Operations

How Digital Transformation Architecture Shapes Modern Enterprises

This article outlines the background, overall framework, and platform construction of enterprise digital transformation, illustrating each component with detailed diagrams that guide organizations in planning and implementing comprehensive digital strategies to achieve competitive advantage.

Enterprise ArchitectureIT StrategyOperations

0 likes · 2 min read

How Digital Transformation Architecture Shapes Modern Enterprises

Open Source Linux

Aug 23, 2024 · Operations

10 Proven Ops Practices to Prevent System Failures

This article shares ten practical operations strategies—including change rollbacks, safe handling of destructive commands, prompt customization, rigorous backup and verification, production environment discipline, careful handovers, robust alerting, cautious automatic failover, meticulous checks, and simplicity—to dramatically improve system reliability and availability.

LinuxMySQLOperations

0 likes · 17 min read

10 Proven Ops Practices to Prevent System Failures

DevOps

Aug 22, 2024 · Operations

Synthetic Monitoring and Fault Drills: Practices for Ensuring Service Stability

This article explains why service stability is critical, outlines the importance and key factors of synthetic monitoring, provides practical guidelines for implementing it, and then describes fault‑drill concepts, benefits, processes, and common cloud‑native tools to proactively discover and mitigate failures in micro‑service environments.

Fault InjectionOperationsSynthetic Monitoring

0 likes · 11 min read

Synthetic Monitoring and Fault Drills: Practices for Ensuring Service Stability

MaGe Linux Operations

Aug 22, 2024 · Operations

Master Nginx Load Balancing: Upstream, Proxy Pass & Advanced Algorithms

Learn how to set up Nginx as a front‑end load balancer for web applications, define upstream servers and proxy_pass directives, and apply round‑robin, least‑connected, ip‑hash, weight, timeout, and backup server options to optimize traffic distribution and reliability.

NginxOperationsbackend

0 likes · 12 min read

Master Nginx Load Balancing: Upstream, Proxy Pass & Advanced Algorithms

IT Services Circle

Aug 21, 2024 · Operations

Analysis of NetEase Cloud Music Outage on August 19: Infrastructure Failure and Operational Lessons

On August 19, NetEase Cloud Music suffered a severe infrastructure‑related outage that prevented user login, playlist loading, and song search, prompting a two‑hour recovery effort, a brief free‑membership compensation, and highlighting the critical role of proper change management, gray releases, disaster recovery, and cross‑functional coordination in large‑scale services.

Disaster RecoveryNetEase Cloud MusicOperations

0 likes · 6 min read

Analysis of NetEase Cloud Music Outage on August 19: Infrastructure Failure and Operational Lessons

Ops Development Stories

Aug 21, 2024 · Operations

How Large Language Models Can Transform Ops Fault Handling: A Practical Guide

This article outlines a typical operations incident workflow, identifies four key stages where large language models can assist, discusses implementation challenges, introduces the Ops framework and Copilot design, and shares practical examples and a real‑world case to help engineers adopt AI‑driven fault management.

AI OpsAutomationIncident Management

0 likes · 19 min read

How Large Language Models Can Transform Ops Fault Handling: A Practical Guide

Tencent Cloud Developer

Aug 20, 2024 · Backend Development

Why Caching Is the Secret Weapon for High‑Performance Search Engines

This article analyzes real‑world search query characteristics, breaks down a typical search system architecture, classifies cacheable data, compares result‑level, intermediate‑value and multi‑layer caches, discusses update, prefetch and placement strategies, and highlights common pitfalls such as cache miss, consistency, and resource overhead.

Cache StrategiesCachingOperations

0 likes · 19 min read

Why Caching Is the Secret Weapon for High‑Performance Search Engines

Data Thinking Notes

Aug 19, 2024 · Operations

How to Build an Effective Data Metric System for Business Success

This article explains what a data metric system is, why it’s essential for organizations, the stages of building it, required resources, organizational alignment, and a step‑by‑step path to create a robust, data‑driven indicator framework that supports product development, operations, and strategic decision‑making.

Business AnalyticsData-DrivenIndicator System

0 likes · 17 min read

How to Build an Effective Data Metric System for Business Success

Top Architecture Tech Stack

Aug 19, 2024 · Operations

Analysis of NetEase Cloud Music Outage: Causes and Data‑Center Migration Challenges

On August 19 the NetEase Cloud Music service suffered a major outage that was traced to a complex migration of its Hangzhou data center to Guizhou, highlighting large‑scale operational risks, technical debt, and strict continuity constraints for high‑traffic internet platforms.

Cloud ComputingData Center MigrationNetEase Cloud Music

0 likes · 6 min read

Analysis of NetEase Cloud Music Outage: Causes and Data‑Center Migration Challenges

Qunhe Technology Quality Tech

Aug 16, 2024 · Artificial Intelligence

How FastGPT Transforms Ticket Handling and Boosts Efficiency by 90%

This article examines the pain points of a custom ticket system, introduces FastGPT’s knowledge‑base and query capabilities, outlines integration architecture and concrete features, and shows how the combined solution reduces ticket resolution time dramatically while improving overall operational efficiency.

AIFastGPTOperations

0 likes · 10 min read

How FastGPT Transforms Ticket Handling and Boosts Efficiency by 90%

Java Backend Technology

Aug 16, 2024 · Operations

Why Did My Kubernetes Pod Trigger 61 GC Events? A Step‑by‑Step Debugging Guide

The author recounts a sudden CPU spike on a Kubernetes pod caused by excessive JVM garbage collection, walks through step‑by‑step diagnostics using top, thread inspection, jstack, and network file transfer, identifies a flawed Excel export loop, and shares the fix and lessons learned.

GCJVMJava performance

0 likes · 7 min read

Why Did My Kubernetes Pod Trigger 61 GC Events? A Step‑by‑Step Debugging Guide

21CTO

Aug 15, 2024 · Operations

Why GitHub’s Massive Outage Happened: Database Infrastructure Rollback Explained

A detailed account of GitHub’s recent worldwide outage reveals that a rollback of database infrastructure changes caused widespread service failures across GitHub.com, Pages, Copilot, and the API, highlighting the challenges of stateful database reliability in large platforms.

GitHubIncident ManagementOperations

0 likes · 4 min read

Why GitHub’s Massive Outage Happened: Database Infrastructure Rollback Explained

Open Source Linux

Aug 13, 2024 · Operations

Complete Guide to Operations Automation Scripts and Directory Structure

This article outlines a comprehensive set of automated operations scripts, including baseline checks, service monitoring, Docker and Kubernetes maintenance, security inspections, and a well‑organized directory layout with roles, system, network, database, application, security, automation, and infrastructure sections.

AnsibleAutomationCloud

0 likes · 6 min read

Complete Guide to Operations Automation Scripts and Directory Structure

Zhuanzhuan Tech

Aug 7, 2024 · Operations

Building a Dynamic Grafana Dashboard for Push System TraceId Visualization

This article describes how to use Grafana's Flowcharting plugin and Prometheus metrics to create a dynamic, interactive dashboard that visualizes each logical node of a push notification pipeline, enabling rapid trace‑ID based troubleshooting and reducing manual investigation effort.

Dynamic viewGrafanaOperations

0 likes · 11 min read

Building a Dynamic Grafana Dashboard for Push System TraceId Visualization

Practical DevOps Architecture

Aug 7, 2024 · Operations

How to Delete Old Elasticsearch Indices Using Shell Scripts

This guide explains how to identify and remove outdated Elasticsearch indices by listing shards, filtering target indices, deleting them with a shell loop, and automating the process with a scheduled cron job, helping keep ELK performance optimal.

ELKElasticsearchIndex management

0 likes · 3 min read

How to Delete Old Elasticsearch Indices Using Shell Scripts

ITPUB

Aug 5, 2024 · Operations

Do You Really Need Kubernetes? Real‑World Opinions and Practical Tips

A collection of Zhihu answers debates whether adopting Kubernetes is necessary, presenting viewpoints from developers and ops leaders, highlighting cost, complexity, operational benefits, deployment commands, and practical considerations for small and large scale projects.

KubernetesOperationscontainerization

0 likes · 10 min read

Do You Really Need Kubernetes? Real‑World Opinions and Practical Tips

Liangxu Linux

Aug 1, 2024 · Operations

Essential Operations Metrics Every IT Team Should Track

This guide outlines key operational metrics—availability, failure rate, MTTR, MTBF, response time, throughput, error rate, capacity utilization, latency, data integrity, and more—explaining their calculations, typical benchmark values, and practical application areas to help organizations monitor and improve IT performance.

MTTROperationsavailability

0 likes · 6 min read

Essential Operations Metrics Every IT Team Should Track

Open Source Linux

Aug 1, 2024 · Operations

Top 10 Essential Ops Tools Every Engineer Should Master

This article introduces ten indispensable tools for operations engineers, detailing each tool's functionality, ideal use cases, key advantages, and practical examples, while also providing code snippets and visual illustrations to help readers understand and apply them effectively.

AutomationOperationsconfiguration management

0 likes · 8 min read

Top 10 Essential Ops Tools Every Engineer Should Master

Efficient Ops

Jul 31, 2024 · Operations

How Changan Auto Achieved Leading‑Edge DevOps Certification in China and Internationally

The article details China's 2024‑2027 IT standards action plan, CAICT's dual ITU and domestic DevOps assessment, Changan Automobile's Gaia platform passing both certifications, and insights from senior engineers on the benefits, implementation challenges, and future roadmap of their DevOps transformation.

Changan AutoOperationsStandardization

0 likes · 15 min read

How Changan Auto Achieved Leading‑Edge DevOps Certification in China and Internationally

FunTester

Jul 31, 2024 · Cloud Native

Improving Test Environment Stability with Containerized One-Box and Soft‑Isolation Solutions

The article analyzes why test environments are inherently less stable than production, identifies frequent changes as the root cause, and proposes two container‑based approaches—One‑Box for small services and soft isolation for large microservice systems—plus automated health and business inspections to achieve reasonable, cost‑effective stability.

Operationscloud-nativecontainerization

0 likes · 13 min read

Improving Test Environment Stability with Containerized One-Box and Soft‑Isolation Solutions

58 Tech

Jul 29, 2024 · Databases

HBase Cloud Migration: Architecture, Challenges, and Solutions

This technical report details the background, architecture, construction, core issues, migration plans, and future roadmap of moving 58's HBase clusters to a cloud‑native environment, highlighting cost reduction, operational automation, and performance optimizations.

Big DataCloud MigrationDatabases

0 likes · 22 min read

HBase Cloud Migration: Architecture, Challenges, and Solutions

DataFunSummit

Jul 28, 2024 · Product Management

From 1 to N: Building and Maintaining a Tag System – Common Issues and Solutions

This article outlines the three essential steps for scaling a tag system from initial deployment to full maturity, highlights typical challenges such as incomplete functionality, business system integration, and permission management, and provides practical solutions and best‑practice recommendations for each stage.

Data GovernanceOperationsProduct Management

0 likes · 6 min read

From 1 to N: Building and Maintaining a Tag System – Common Issues and Solutions

dbaplus Community

Jul 28, 2024 · Operations

A Day in the Life of a Linux Ops Engineer: Real Stories and Practical Tips

This article compiles several Zhihu users' candid accounts of a typical Linux operations day, highlighting constant interruptions, emergency firefighting, performance tuning, monitoring, tool development, and a balanced time‑allocation strategy to make ops work more efficient and sustainable.

LinuxOperationsPerformanceTuning

0 likes · 11 min read

A Day in the Life of a Linux Ops Engineer: Real Stories and Practical Tips

Software Development Quality

Jul 27, 2024 · Operations

Mastering Quality Operations: Key KPIs, Data Collection & Strategic Alignment

This article explains the concept of quality operations, outlines its main components, lists essential quality‑operation KPIs, describes how to collect and analyze KPI data, and shows how to align KPI metrics with overall business strategy.

KPIOperationsdata analysis

0 likes · 7 min read

Mastering Quality Operations: Key KPIs, Data Collection & Strategic Alignment

Efficient Ops

Jul 25, 2024 · Operations

FAW‑Volkswagen’s Dual DevOps Certification: Driving Digital Transformation

FAW‑Volkswagen successfully earned both ITU DevOps international certification and the domestic DevOps standard assessment for its R&D Efficiency Platform and Integrated Operations Platform, showcasing how standardized DevOps practices can accelerate digital transformation, improve delivery quality, and enhance operational efficiency in the automotive industry.

Case StudyOperationsStandardization

0 likes · 16 min read

FAW‑Volkswagen’s Dual DevOps Certification: Driving Digital Transformation

JD Tech Talk

Jul 25, 2024 · Backend Development

Design and Architecture of JD.com’s Buffalo Distributed DAG Scheduling System

The article details the design, core technical solutions, high‑availability architecture, performance optimizations, and open capabilities of Buffalo, JD.com’s distributed DAG‑based job scheduling platform that supports massive task volumes, complex dependencies, and flexible resource management.

DAGDistributed SchedulingOperations

0 likes · 13 min read

Design and Architecture of JD.com’s Buffalo Distributed DAG Scheduling System

Soul Technical Team

Jul 23, 2024 · Big Data

Kafka Stability Challenges and Governance Framework at Soul

This article analyzes the role, application scenarios, stability challenges, and comprehensive governance framework of Apache Kafka at Soul, covering deployment, configuration, monitoring, standard controls, common misuse, and future directions toward cloud‑native solutions.

KafkaOperationsStability

0 likes · 30 min read

Kafka Stability Challenges and Governance Framework at Soul

Efficient Ops

Jul 22, 2024 · Operations

Mastering Ansible: Core Concepts, Architecture, and Essential Commands

This article introduces Ansible as an open‑source automation tool, explains its declarative, abstract and idempotent characteristics, shows how to install it with pip, outlines its core architecture components, describes its working principles, and provides usage examples for its seven main commands.

AnsibleAutomationOperations

0 likes · 8 min read

Mastering Ansible: Core Concepts, Architecture, and Essential Commands

MaGe Linux Operations

Jul 22, 2024 · Operations

Master Docker: Essential Commands for Images, Containers, and Management

This guide explains the key Docker CLI commands—including image listing, pulling, saving, loading, removing, running, starting, stopping, and inspecting containers—providing clear examples and output to help you efficiently manage Docker images and containers.

Operationsimage

0 likes · 5 min read

Master Docker: Essential Commands for Images, Containers, and Management

Architecture and Beyond

Jul 21, 2024 · Operations

Mastering Backend Stability: 7 Essential Practices for High Availability

This comprehensive guide outlines the seven key pillars—operations, high‑availability architecture, capacity governance, change management, risk governance, fault management, and chaos engineering—that together form a systematic approach to building and maintaining a reliable, 24‑hour backend system.

Change ManagementHigh AvailabilityOperations

0 likes · 40 min read

Mastering Backend Stability: 7 Essential Practices for High Availability

ITPUB

Jul 19, 2024 · Information Security

Why Did a CrowdStrike Update Trigger a Global Windows Blue Screen Crisis?

A sudden worldwide surge of Windows Blue Screen of Death incidents on July 1, linked to a CrowdStrike security‑agent update, crippled Microsoft 365 services, disrupted airlines and highlighted the far‑reaching impact of a single software change on global IT stability.

Blue ScreenCrowdStrikeMicrosoft

0 likes · 6 min read

Why Did a CrowdStrike Update Trigger a Global Windows Blue Screen Crisis?

JD Tech Talk

Jul 19, 2024 · Mobile Development

Mobile Application Development Practices and Considerations for Supply Chain Logistics

This article examines the characteristics of mobile application development for supply‑chain logistics, covering terminal framework selection, operations‑backend design, backend service architecture, scenario‑driven advantages, user‑experience pitfalls, and future trends such as 5G, IoT, and generative AI.

AIIoTOperations

0 likes · 23 min read

Mobile Application Development Practices and Considerations for Supply Chain Logistics

NetEase Cloud Music Tech Team

Jul 17, 2024 · Operations

How NetEase Cloud Music Automated Massive Service Upgrades with a Custom Platform

This article presents a comprehensive case study of NetEase Cloud Music's automatic upgrade platform, detailing the background challenges, technical architecture, sidecar versus component upgrades, workflow orchestration, operational safeguards, performance metrics, and future roadmap for large‑scale microservice migrations.

AutomationCI/CDOperations

0 likes · 17 min read

How NetEase Cloud Music Automated Massive Service Upgrades with a Custom Platform

Continuous Delivery 2.0

Jul 17, 2024 · Operations

Design Principles of Deployment Pipelines

The article explains the core concept of deployment pipelines in Continuous Delivery 2.0, outlines essential quality‑gate mechanisms, and details five design principles—build once, loose coupling, parallelization, fast feedback, and important feedback—plus team collaboration disciplines such as immediate pause and security audit.

Deployment PipelineOperationsQuality Gate

0 likes · 8 min read

Design Principles of Deployment Pipelines

Open Source Linux

Jul 17, 2024 · Operations

Simplify Java Project Build and Deployment with Jpom – A Lightweight Jenkins Alternative

Jpom is a lightweight, low‑intrusion Java‑based tool that streamlines online building, automatic deployment, daily operations, and project monitoring, offering features like node management, SSH terminal, Docker handling, and easy installation, making it suitable for individuals and small enterprises.

CI/CDDockerJava

0 likes · 7 min read

Simplify Java Project Build and Deployment with Jpom – A Lightweight Jenkins Alternative

DevOps

Jul 16, 2024 · Product Management

Comprehensive IT Project Management Process: Product, Requirement, Development, Testing, Release, and Operations

This article provides a detailed overview of the end‑to‑end IT project management lifecycle, including product and requirement management, development and testing steps, version release procedures, and post‑release operations, offering practical guidance for teams to design and control their workflows.

OperationsProduct ManagementRelease

0 likes · 6 min read

Comprehensive IT Project Management Process: Product, Requirement, Development, Testing, Release, and Operations

Top Architect

Jul 16, 2024 · Operations

Jpom – Lightweight Java‑Based Online Build, Deployment, and Operations Tool

Jpom is a simple, low‑intrusion Java‑based platform that provides online project building, automatic deployment, daily operations, and monitoring features, offering node management, SSH terminal, Docker handling, and a one‑click installation process suitable for individuals and small enterprises.

JavaJpomOperations

0 likes · 9 min read

Jpom – Lightweight Java‑Based Online Build, Deployment, and Operations Tool

Top Architecture Tech Stack

Jul 16, 2024 · Cloud Native

Designing Fault‑Tolerant Microservices Architecture: Patterns and Practices

The article explains how to build reliable microservices by isolating failures, applying graceful degradation, change‑management, health checks, self‑healing, fallback caching, retry strategies, rate limiting, fast‑fail principles, circuit breakers, and failure‑testing to ensure high availability in distributed cloud‑native systems.

Operationscircuit breakercloud-native

0 likes · 14 min read

Designing Fault‑Tolerant Microservices Architecture: Patterns and Practices

Liangxu Linux

Jul 15, 2024 · Operations

Fix Docker ‘No Space Left on Device’ on VMware by Expanding LVM Partitions

When a VMware VM with a 200 GB system disk runs an 11 GB Docker service, it may report ‘no space left on device’ because the LVM logical volume for /var is only 1 GB, and the guide shows how to extend the relevant LVM volumes and resize the filesystems to resolve the issue.

DockerLVMLinux

0 likes · 7 min read

Fix Docker ‘No Space Left on Device’ on VMware by Expanding LVM Partitions

Software Development Quality

Jul 11, 2024 · Information Security

How to Implement Secure and Compliant Log Management Standards

This guide outlines the purpose, scope, principles, and detailed specifications for log management—including file naming, retention periods, content rules, security handling, and monitoring—to ensure reliable issue tracing, data safety, and regulatory compliance across all system development projects.

ComplianceOperationsdata retention

0 likes · 12 min read

How to Implement Secure and Compliant Log Management Standards

Efficient Ops

Jul 8, 2024 · Operations

How to Diagnose and Fix High CPU Usage in Java Data Platforms

This article walks through a real‑world incident where a data‑platform server showed near‑100% CPU usage, explains step‑by‑step investigation using top, pwdx, and jstack, identifies a time‑conversion utility as the root cause, and presents a streamlined script‑based solution that reduced CPU load by thirtyfold.

CPU optimizationJava performanceOperations

0 likes · 11 min read

How to Diagnose and Fix High CPU Usage in Java Data Platforms

Efficient Ops

Jul 7, 2024 · Operations

How Suzhou Bank’s Mobile Banking 5.0 Sets a New Standard for DevOps in Banking

Suzhou Bank’s Mobile Banking 5.0 platform, showcased at the 23rd GOPS Global Operations Conference, demonstrates how a unified micro‑service architecture, advanced security technologies, and a comprehensive DevOps platform can elevate development efficiency, meet international standards, and drive innovative financial services.

Operationscontinuous deliverydevops

0 likes · 4 min read

How Suzhou Bank’s Mobile Banking 5.0 Sets a New Standard for DevOps in Banking

ITPUB

Jul 7, 2024 · Operations

How to Migrate Your Databases After CentOS End‑of‑Life: Alternatives and Best Practices

The article explains the complete shutdown of CentOS, outlines viable alternative Linux distributions, and provides detailed guidance on planning and executing database migrations to ensure security, performance, and compatibility during the transition.

Alternative OSLinuxOperations

0 likes · 5 min read

How to Migrate Your Databases After CentOS End‑of‑Life: Alternatives and Best Practices

Test Development Learning Exchange

Jul 6, 2024 · Operations

10 Practical Python Automation Scripts for File Management, Web Scraping, Data Cleaning, and More

This article presents ten useful Python automation scripts covering file renaming, web page downloading, data cleaning, scheduled tasks, email sending, testing, database backup, log analysis, file compression, and document generation, each with clear explanations and ready‑to‑run code examples.

AutomationCodeExamplesOperations

0 likes · 7 min read

10 Practical Python Automation Scripts for File Management, Web Scraping, Data Cleaning, and More

MaGe Linux Operations

Jul 5, 2024 · Operations

Master Apache & Nginx Log Analysis with Powerful Bash Commands

This guide compiles essential Bash one‑liners for Apache and Nginx log files, showing how to list top IPs, count unique visitors, tally page hits, filter bots, and generate time‑based request statistics for effective web‑service monitoring.

NginxOperationsbash

0 likes · 17 min read

Master Apache & Nginx Log Analysis with Powerful Bash Commands

DevOps Operations Practice

Jul 4, 2024 · Operations

Building an Enterprise‑Level Monitoring System: Requirements, Technology Selection, Architecture, Implementation Steps, and Maintenance

This article provides a comprehensive guide to designing and deploying an enterprise‑grade monitoring system, covering requirement analysis, tool selection such as Prometheus and Zabbix, system architecture, step‑by‑step implementation, alerting, visualization, and ongoing maintenance to ensure reliable IT operations.

AlertingGrafanaOperations

0 likes · 7 min read

Building an Enterprise‑Level Monitoring System: Requirements, Technology Selection, Architecture, Implementation Steps, and Maintenance

MaGe Linux Operations

Jul 4, 2024 · Operations

Master Linux Syslog: Configure, Manage, and Rotate Logs Efficiently

This guide explains Linux syslog fundamentals, common log file locations, their purposes, the roles of syslogd and klogd, how to configure rsyslog, set up log rotation with logrotate, and deploy a centralized log server for multiple hosts.

LinuxOperationslogrotate

0 likes · 15 min read

Master Linux Syslog: Configure, Manage, and Rotate Logs Efficiently

Efficient Ops

Jul 3, 2024 · Operations

How Shanghai Stock Exchange Secured Dual DevOps International and Domestic Certification

The article details China's 2024‑2027 Information Standard Construction Action Plan, the launch of synchronized ITU DevOps international and domestic assessments, and how Shanghai Stock Exchange's website and app platform successfully passed both standards, highlighting the significance for national standardization and operational excellence.

ChinaInternational StandardsOperations

0 likes · 8 min read

How Shanghai Stock Exchange Secured Dual DevOps International and Domestic Certification

JD Cloud Developers

Jul 2, 2024 · Operations

How Large Language Models Are Transforming Modern IT Operations

From manual server management to automated scripts, AIOps, and ChatOps, this article traces the evolution of IT operations and demonstrates how large language models boost efficiency, enable intelligent assistants, automated diagnostics, and smart log analysis, aiming for rapid fault detection, localization, and resolution.

AIOpsAutomationChatOps

0 likes · 7 min read

How Large Language Models Are Transforming Modern IT Operations

DevOps Coach

Jun 30, 2024 · Operations

Effective Incident Mitigation and Recovery: Practical SRE Strategies

The article outlines SRE‑based incident mitigation and recovery practices, covering urgent mitigations, impact reduction, key metrics such as TTD, TTR, TBF, and detailed strategies for shortening detection and repair times, preventing fatigue, improving observability, and designing resilient systems.

Incident ManagementOperationsReliability

0 likes · 23 min read

Effective Incident Mitigation and Recovery: Practical SRE Strategies

Efficient Ops

Jun 28, 2024 · Operations

How China’s Agricultural Bank Achieved Dual DevOps Certification and Set a New Industry Benchmark

The Agricultural Bank of China’s Digital Twin Platform passed both the ITU DevOps international standard and the domestic DevOps Level‑3 Continuous Delivery assessment, highlighting China’s push for internationalized information standards and showcasing the broader rollout of synchronized DevOps evaluations across the nation.

ChinaCloud ComputingDigital Twin

0 likes · 7 min read

How China’s Agricultural Bank Achieved Dual DevOps Certification and Set a New Industry Benchmark

Efficient Ops

Jun 28, 2024 · Operations

How Shandong City Commercial Bank Alliance Earned Leading DevOps Dual‑Certification

The article details China’s 2024‑2027 Information Standard Construction Action Plan, the launch of synchronized ITU DevOps international and domestic assessments, and a case study of Shandong City Commercial Bank Alliance’s successful dual‑certification, highlighting interview insights, performance metrics, and the broader push for standards internationalization.

Cloud ComputingOperationsStandard Assessment

0 likes · 14 min read

How Shandong City Commercial Bank Alliance Earned Leading DevOps Dual‑Certification

Open Source Linux

Jun 28, 2024 · Operations

Mastering Incident Responsibility: Proven Tactics to Navigate Fault Discussions

This article outlines practical principles and communication techniques for assigning responsibility during system failures, emphasizing strategic questioning, ally‑building, moral positioning, and nuanced response methods to protect oneself while ensuring effective incident resolution.

Operationscommunicationfault handling

0 likes · 8 min read

Mastering Incident Responsibility: Proven Tactics to Navigate Fault Discussions

TAL Education Technology

Jun 27, 2024 · Cloud Native

Case Study: Integrating the AiFenxi BI Platform with Apache APISIX Gateway for Improved Performance and Stability

This case study details how the AiFenxi business intelligence platform integrated Apache APISIX as a high‑performance API gateway within Tencent Cloud TKE, addressing latency, scalability, and security challenges, and outlines the architectural changes, deployment steps, and resulting performance improvements.

API GatewayAPISIXBI platform

0 likes · 7 min read

Case Study: Integrating the AiFenxi BI Platform with Apache APISIX Gateway for Improved Performance and Stability

DevOps Coach

Jun 27, 2024 · Operations

How to Run Effective Incident Response Drills for Resilient Systems

This article explains why regular disaster role‑playing, systematic testing, and focused responder preparation are essential for building robust incident response capabilities and reducing operational risk in production environments.

OperationsResilienceSRE

0 likes · 7 min read

How to Run Effective Incident Response Drills for Resilient Systems

Open Source Linux

Jun 27, 2024 · Operations

Comprehensive Guide to Building a Resilient, High‑Performance Web Infrastructure

This guide outlines essential steps for creating a robust, high‑availability website architecture, covering domain acquisition, DNS management, CDN deployment, image caching, data center selection, monitoring, DDoS mitigation, redundancy, server configuration, database replication, testing environments, security practices, and operational tooling.

Cloud ServicesDDoS protectionOperations

0 likes · 12 min read

Comprehensive Guide to Building a Resilient, High‑Performance Web Infrastructure

Sanyou's Java Diary

Jun 24, 2024 · Operations

How Visualized Full‑Chain Log Tracing Transforms Complex Business Systems

This article explains a new visualized full‑chain log tracing solution that organizes business logs by logical flow, dynamically links them during execution, and provides a visual, searchable view of the entire business process, dramatically improving issue localization in large‑scale distributed systems.

ObservabilityOperationsbackend

0 likes · 26 min read

How Visualized Full‑Chain Log Tracing Transforms Complex Business Systems

Linux Cloud Computing Practice

Jun 24, 2024 · Operations

150 Essential Linux Commands Every Sysadmin Should Master

This comprehensive guide lists 150 indispensable Linux commands covering file management, system monitoring, networking, user administration, process control, and more, providing clear explanations to help both beginners and experienced administrators efficiently manage Linux environments.

OperationsShellUnix

0 likes · 25 min read

150 Essential Linux Commands Every Sysadmin Should Master

Software Development Quality

Jun 21, 2024 · Operations

Stabilizing Test Environments with a Trunk‑Based Strategy

This article outlines a comprehensive approach to improve test environment stability by introducing a trunk‑based environment as the default, detailing solution architecture, various testing scenarios, implementation steps, and monitoring practices to transition from unstable daily environments to a more reliable testing ecosystem.

DeploymentOperationsStability

0 likes · 14 min read

Stabilizing Test Environments with a Trunk‑Based Strategy

Architecture Digest

Jun 19, 2024 · Operations

Log Collection Solution: Filebeat + Graylog – Configuration and Deployment Guide

This article provides a comprehensive guide on building a unified log collection system using Filebeat and Graylog, covering the tools' concepts, configuration files, component functions, Docker deployment, and practical code examples for efficient log monitoring across multiple environments.

DockerELKGraylog

0 likes · 14 min read

Log Collection Solution: Filebeat + Graylog – Configuration and Deployment Guide

Alipay Experience Technology

Jun 19, 2024 · Backend Development

How Alipay’s “Mantiantianxing” Platform Boosts Development and Operations Efficiency

This article details how Alipay’s Mantiantianxing platform was designed and built to unify page construction, fine‑grained operation, and data feedback, thereby solving low R&D and operation efficiency, reducing duplication, and enabling rapid, scalable innovation across multiple product front‑ends and back‑ends.

FrontendOperationsPlatform

0 likes · 22 min read

How Alipay’s “Mantiantianxing” Platform Boosts Development and Operations Efficiency

Software Development Quality

Jun 19, 2024 · Operations

Best Practices for Test Data Management and Usage

This guide outlines comprehensive principles for generating, using, and cleaning test data across development, performance, and production environments, emphasizing independence, realism, security, proper permission controls, and systematic synchronization to ensure reliable and safe testing processes.

Data ManagementOperationssoftware testing

0 likes · 6 min read

Best Practices for Test Data Management and Usage

JD Tech Talk

Jun 17, 2024 · Cloud Computing

Cost Governance for Enterprise IT in the Cloud Era

This article examines how cloud computing has become central to enterprise IT architecture, explores its cost governance challenges, outlines industry trends, standards like ITIL and COBIT, and presents practical strategies—including FinOps, multi‑cloud platforms, and sustainable practices—to effectively manage and reduce IT costs.

Enterprise ArchitectureFinOpsIT cost governance

0 likes · 54 min read

Cost Governance for Enterprise IT in the Cloud Era

High Availability Architecture

Jun 14, 2024 · Operations

Evolution and Practice of Vivo CICD Artifact Management in DevOps

This article details the evolution of Vivo's CICD artifact management across four stages, explains its core functions such as multi‑type support, unified storage, promotion, security scanning, aging, and permission control, and outlines future directions toward smarter, more integrated, and secure DevOps operations.

Artifact ManagementCICDOperations

0 likes · 16 min read

Evolution and Practice of Vivo CICD Artifact Management in DevOps

IT Services Circle

Jun 13, 2024 · Operations

Configuring Docker Registry Mirrors in China to Overcome Image Pull Failures

This article explains how to resolve Docker image pull failures in China by editing the daemon.json file to add accessible domestic registry mirrors, providing step‑by‑step instructions and a ready‑to‑use mirror list for developers and operators.

DockerOperationscontainer

0 likes · 3 min read

Configuring Docker Registry Mirrors in China to Overcome Image Pull Failures

G7 EasyFlow Tech Circle

Jun 13, 2024 · Operations

Boost Service Availability: MTBF, MTTR, and Practical High‑Availability Tactics

This article explores how service availability is quantified, explains the impact of MTBF and MTTR on reliability, and presents concrete operational practices—including redundancy, traffic control, and change‑management techniques—to move systems from basic uptime to true high‑availability levels.

Change ManagementHigh AvailabilityMTBF

0 likes · 13 min read

Boost Service Availability: MTBF, MTTR, and Practical High‑Availability Tactics

Practical DevOps Architecture

Jun 13, 2024 · Operations

Comprehensive Data Center Operations Training Course Overview

This extensive training program covers everything a data center operations engineer needs—from foundational infrastructure management and server hardware maintenance to advanced network configuration, security hardening, monitoring, fault handling, and practical hands‑on skills for real‑world challenges.

Data CenterNetworkOperations

0 likes · 6 min read

Comprehensive Data Center Operations Training Course Overview

Qunar Tech Salon

Jun 12, 2024 · Artificial Intelligence

Design and Implementation of Qunar Flight Ticket Intelligent Alert (Radar) System

This article presents a comprehensive analysis and engineering of Qunar's flight‑ticket intelligent pre‑warning (Radar) system, covering the business need, value analysis, architectural redesign, feature extraction, indicator classification, accuracy quantification, multi‑algorithm anomaly detection, automatic parameter tuning, observed effects, and future plans to incorporate large‑model techniques.

Anomaly DetectionMachine LearningOperations

0 likes · 17 min read

Design and Implementation of Qunar Flight Ticket Intelligent Alert (Radar) System

Full-Stack DevOps & Kubernetes

Jun 12, 2024 · Operations

How to Bypass Dockerhub Mirror Outages with Alternative Registries

This guide explains why Dockerhub mirrors stopped working, lists the unavailable and usable registry URLs, and shows step‑by‑step how to configure Docker with multiple mirror sources to ensure reliable image pulls.

DockerImage MirrorsOperations

0 likes · 5 min read

How to Bypass Dockerhub Mirror Outages with Alternative Registries

Efficient Ops

Jun 10, 2024 · Operations

Why IPv4 Is Running Out and How Companies Can Navigate the Costly IPv6 Migration

With IPv4 address space exhausted and providers beginning to charge for public IPv4 usage, organizations face rising costs and complex migration challenges, prompting a strategic shift toward IPv6 adoption, alternative solutions, or passing expenses to customers, while grappling with ISP support gaps and tooling limitations.

Cloud ComputingIPv4IPv6

0 likes · 13 min read

Why IPv4 Is Running Out and How Companies Can Navigate the Costly IPv6 Migration

Open Source Tech Hub

Jun 8, 2024 · Operations

Docker Hub Mirror Service Stopped – Find Fast Alternative Registries

The Shanghai Jiao Tong University mirror announced the shutdown of its Docker Hub accelerator on June 6, prompting users to replace the unavailable address with other domestic mirrors such as NetEase, Alibaba Cloud, Baidu, and Nanjing University to maintain fast container image downloads.

Container RegistryOperationsacceleration

0 likes · 3 min read

Docker Hub Mirror Service Stopped – Find Fast Alternative Registries

Open Source Linux

Jun 4, 2024 · Operations

How to Quickly Identify Disk Space Hogs on Linux Servers

This guide shows how to use df, du, find, and lsof commands to locate large directories, files, and deleted-but-open files that consume disk space, and explains how to adjust reserved filesystem space on Linux.

FilesystemLinuxOperations

0 likes · 4 min read

How to Quickly Identify Disk Space Hogs on Linux Servers

Python Programming Learning Circle

Jun 3, 2024 · Operations

Using Python for Operations Automation: Remote Execution, Log Parsing, Monitoring, Deployment, and Backup

This article demonstrates how Python can automate common operations tasks such as remote command execution, log file parsing, system monitoring with alerts, batch software deployment, and file backup and recovery, providing code examples using libraries like paramiko, regex, psutil, fabric, and shutil.

AutomationOperationsPython

0 likes · 5 min read

Using Python for Operations Automation: Remote Execution, Log Parsing, Monitoring, Deployment, and Backup

IT Services Circle

Jun 3, 2024 · Operations

Understanding Load Balancing: From Single Tomcat to LVS + Nginx Architecture

This article explains how a simple single‑Tomcat deployment evolves into a multi‑layered load‑balancing architecture using Nginx, gateway authentication, static‑dynamic separation, and finally a combination of LVS and Nginx with DNS and CDN to handle massive traffic efficiently.

LVSNginxOperations

0 likes · 11 min read

Understanding Load Balancing: From Single Tomcat to LVS + Nginx Architecture

MaGe Linux Operations

May 31, 2024 · Operations

Mastering journalctl: Powerful Techniques to Query systemd Logs

This guide explains how to use the journalctl command to view, filter, and manage systemd-journald logs on Linux, covering help options, match expressions, persistent storage, disk usage, vacuuming, time ranges, unit filtering, priority levels, real‑time streaming, output formatting, and kernel log access.

Operationsjournalctllog-management

0 likes · 13 min read

Mastering journalctl: Powerful Techniques to Query systemd Logs

Liangxu Linux

May 30, 2024 · Operations

Why Do Most Servers Run Linux? Historical and Technical Reasons Explained

This article compiles several Zhihu answers that trace the historical shift from Windows/IIS to Linux-based servers, highlighting ecosystem dynamics, cost advantages, performance differences, container support, and open‑source adoption that together explain why Linux dominates modern server environments.

LinuxOperationsServer OS

0 likes · 10 min read

Why Do Most Servers Run Linux? Historical and Technical Reasons Explained

DevOps Engineer

May 29, 2024 · Cloud Computing

Overview of the Python Software Foundation (PSF) Infrastructure

The article provides a comprehensive overview of the Python Software Foundation's infrastructure, detailing its team, cloud providers, data centers, and the hosting arrangements for numerous services such as PyPI, docs, bug trackers, and the main Python website.

Cloud ServicesOperationsPython

0 likes · 9 min read

Overview of the Python Software Foundation (PSF) Infrastructure

Mike Chen's Internet Architecture

May 26, 2024 · Operations

9 Essential Metrics for Effective Microservice Monitoring

This article outlines nine crucial microservice monitoring indicators—including request tracing, health checks, throughput, response time, success and error rates, concurrent connections, CPU/memory usage, and resource utilization—to help engineers assess performance and reliability in distributed systems.

Operationsmicroservice monitoringperformance metrics

0 likes · 8 min read

9 Essential Metrics for Effective Microservice Monitoring

Open Source Linux

May 25, 2024 · Operations

Master Linux Startup: Systemd, chkconfig, and crontab Methods Explained

This guide details how to configure Linux services for automatic boot startup using systemd (systemctl), the legacy chkconfig method, generic script approaches, and crontab @reboot syntax, plus best‑practice recommendations for production environments.

LinuxOperationscrontab

0 likes · 10 min read

Master Linux Startup: Systemd, chkconfig, and crontab Methods Explained

21CTO

May 23, 2024 · Operations

What a Solo Founder Learned from Scaling TinyPilot to $800K Revenue

The author recounts five years of building TinyPilot, detailing revenue growth, product launches, team expansion, operational challenges, cost management, and personal reflections on entrepreneurship, while sharing lessons learned and goals for the coming year.

EntrepreneurshipHardwareOperations

0 likes · 15 min read

What a Solo Founder Learned from Scaling TinyPilot to $800K Revenue

Test Development Learning Exchange

May 22, 2024 · Operations

10 Practical Python Automation Scripts for Daily Operations

This article presents ten ready‑to‑use Python scripts that automate common operational tasks such as file backup, scheduled email reminders, web scraping, bulk image renaming, log analysis, folder synchronization, database backup, API monitoring, performance testing, and CI/CD deployment.

AutomationOperationsPython

0 likes · 9 min read

10 Practical Python Automation Scripts for Daily Operations

Architect's Tech Stack

May 18, 2024 · Operations

Graceful Shutdown in Kubernetes and Spring Boot Microservices: Best Practices and Optimizations

This article explains the concept of graceful shutdown, outlines essential steps, examines Kubernetes pod termination and Spring Boot integration with Nacos, and provides practical optimizations—including PreStop hooks, terminationGracePeriod settings, and actuator shutdown—to ensure reliable service termination without data loss.

Graceful ShutdownKubernetesOperations

0 likes · 11 min read

Graceful Shutdown in Kubernetes and Spring Boot Microservices: Best Practices and Optimizations

Mike Chen's Internet Architecture

May 18, 2024 · Operations

Mastering Gray Release: Safely Deploy Updates in Large‑Scale Systems

This article explains the concept of gray (canary) release, why it’s essential for large‑scale architectures, outlines the step‑by‑step workflow, describes common traffic‑splitting strategies, and offers practical tips for monitoring and gradually scaling deployments to ensure system stability.

Canary DeploymentDeployment StrategyOperations

0 likes · 4 min read

Mastering Gray Release: Safely Deploy Updates in Large‑Scale Systems

Cognitive Technology Team

May 16, 2024 · Operations

Guide to Building Stability in Distributed Systems

This guide presents comprehensive principles, best practices, and techniques for designing, deploying, and maintaining stable distributed systems, covering fault tolerance, monitoring, capacity planning, incident response, and operational reliability to help engineers achieve high availability.

OperationsReliability EngineeringStability

0 likes · 1 min read

Guide to Building Stability in Distributed Systems

Cognitive Technology Team

May 16, 2024 · Operations

Core Principles of High‑Availability Architecture Design

These core principles—minimal dependency, weak dependency, distribution, rate limiting, degradable design, balanced risk, fault prevention and isolation, no single point of failure, self‑protection, automatic failover, and retry/idempotency/compensation—guide the design of highly available systems by reducing risk, ensuring redundancy, and protecting services at all layers.

High AvailabilityOperationsReliability

0 likes · 3 min read

Core Principles of High‑Availability Architecture Design

Java Architect Essentials

May 15, 2024 · Operations

Quick Techniques for Locating Errors in Large Log Files Using Linux Commands

This article demonstrates several efficient Linux command‑line methods—including tail, head, grep, sed, and pagination tools—to quickly pinpoint error entries, view surrounding context, filter by time range, and count occurrences within massive log files.

LinuxOperationsShell Commands

0 likes · 12 min read

Quick Techniques for Locating Errors in Large Log Files Using Linux Commands

Alibaba Cloud Developer

May 15, 2024 · Operations

How We Cut Application Deployment Time by 70%: A Step‑by‑Step Case Study

This article documents how a team reduced the average deployment time of the omega application from 229 seconds to 69.71 seconds—a 69% speed‑up—by analyzing startup logs, removing unused middleware, upgrading libraries, fixing logging configurations, and applying async bean creation and script optimizations.

DeploymentOperationsPerformance Optimization

0 likes · 11 min read

How We Cut Application Deployment Time by 70%: A Step‑by‑Step Case Study

Efficient Ops

May 14, 2024 · Operations

China’s Top Banks Lead DevOps Maturity: Insights from CAICT’s Model

China’s banks are rapidly adopting DevOps, with CAICT’s maturity model showing China Merchants Bank topping assessments across multiple years, highlighting how standardized DevOps practices boost IT efficiency, product delivery speed, and business satisfaction in the era of digital transformation.

Maturity ModelOperationsdevops

0 likes · 9 min read

China’s Top Banks Lead DevOps Maturity: Insights from CAICT’s Model

MaGe Linux Operations

May 14, 2024 · Operations

How to Add and Manage Linux Network Routes for Different Subnets

This guide explains how to configure host, network, and default routes on Linux using the route command, covering syntax, option meanings, example commands, and how to view or delete routes for communication across multiple subnets.

LinuxNetworkOperations

0 likes · 6 min read

How to Add and Manage Linux Network Routes for Different Subnets

DataFunTalk

May 14, 2024 · Cloud Computing

Hybrid Cloud Architecture and AI Storage Evolution at Zhihu: From UnionStore to Alluxio

This article describes Zhihu's hybrid cloud architecture—including offline, online, and GPU data centers—its self‑built UnionStore cache, the performance and latency challenges faced during large‑scale AI model training, and the subsequent evaluation and migration to Alluxio community and enterprise editions to achieve higher throughput, stability, and lower operational overhead.

AI storageAlluxioBig Data

0 likes · 14 min read

Hybrid Cloud Architecture and AI Storage Evolution at Zhihu: From UnionStore to Alluxio

Programmer DD

May 14, 2024 · Operations

Mastering Full‑Link Load Testing: The Ultimate Guide to Capacity Assurance

This article explains the concept, challenges, step‑by‑step process, organizational and tool requirements, capacity governance, planning, and AI‑driven prediction for full‑link load testing, illustrating how enterprises can ensure system capacity and stability during large‑scale online events.

Operationscapacity assurancefull-link load testing

0 likes · 9 min read

Mastering Full‑Link Load Testing: The Ultimate Guide to Capacity Assurance

dbaplus Community

May 13, 2024 · Cloud Native

Do You Really Need Kubernetes? Real‑World Dev Opinions and Practical Tips

This article compiles diverse Zhihu answers discussing whether Kubernetes is necessary, weighing its automation benefits and scaling power against configuration complexity, resource costs, and team readiness, while offering concrete kubectl commands and guidance for making an informed adoption decision.

CI/CDContainer OrchestrationKubernetes

0 likes · 9 min read

Do You Really Need Kubernetes? Real‑World Dev Opinions and Practical Tips

Qunar Tech Salon

May 13, 2024 · Operations

Root Cause Analysis of Intermittent Timeout Issues in the Sirius Service Caused by RAID Card Consistency Checks

This article details the investigation of sporadic interface timeouts in the Sirius real‑time pricing service, revealing a weekly pattern linked to RAID controller consistency checks that cause IO spikes, logback queue blockage, and ultimately Dubbo client‑side timeouts, and proposes mitigation steps and general performance‑troubleshooting guidelines.

LogbackOperationsPerformance

0 likes · 22 min read

Root Cause Analysis of Intermittent Timeout Issues in the Sirius Service Caused by RAID Card Consistency Checks

Open Source Linux

May 13, 2024 · Information Security

What Is a Bastion Host and Why It’s Critical for Secure Operations

This article explains what a bastion host (jump server) is, why it evolved from traditional jump servers, its core 4A design (authentication, authorization, account, audit), deployment options, common features, authentication methods, and how open‑source and commercial solutions differ, helping organizations improve security and compliance.

Access ControlOperationsaudit

0 likes · 10 min read

What Is a Bastion Host and Why It’s Critical for Secure Operations

Efficient Ops

May 12, 2024 · Operations

What Is the New DevOps International Standard and How Does It Shape Cloud Service Development?

The article outlines the DevOps International Standard (ITU‑T Y.3525), its development history, publication, evaluation scheme upgrades, relationship with China’s domestic DevOps standards, and provides a comprehensive overview of industry participation in the DevOps capability maturity model as of April 2024.

Cloud ComputingInternational StandardMaturity Model

0 likes · 9 min read

What Is the New DevOps International Standard and How Does It Shape Cloud Service Development?

Efficient Ops

May 12, 2024 · Operations

How China’s Agricultural Bank Leads DevOps Maturity Across Multiple Projects

The article details how China’s Agricultural Bank of China has leveraged the CAICT DevOps Capability Maturity Model to achieve extensive assessments across dozens of projects, illustrating the bank’s digital transformation, security improvements, and operational benefits within the broader national push toward intelligent, networked enterprises.

Maturity ModelOperationsdevops

0 likes · 13 min read

How China’s Agricultural Bank Leads DevOps Maturity Across Multiple Projects

ITPUB

May 10, 2024 · Databases

Choosing Low‑Risk Strategies for Critical DBA Outages

When a major operations incident strikes, the safest approach is to prioritize simple, low‑risk actions and accept limited responsibility, as illustrated by real DBA lessons from Oracle RAC failures and a data‑center power‑loss disaster.

DBAIncident ManagementOperations

0 likes · 7 min read

Choosing Low‑Risk Strategies for Critical DBA Outages