Tagged articles

Metrics

590 articles · Page 1 of 6

Jun 22, 2026 · Cloud Native

Zero‑Code Full‑Stack Observability with OpenTelemetry eBPF: CloudMonitor 2.0’s In‑Kernel “Lens”

OpenTelemetry eBPF Instrumentation (OBI) injects a kernel‑level, zero‑code probe that automatically captures OpenTelemetry‑compatible traces, metrics, and logs for over 15 protocols—including HTTP, gRPC, MySQL, Redis, Kafka, and CUDA—while handling cross‑language context propagation, GPU tracing, and seamless integration with CloudMonitor 2.0.

Cloud NativeMetricsObservability

0 likes · 19 min read

Zero‑Code Full‑Stack Observability with OpenTelemetry eBPF: CloudMonitor 2.0’s In‑Kernel “Lens”

Code Mala Tang

Jun 16, 2026 · Industry Insights

GitHub Star Inflation: Why 10,000 Stars No Longer Impress

The article analyzes how GitHub star counts have inflated—especially for AI tools—showing that a 20,000‑star threshold that once guaranteed a top‑10 spot now falls short, and explains why stars are becoming a noisy attention metric rather than a reliable quality indicator.

AIGitHubMetrics

0 likes · 13 min read

GitHub Star Inflation: Why 10,000 Stars No Longer Impress

Continuous Delivery 2.0

Jun 15, 2026 · Operations

Step‑by‑Step AIOps Rollout: How Tencent IEG Tech Ops Reinvented SRE Efficiency

Tencent IEG's tech operations team tackled six common SRE AI adoption bottlenecks with a three‑stage, layered framework, built a unified platform and metric system, and demonstrated measurable AI‑driven efficiency gains across multiple SRE scenarios.

AIAIOpsMetrics

0 likes · 11 min read

Step‑by‑Step AIOps Rollout: How Tencent IEG Tech Ops Reinvented SRE Efficiency

Alibaba Cloud Observability

Jun 15, 2026 · Cloud Native

Measuring AI Coding Impact from Individual to Organization with LoongSuite‑Pilot and SLS

This article details how LoongSuite‑Pilot captures heterogeneous AI coding agent events and leverages Alibaba Cloud Log Service (SLS) SQL dashboards to provide end‑to‑end, organization‑wide metrics—covering individual usage, team adoption, token consumption, skill and tool utilization—enabling R&D teams to quantify the real‑world effectiveness of AI coding assistants.

AI codingCloud LoggingLoongSuite

0 likes · 21 min read

Measuring AI Coding Impact from Individual to Organization with LoongSuite‑Pilot and SLS

Coder Trainee

Jun 13, 2026 · Artificial Intelligence

AI Agent Observability and Debugging: Building a Transparent Agent System

This article explains why AI agents behave like black boxes, introduces a three‑pillar observability framework (tracing, metrics, logging), demonstrates practical tracing with LangSmith and LangFuse, shows how to instrument agents with custom metrics, evaluate performance, and share best‑practice guidelines for production‑ready debugging.

AI AgentLangChainLangFuse

0 likes · 19 min read

AI Agent Observability and Debugging: Building a Transparent Agent System

Alibaba Cloud Developer

Jun 12, 2026 · Operations

Why Open‑Source LoongSuite Pilot Is Needed as AI Coding Agents Become Core Infrastructure

The article analyzes how AI coding agents like Cursor, Claude Code, and Codex have become essential developer tools, yet suffer from almost zero observability, and explains how the open‑source LoongSuite Pilot provides a unified collection platform, semantic schema, security controls, dashboards, and ROI metrics to turn these agents into manageable infrastructure.

AI coding agentLoongSuite PilotMetrics

0 likes · 27 min read

Why Open‑Source LoongSuite Pilot Is Needed as AI Coding Agents Become Core Infrastructure

Alibaba Cloud Native

Jun 9, 2026 · Cloud Native

From Individual Productivity to Organizational Insight: Building AI Coding Metrics with LoongSuite‑Pilot and SLS

The article explains how to capture event‑level AI coding agent data using LoongSuite‑Pilot, align it with the LoongSuite GenAI semantic conventions, store it in Alibaba Cloud Log Service (SLS), and construct a multi‑layered SQL dashboard that turns personal usage signals into organization‑wide metrics for informed decision‑making.

AICloud NativeMetrics

0 likes · 25 min read

From Individual Productivity to Organizational Insight: Building AI Coding Metrics with LoongSuite‑Pilot and SLS

Tech Stroll Journey

May 25, 2026 · Operations

How Linux Sends a Packet: From Process to NIC and the Key Metrics to Watch

The article walks through the Linux packet lifecycle—from the send() system call, through the transport and network layers, to the NIC driver—explaining each step, virtual‑network abstractions, and the essential bandwidth, latency, loss, conntrack, and socket buffer metrics to monitor when problems arise.

LinuxMetricsNetwork Stack

0 likes · 10 min read

How Linux Sends a Packet: From Process to NIC and the Key Metrics to Watch

Coder Trainee

May 21, 2026 · Cloud Native

Building Full Observability for Spring Cloud Microservices with Micrometer, Prometheus, and Grafana

After solving distributed transactions with Seata, this tutorial shows how to add complete observability to Spring Cloud microservices by integrating Micrometer, Prometheus, and Grafana, covering metrics pillars, configuration, custom business metrics, dashboard setup, alert rules, validation steps, and common pitfalls.

Docker ComposeMetricsObservability

0 likes · 12 min read

Building Full Observability for Spring Cloud Microservices with Micrometer, Prometheus, and Grafana

Spring Full-Stack Practical Cases

May 19, 2026 · Backend Development

Why Logs Alone Fail in Spring Boot: Achieving True Observability

The article explains that relying solely on log statements in Spring Boot applications cannot reveal request identities, latency, async task health, failure details, or cross‑service flows, and demonstrates how to augment logs with MDC correlation IDs, Micrometer metrics, and Zipkin tracing for comprehensive observability.

LoggingMetricsObservability

0 likes · 9 min read

Why Logs Alone Fail in Spring Boot: Achieving True Observability

AgentGuide

May 3, 2026 · Artificial Intelligence

How to Evaluate an AI Agent Beyond Just Accuracy

Evaluating AI agents requires more than accuracy; you must measure task completion, execution trace, tool usage, latency, cost, error rates, and both explicit and implicit user feedback, using observability, offline smoke‑test and regression suites, and continuous online monitoring to create a closed‑loop improvement process.

AI AgentEvaluationMetrics

0 likes · 14 min read

How to Evaluate an AI Agent Beyond Just Accuracy

AI Engineer Programming

May 2, 2026 · Artificial Intelligence

From Demo to Production: How to Evaluate RAG Effectively

This guide outlines a comprehensive RAG evaluation framework covering failure modes, multi‑layer metrics, test‑set construction, open‑source tools, CI/CD quality gates, production monitoring, and special considerations for agentic RAG to ensure reliable, trustworthy retrieval‑augmented generation systems.

AIEvaluationLLM

0 likes · 18 min read

From Demo to Production: How to Evaluate RAG Effectively

Alibaba Cloud Observability

Apr 27, 2026 · Artificial Intelligence

Seeing Inside Hermes: Full Observability of Agent Execution with OpenTelemetry

The article explains how Alibaba Cloud’s Hermes observability plugin, built on OpenTelemetry, makes the entire execution process of AI agents visible by tracing reasoning steps, tool calls, token usage, latency, and security risks, enabling precise cost, performance, and error analysis.

AI AgentCloud NativeHermes

0 likes · 14 min read

Seeing Inside Hermes: Full Observability of Agent Execution with OpenTelemetry

Alibaba Cloud Native

Apr 26, 2026 · Cloud Native

Seeing Inside Hermes: Full Visibility into Agent Execution with OpenTelemetry

The article introduces Alibaba Cloud's Hermes observability plugin built on OpenTelemetry, which transforms the previously opaque AI agent runtime into a fully traceable system by recording every reasoning step, tool invocation, token usage, latency, and security event, enabling precise cost attribution, performance analysis, and audit of high‑risk behaviors.

AI AgentHermesMetrics

0 likes · 13 min read

Seeing Inside Hermes: Full Visibility into Agent Execution with OpenTelemetry

Smart Workplace Lab

Apr 19, 2026 · Industry Insights

How to Turn AI-Boosted Productivity into Visible Performance Metrics

This article presents a practical framework for documenting AI‑enhanced work contributions, introducing a weekly performance‑evidence matrix that quantifies decision density, risk interception, and asset accumulation, along with communication scripts tailored to different manager types and step‑by‑step SOPs for archiving proof, helping professionals turn speed gains into measurable performance value.

AIEvidenceMetrics

0 likes · 7 min read

How to Turn AI-Boosted Productivity into Visible Performance Metrics

PMTalk Product Manager Community

Apr 10, 2026 · Artificial Intelligence

Why AI Product Evaluation Is Hard and How to Build a Scientific Assessment Framework

The article analyzes the unique challenges of evaluating AI products—output uncertainty, subjective criteria, over‑fitting risk, high cost, and vague metrics—compares traditional testing with AI testing, proposes a five‑step evaluation workflow, defines concrete metrics such as pass rate and efficiency gain, and illustrates the process with a real‑world sales‑script generation case study, concluding with five key success factors and future trends.

AI evaluationAutomationCase Study

0 likes · 13 min read

Why AI Product Evaluation Is Hard and How to Build a Scientific Assessment Framework

AI Step-by-Step

Apr 8, 2026 · Operations

How to Light Up the Black Box of LLM Agents with Full‑Stack Observability

The article explains why traditional logs are insufficient for LLM agents, outlines five observability dimensions—tracing, metrics, behavioral governance, state & memory, and evaluation—and provides concrete, open‑source‑based steps to instrument, monitor, and act on agent workloads in production.

Behavioral GovernanceEvaluationLLM Agents

0 likes · 11 min read

How to Light Up the Black Box of LLM Agents with Full‑Stack Observability

MaGe Linux Operations

Apr 6, 2026 · Operations

Master Redis Monitoring: Essential Metrics, Scripts, and Alerting Strategies

This guide walks operations engineers through building a complete Redis monitoring system—covering why monitoring matters, which metrics to collect, how to gather them with Prometheus and Grafana, and practical Bash scripts for health checks, memory, persistence, replication, client connections, and alert thresholds.

MetricsMonitoringOps

0 likes · 31 min read

Master Redis Monitoring: Essential Metrics, Scripts, and Alerting Strategies

Alibaba Cloud Native

Apr 5, 2026 · Operations

How OpenClaw CMS Plugin v0.1.2 Turns Agent Tracing into Precise, Cost‑Effective Observability

The OpenClaw CMS observability plugin v0.1.2 solves the hidden‑trace problem by fully restoring multi‑round LLM execution, stabilizing concurrent chains, and introducing granular agent metrics, enabling developers, testers, and operators to debug faster, assess costs accurately, and improve cross‑team collaboration.

AgentCloud NativeMetrics

0 likes · 8 min read

How OpenClaw CMS Plugin v0.1.2 Turns Agent Tracing into Precise, Cost‑Effective Observability

AgentGuide

Apr 3, 2026 · Artificial Intelligence

How to Evaluate RAG Systems: Key Metrics and the Ragas Framework

The article explains how to assess Retrieval-Augmented Generation (RAG) projects using the Ragas automated evaluation framework, detailing four key dimensions—recall quality, answer faithfulness, answer relevance, and context utilization—and describes the underlying metrics for both retrieval and generation stages.

EvaluationLLMMetrics

0 likes · 5 min read

How to Evaluate RAG Systems: Key Metrics and the Ragas Framework

DevOps Coach

Mar 26, 2026 · Industry Insights

Which DevOps Metrics Will Drive Business Success by 2026?

The article analyzes how traditional DevOps activity metrics are being replaced by outcome‑focused indicators that directly affect cost, delivery speed, reliability and overall business performance, citing New Relic and Flexera forecasts and outlining the metrics teams should adopt or discard by 2026.

DORAFinOpsMetrics

0 likes · 13 min read

Which DevOps Metrics Will Drive Business Success by 2026?

Selected Java Interview Questions

Mar 24, 2026 · Operations

Mastering Observability in Spring Boot 4 with OpenTelemetry: A Step‑by‑Step Guide

Spring Boot 4 introduces an official OpenTelemetry starter that simplifies the collection, processing, and export of metrics, traces, and logs, and this guide walks you through adding dependencies, configuring OTLP endpoints for Grafana, Jaeger, and other backends, and setting up Logback for log export.

LoggingMetricsOTLP

0 likes · 6 min read

Mastering Observability in Spring Boot 4 with OpenTelemetry: A Step‑by‑Step Guide

Big Data Tech Team

Mar 18, 2026 · Big Data

From Zero to One: Building Enterprise Data Standards for Data Warehouses

This guide explains why data standards are essential for data warehouses, outlines the four categories of standards, and provides a step‑by‑step process—including research, framework design, template creation, review, implementation, and ongoing maintenance—to help practitioners and interviewees establish robust, business‑aligned data standards.

Data StandardizationData WarehouseMetrics

0 likes · 10 min read

From Zero to One: Building Enterprise Data Standards for Data Warehouses

Woodpecker Software Testing

Mar 15, 2026 · R&D Management

Shift‑Left Testing: Transforming Teams from Reactive Bug‑Fixers to Proactive Quality Architects

The article explains how shift‑left testing evolves from a simple early‑testing tactic into a comprehensive team transformation that embeds quality into every stage of software delivery, detailing new roles, metrics, toolchains, and practical steps for test experts to become quality architects.

MetricsQuality EngineeringShift-Left Testing

0 likes · 8 min read

Shift‑Left Testing: Transforming Teams from Reactive Bug‑Fixers to Proactive Quality Architects

PMTalk Product Manager Community

Mar 15, 2026 · Product Management

7-Step Architecture Framework for AI Product Management: A Hands‑On Case Study

This article walks through a real‑world AI‑driven image generation system for cross‑border e‑commerce, detailing business pain points, stakeholder analysis, technical selection, MVP scope, architecture decisions, metric funnels, gray‑release strategy, and continuous evolution that cut per‑image cost to under ¥0.5 and delivery time to one minute.

AICase StudyGenerative AI

0 likes · 16 min read

7-Step Architecture Framework for AI Product Management: A Hands‑On Case Study

PMTalk Product Manager Community

Mar 13, 2026 · Product Management

How AI Product Managers Should Rethink Funnel Analysis

In the AI era the classic funnel of exposure‑click‑register‑retain‑pay no longer reflects value creation, so product managers must shift the focus to effective task entry, first usable results, mid‑funnel adoption, retention of high‑impact tasks, and stable commercial metrics.

AIFunnel AnalysisGrowth

0 likes · 24 min read

How AI Product Managers Should Rethink Funnel Analysis

Woodpecker Software Testing

Mar 9, 2026 · Industry Insights

2026 Shift‑Left Testing: From Early Process to In‑born Quality

The article traces the evolution of shift‑left testing to a quality‑inborn paradigm in 2026, highlighting AI‑driven verification, organizational reforms, and metric‑based outcomes that cut defect escape rates by 63% and reduce MTTR from 47 to 11 minutes.

AI-driven TestingMetricsObservability

0 likes · 8 min read

2026 Shift‑Left Testing: From Early Process to In‑born Quality

Architect-Kip

Mar 4, 2026 · Operations

Essential SRE Monitoring and Alerting Standards: From Metrics to Incident Response

This guide outlines comprehensive SRE monitoring and alerting standards, covering core principles, log instrumentation, health‑check requirements, baseline resource and application metrics, alarm severity tiers, response SLAs, on‑call rotation, continuous optimization, and noise‑reduction mechanisms to ensure reliable service operation.

AlertingMetricsMonitoring

0 likes · 14 min read

Essential SRE Monitoring and Alerting Standards: From Metrics to Incident Response

DeWu Technology

Mar 2, 2026 · Big Data

Mastering Spark UI: Deep Dive into Metrics, Tuning, and Real‑World Cases

This article provides a comprehensive guide to Spark UI, explaining each primary and secondary tab, the key metrics they expose, and how to interpret them for performance bottleneck detection, followed by two detailed case studies and practical tuning recommendations for Spark workloads.

Big DataCase StudyMetrics

0 likes · 19 min read

Mastering Spark UI: Deep Dive into Metrics, Tuning, and Real‑World Cases

Alibaba Cloud Native

Mar 2, 2026 · Artificial Intelligence

How to Make AI Agents Auditable and Controlled with OpenClaw, SLS, and OTEL

This article explains how to combine OpenClaw session logs, application logs, and OpenTelemetry metrics in Alibaba Cloud SLS to answer who triggered an AI agent, what actions were taken, how much it cost, and whether the behavior is traceable, enabling a complete observability and security solution for AI agents.

AI AgentMetricsOTEL

0 likes · 26 min read

How to Make AI Agents Auditable and Controlled with OpenClaw, SLS, and OTEL

Woodpecker Software Testing

Mar 1, 2026 · Artificial Intelligence

Four Hidden Model Evaluation Pitfalls That Undermine AI Deployments

The article examines four common yet hidden model evaluation mistakes—confusing attractive metrics with business impact, using static test sets, ignoring statistical significance, and lacking fine‑grained attribution—illustrating each with real‑world cases and offering concrete practices to build a more robust, business‑aligned evaluation pipeline.

A/B testingAI DeploymentMetrics

0 likes · 8 min read

Four Hidden Model Evaluation Pitfalls That Undermine AI Deployments

Yunqi AI+

Feb 22, 2026 · R&D Management

Rethinking Product Development: How AI Reshapes the Value Stream, Not Just Code Speed

The article analyzes how AI has evolved from a code‑completion aid to a foundational operating system that forces product‑research teams to redesign the entire requirement‑to‑delivery value stream, outlining practical boundaries, pilot implementation, organizational role changes, metric shifts, and risk governance.

AIMetricsR&D Management

0 likes · 17 min read

Rethinking Product Development: How AI Reshapes the Value Stream, Not Just Code Speed

Java Backend Technology

Feb 10, 2026 · Operations

Boost Java Service Performance with MyPerf4J: A High‑Throughput Monitoring Tool

This article introduces MyPerf4J, a Java‑agent based, low‑overhead performance monitoring tool that provides real‑time metrics such as RPS, latency percentiles, memory usage and GC statistics, and explains how to install, configure, run and uninstall it in development and production environments.

JavaJavaAgentMetrics

0 likes · 7 min read

Boost Java Service Performance with MyPerf4J: A High‑Throughput Monitoring Tool

dbaplus Community

Feb 8, 2026 · Databases

Why Oracle AWR Is the Gold Standard for DB Performance and How Domestic Databases Compare

The article explains Oracle's Automatic Workload Repository (AWR) as a comprehensive performance‑diagnostic tool, breaks down its core functions, and then evaluates how several domestic databases such as Kingbase measure up in terms of report completeness, metric richness, SQL analysis, wait‑event handling, OS integration, and usability.

AWRDomestic databasesMetrics

0 likes · 21 min read

Why Oracle AWR Is the Gold Standard for DB Performance and How Domestic Databases Compare

Raymond Ops

Feb 2, 2026 · Operations

10 Essential PromQL Queries Every Ops Engineer Should Master

This article presents ten practical PromQL query examples covering CPU, memory, disk, network, database, Kubernetes, and business metrics, explains the underlying concepts, provides alert thresholds and best‑practice tips, and includes advanced optimization and alert‑rule design guidance for reliable monitoring.

AlertingMetricsMonitoring

0 likes · 22 min read

10 Essential PromQL Queries Every Ops Engineer Should Master

Ops Community

Jan 27, 2026 · Operations

Master Linux System Monitoring: Deep Dive into CPU, Memory, and I/O Metrics

This comprehensive guide explains how to collect and analyze Linux system metrics—including CPU usage, memory consumption, disk I/O, and load average—using native /proc and /sys interfaces, popular command‑line tools, and Prometheus Node Exporter, with practical scripts, configuration examples, and troubleshooting case studies for reliable performance monitoring and capacity planning.

LinuxMetricsprometheus

0 likes · 39 min read

Master Linux System Monitoring: Deep Dive into CPU, Memory, and I/O Metrics

Woodpecker Software Testing

Jan 18, 2026 · Operations

How to Build a Full‑Chain Monitoring System with Grafana for E‑commerce

This guide walks you through designing and implementing a comprehensive e‑commerce monitoring solution that covers server resources, application performance, and business metrics using Prometheus for data collection and Grafana for visualization, including panel design, alerting, and stress‑test practices.

AlertingFull‑chain monitoringMetrics

0 likes · 7 min read

How to Build a Full‑Chain Monitoring System with Grafana for E‑commerce

PMTalk Product Manager Community

Jan 18, 2026 · Product Management

Cut Through the Fog: How Product Managers Can Re‑Anchor Value and Evolve

Amid slowing growth and noisy data, product managers face three crises—demand fog, value vacuum, and capability gaps; the article offers a step‑by‑step framework with real‑world cases to clarify user needs, align actions with business goals, strengthen technical and analytical skills, and make data‑driven decisions that turn feature work into measurable value.

MetricsUser Researchdecision making

0 likes · 14 min read

Cut Through the Fog: How Product Managers Can Re‑Anchor Value and Evolve

xkx's Tech General Store

Jan 15, 2026 · Operations

Essential Ops Guide: Configuring Host Metrics Monitoring with Node Exporter and SkyWalking

This guide walks through setting up host‑level metric collection by installing Prometheus Node Exporter, configuring OpenTelemetry Collector Contrib to translate metrics, and integrating them into SkyWalking 10.3 so you can view infrastructure data in the SkyWalking Web UI.

LinuxMetricsNode Exporter

0 likes · 6 min read

Essential Ops Guide: Configuring Host Metrics Monitoring with Node Exporter and SkyWalking

Woodpecker Software Testing

Jan 13, 2026 · User Experience Design

A Complete User Experience Testing Process: From Planning to Implementation

The article outlines a systematic, end‑to‑end UX testing workflow—defining goals, designing test plans, recruiting representative users, preparing materials, calibrating and managing test sessions, collecting quantitative and qualitative data, analyzing results with metrics like SUS and efficiency index, extracting actionable insights, and converting findings into concrete product improvements—highlighting how AI‑driven tools can boost test efficiency and business value.

AI Testing ToolsMetricsUX Research

0 likes · 7 min read

A Complete User Experience Testing Process: From Planning to Implementation

Ops Development Stories

Jan 12, 2026 · Operations

Choosing the Best 2026 Observability Stack: From Collection to Alerts

This article reviews the 2026 observability landscape, outlines selection principles, compares open‑source and commercial solutions for data collection, storage, alerting and event management, and discusses how AI is reshaping monitoring and AIOps practices.

AlertingMetricsMonitoring

0 likes · 9 min read

Choosing the Best 2026 Observability Stack: From Collection to Alerts

Programmer DD

Jan 12, 2026 · Artificial Intelligence

5 Counterintuitive Lessons for Evaluating AI Agents Effectively

This article shares five surprising, high‑impact lessons from Anthropic on building robust AI agent evaluation suites, covering early failure‑case collections, recognizing clever “failures,” focusing on outcomes over process, choosing the right success metrics, and the irreplaceable value of human review.

AI evaluationAnthropicMetrics

0 likes · 10 min read

5 Counterintuitive Lessons for Evaluating AI Agents Effectively

Ray's Galactic Tech

Jan 7, 2026 · Operations

5 Proven Ways to Accurately Measure QPS in Production – Code Samples Included

This guide breaks down five common QPS measurement techniques—from load balancer logs and Java instrumentation to APM tools and database metrics—detailing their principles, pros and cons, real‑world pitfalls, and provides Java code examples and optimization strategies for accurate, real‑time monitoring.

APMJavaMetrics

0 likes · 9 min read

5 Proven Ways to Accurately Measure QPS in Production – Code Samples Included

Huolala Tech

Jan 7, 2026 · Operations

How Exemplar Bridges the Last‑Mile Gap in Observability

Facing the “last mile” challenge of correlating metrics, logs, and traces, the article examines common heterogeneous storage architectures, critiques existing Exemplar implementations, and presents HuoLala’s end‑to‑end solution that treats Exemplar as an independent observable dimension, detailing its data model, SDK integration, collector, and interactive visualization.

ExemplarLogAggregationMetrics

0 likes · 22 min read

How Exemplar Bridges the Last‑Mile Gap in Observability

Woodpecker Software Testing

Jan 5, 2026 · Backend Development

Five Core Dimensions of Maintainability Testing for Microservice Systems

This article presents a detailed, step‑by‑step guide to maintainability testing, defining five core dimensions—modularization, reusability, analysability, modifiability, and testability—along with their metrics, a relationship model, a comprehensive microservice e‑shop case study, concrete test scenarios, code examples, and best‑practice recommendations for improving software quality and delivery speed.

CI/CDMetricsMicroservices

0 likes · 20 min read

Five Core Dimensions of Maintainability Testing for Microservice Systems

Woodpecker Software Testing

Jan 5, 2026 · Operations

Three Core Dimensions of Performance Testing: Time Behavior, Resource Utilization, and Capacity

This article breaks down performance testing into three essential dimensions—time behavior, resource utilization, and capacity—explains their key metrics, demonstrates a detailed e‑commerce flash‑sale case study, and shows how systematic testing and optimization can dramatically improve response times, throughput, and scalability.

JMeterMetricscapacity planning

0 likes · 12 min read

Three Core Dimensions of Performance Testing: Time Behavior, Resource Utilization, and Capacity

DevOps Coach

Dec 26, 2025 · Operations

10 Actionable Agile Metrics to Replace Velocity and Deliver Real Value

This article presents ten practical, measurable Agile metrics—each with a problem statement, improvement action, real‑world example, concise code snippet, and baseline—showing how teams can shift from velocity to telemetry that reveals flow, quality, and predictability.

AgileMetricsTelemetry

0 likes · 20 min read

10 Actionable Agile Metrics to Replace Velocity and Deliver Real Value

DevOps Coach

Dec 22, 2025 · R&D Management

Why We Abandoned Scrum: Inside Our Developer‑Led Delivery Transformation

After discovering that traditional Agile rituals stifled high‑output engineering teams, we rebuilt our workflow around autonomous, domain‑owned squads using GitHub PRs, feature flags, and real‑time metrics, resulting in dramatically faster deployments, fewer incidents, and higher developer satisfaction.

Agile TransformationDeveloper-Led DeliveryFlow Engineering

0 likes · 8 min read

Why We Abandoned Scrum: Inside Our Developer‑Led Delivery Transformation

Alibaba Cloud Observability

Dec 15, 2025 · Cloud Native

How UModel PaaS API Simplifies Observability Queries with Unified Entity Search

This article explains how the UModel PaaS API abstracts complex observability concepts—such as EntitySet, DataSet, StorageLink, and Filter—into a unified, object‑oriented query interface, offering Table, Object, and metadata modes, code examples, UI and SDK usage, and AI‑agent integration for efficient, low‑maintenance monitoring.

AI AgentAPICloud Native

0 likes · 16 min read

How UModel PaaS API Simplifies Observability Queries with Unified Entity Search

PMTalk Product Manager Community

Dec 9, 2025 · Product Management

Real‑World AI Data Analysis Case for Product Managers: Iteration & Optimization

The article shows how product managers can avoid the disappointment of a feature that looks perfect but gets no users by building a complete data‑driven loop that combines user‑behavior and business metrics, walks through a real e‑commerce recommendation case, outlines data‑collection pitfalls, metric‑design methods, hypothesis‑driven analysis, testing procedures and concrete steps to turn insights into iterative product improvements.

AICase StudyMetrics

0 likes · 33 min read

Real‑World AI Data Analysis Case for Product Managers: Iteration & Optimization

DevOps Coach

Dec 8, 2025 · Operations

How to Quantify SRE ROI: Turning Reliability Metrics into Business Value

This article explains how SRE leaders can bridge the gap between technical reliability metrics and business outcomes by defining core SRE concepts, applying a step‑by‑step ROI formula, illustrating code‑level impact, avoiding common pitfalls, and looking ahead to AI‑driven reliability forecasting.

BusinessValueMetricsOperations

0 likes · 10 min read

How to Quantify SRE ROI: Turning Reliability Metrics into Business Value

Ray's Galactic Tech

Nov 26, 2025 · Cloud Native

Mastering Kubernetes Performance Bottlenecks: The Ultimate Troubleshooting Guide

This comprehensive guide walks you through the seven key performance metrics, resource, application, and system component indicators, and provides step‑by‑step methods, advanced tips, and tool recommendations for diagnosing and resolving Kubernetes performance bottlenecks from cluster‑wide to pod‑level details.

Cloud NativeMetricsMonitoring

0 likes · 11 min read

Mastering Kubernetes Performance Bottlenecks: The Ultimate Troubleshooting Guide

IT Architects Alliance

Nov 25, 2025 · Operations

Making Architecture Decisions Observable with DevOps Monitoring

The article explains how to integrate architecture decision tracking into DevOps monitoring, detailing tagging, multi‑layer metric design, time‑window analysis, automated alerts, reporting, and continuous optimization to turn architectural choices into measurable, data‑driven outcomes.

MetricsMonitoringObservability

0 likes · 9 min read

Making Architecture Decisions Observable with DevOps Monitoring

Architecture Digest

Nov 24, 2025 · Operations

Boost Java Service Performance with MyPerf4J: A High‑Speed, Low‑Impact Monitoring Tool

MyPerf4J is an open‑source, high‑performance Java monitoring and statistics tool that uses a JavaAgent for zero‑intrusion, records up to ten million method calls per second with nanosecond precision, and provides real‑time metrics such as QPS, latency percentiles, memory and GC stats, making it ideal for both development and production environments.

JavaJavaAgentMetrics

0 likes · 6 min read

Boost Java Service Performance with MyPerf4J: A High‑Speed, Low‑Impact Monitoring Tool

Wu Shixiong's Large Model Academy

Nov 20, 2025 · Artificial Intelligence

How to Build a Quantifiable Data Quality Framework for Dynamic Incremental RAG

This article explains why static RAG metrics don’t apply to dynamic pipelines, introduces five essential dimensions—Parseability, Deduplication, Relevance, Chunk Quality, and Freshness—and shows how to combine them into a weighted score that enables monitoring, alerts, and continuous improvement of dynamic RAG systems.

Data QualityDynamic RAGMetrics

0 likes · 10 min read

How to Build a Quantifiable Data Quality Framework for Dynamic Incremental RAG

Efficient Ops

Nov 16, 2025 · Operations

Mastering Application Monitoring with Prometheus: Practical Metrics and Best Practices

This guide walks through how to design and implement effective Prometheus metrics for various application types, covering golden metrics, label selection, naming conventions, histogram bucket choices, and Grafana visualization tricks to improve observability and operational insight.

MetricsOperationsgrafana

0 likes · 10 min read

Mastering Application Monitoring with Prometheus: Practical Metrics and Best Practices

High Availability Architecture

Nov 14, 2025 · Artificial Intelligence

Quantifying AI Programming Efficiency: A Traceable and Measurable System

This article outlines the challenges of tracking AI‑generated code and measuring AI contribution, reviews earlier ad‑hoc methods, and presents a comprehensive solution featuring a VSCode plugin for unified AI dialogue management and a cloud service that quantifies AI impact across projects, teams, and individual developers.

AIAnalyticsMetrics

0 likes · 9 min read

Quantifying AI Programming Efficiency: A Traceable and Measurable System

DevOps Coach

Nov 10, 2025 · Operations

How to Use SRE Metrics for Data‑Driven Reliability and Faster Releases

This guide explains the SRE framework—SLA, SLO, SLI hierarchy, golden signals, error budgets, and DORA metrics—showing how to instrument a Python app with OpenTelemetry, query Prometheus, avoid common pitfalls, and adopt a cultural and technical process that balances feature velocity with system stability.

DORAError BudgetGolden Signals

0 likes · 18 min read

How to Use SRE Metrics for Data‑Driven Reliability and Faster Releases

Tech Stroll Journey

Nov 5, 2025 · Operations

How to Diagnose Linux Memory Issues: Metrics, Tools, and Step-by-Step Strategies

This guide explains essential Linux memory metrics, demonstrates how to use tools like free, top, vmstat, sar, and ps, and outlines a systematic, layered approach to pinpointing and resolving memory problems, including cache analysis and leak detection.

LinuxMetricstools

0 likes · 16 min read

How to Diagnose Linux Memory Issues: Metrics, Tools, and Step-by-Step Strategies

Architect

Nov 4, 2025 · Operations

How to Accurately Track API Calls per Minute: 5 Proven Monitoring Strategies

This article explores why precise per‑minute API call statistics are essential for performance bottleneck detection, capacity planning, security alerts, billing, and troubleshooting, and presents five practical implementations—including fixed‑window counters, sliding windows, AOP‑based interception, Redis time‑series storage, and Micrometer‑Prometheus integration—along with their trade‑offs and capacity‑planning guidelines.

JavaMetricsPerformance Optimization

0 likes · 25 min read

How to Accurately Track API Calls per Minute: 5 Proven Monitoring Strategies

JakartaEE China Community

Nov 4, 2025 · Operations

How Logs, Traces, and Metrics Differ—and Why It Matters

Logs, tracing, and metrics each serve distinct monitoring goals—logs capture discrete events for debugging and audit, traces map request flows to pinpoint performance bottlenecks, and metrics provide time‑series health data; understanding their differences and integrating tools like ELK, OpenTelemetry, Prometheus, and Grafana enables robust observability.

ELKMetricsObservability

0 likes · 7 min read

How Logs, Traces, and Metrics Differ—and Why It Matters

Programmer XiaoFu

Oct 28, 2025 · Backend Development

6 Ways to Measure API Response Time in Java

This article examines six practical techniques for measuring the latency of online interfaces in Java, from simple System.currentTimeMillis() calls to advanced AOP, interceptors, filters, and production‑grade monitoring tools like Micrometer and APM, comparing their precision, intrusiveness, and suitable scenarios.

AOPJavaMetrics

0 likes · 23 min read

6 Ways to Measure API Response Time in Java

Alibaba Cloud Developer

Oct 27, 2025 · Artificial Intelligence

How to Build a Quantifiable AI Coding Efficiency Metric System

This article explains how, amid the rapid rise of AI‑assisted programming, a scientific and actionable R&D efficiency metric framework was designed, detailing core indicators such as AI code adoption rate, data collection methods, platform architecture, and practical insights from a large‑scale implementation.

AIEfficiencyMCP

0 likes · 18 min read

How to Build a Quantifiable AI Coding Efficiency Metric System

Raymond Ops

Oct 12, 2025 · Operations

Master PromQL: From Basics to Advanced Query Techniques

This comprehensive guide walks you through PromQL fundamentals, covering data types, gauge and counter metrics, time‑series concepts, query selectors, offsets, arithmetic and logical operators, vector matching, aggregation functions, and key Prometheus functions such as increase, rate, and histogram_quantile, with practical examples and visual illustrations.

AlertingMetricsMonitoring

0 likes · 29 min read

Master PromQL: From Basics to Advanced Query Techniques

Efficient Ops

Oct 9, 2025 · Operations

Changan Auto’s Dual DevOps Certification: Boosting Delivery Speed and Quality

Changan Automobile’s Gaia platform V3.0 earned both international ITU and domestic DevOps certifications, demonstrating a mature, end‑to‑end DevOps system that dramatically shortened deployment cycles, reduced failure rates, and enhanced automation coverage, while outlining future plans for AI‑driven optimization and broader enterprise adoption.

AutomationContinuous DeliveryMetrics

0 likes · 16 min read

Changan Auto’s Dual DevOps Certification: Boosting Delivery Speed and Quality

Old Zhao – Management Systems Only

Sep 24, 2025 · Operations

Mastering Procurement: 6 Key Metrics Every Business Should Track

The article explains how quantifying six essential procurement metrics—cost savings, on‑time delivery, fulfillment, quality pass rate, inventory turnover, and emergency purchase ratio—using an SRM system can align bosses and buyers, improve cash flow, and drive cost‑effective, reliable production.

MetricsSRMcost reduction

0 likes · 9 min read

Mastering Procurement: 6 Key Metrics Every Business Should Track

Java One

Sep 21, 2025 · Operations

Mastering Prometheus rate, irate, and increase: When and How to Use Each

This article explains how Prometheus’s rate, irate, and increase functions calculate counter growth rates, handle counter resets, and differ in smoothing and responsiveness, guiding you to choose the appropriate function for monitoring request rates, CPU usage, and other metrics.

MetricsMonitoringincrease

0 likes · 7 min read

Mastering Prometheus rate, irate, and increase: When and How to Use Each

Efficient Ops

Sep 15, 2025 · Operations

Mastering Prometheus Histograms: From Basics to Advanced Queries

This article explains the fundamentals of Prometheus Histogram metrics, covering data format, metric types, how histograms work as cumulative time series, provides Go code examples for collection, and demonstrates practical queries for rate, bucket analysis, and quantile calculations to monitor service performance.

GoHistogramMetrics

0 likes · 12 min read

Mastering Prometheus Histograms: From Basics to Advanced Queries

Code Ape Tech Column

Sep 12, 2025 · Operations

Master Grafana & Prometheus: Step‑by‑Step Guide to Build a Full‑Featured Monitoring System

This comprehensive tutorial walks you through installing and configuring Grafana, Prometheus, and related exporters, setting up dashboards, enabling email alerts, and extending monitoring to MySQL, RabbitMQ, Redis, and TiDB, all while providing clear code snippets and practical tips for a robust observability stack.

AlertingMetricsdevops

0 likes · 24 min read

Master Grafana & Prometheus: Step‑by‑Step Guide to Build a Full‑Featured Monitoring System

dbaplus Community

Sep 1, 2025 · Operations

How to Keep VictoriaMetrics Stable During Sudden Metric Surges

This article outlines practical strategies for protecting VictoriaMetrics storage under bursty metric traffic, covering communication with business teams, splitting deployments, choosing single‑node versus cluster setups, key monitoring metrics, separate storage for self‑monitoring, the VMUI Explore UI, and techniques for discarding high‑cardinality metrics.

MetricsMonitoringVictoriaMetrics

0 likes · 10 min read

How to Keep VictoriaMetrics Stable During Sudden Metric Surges

Data Party THU

Jul 30, 2025 · Artificial Intelligence

When Metrics Mislead: Uncovering Simpson’s, Accuracy, and Goodhart Paradoxes in LLMs

The article examines three classic paradoxes—Simpson’s paradox, the accuracy paradox, and Goodhart’s law—showing how they arise in business intelligence and large language model contexts, and offers practical guidelines to detect and mitigate their misleading effects on data‑driven decisions.

Goodhart's lawLLMMetrics

0 likes · 12 min read

When Metrics Mislead: Uncovering Simpson’s, Accuracy, and Goodhart Paradoxes in LLMs

DeWu Technology

Jul 7, 2025 · Cloud Native

How to Achieve Service‑Level NAS Traffic Tracing with eBPF and Kubernetes

This article explains how to design and implement a service‑level NAS traffic tracing solution using Linux eBPF, NFS kernel hooks, and Kubernetes metadata to correlate container processes with NAS devices, generate real‑time metrics, and visualize them in Prometheus dashboards.

MetricsNASNFS

0 likes · 18 min read

How to Achieve Service‑Level NAS Traffic Tracing with eBPF and Kubernetes

Kuaishou Frontend Engineering

Jul 3, 2025 · Frontend Development

How Kuaishou’s Tianshou Platform Scales Front‑End Quality for Billions of Users

The article reviews the evolution of Kuaishou's Tianshou front‑end quality assurance platform, its layered architecture, distributed scheduler, quality models, measurement functions, DMAIC process, and lessons learned in scaling to billions of DAU, offering a blueprint for building robust front‑end engineering systems.

Metricsarchitecturedmaic

0 likes · 25 min read

How Kuaishou’s Tianshou Platform Scales Front‑End Quality for Billions of Users

Alibaba Cloud Developer

Jun 26, 2025 · Artificial Intelligence

How to Build a Multi‑Dimensional Evaluation Framework for AI‑Powered Data Analysis Platforms

This article outlines the design of a scientific, quantifiable, multi‑dimensional evaluation system for the DataV‑Note intelligent analysis platform, addressing the lack of unified standards and accuracy challenges in AI‑driven data reporting, and proposes concrete metrics, model architecture, and future automation plans.

AI evaluationMetricsModel Design

0 likes · 13 min read

How to Build a Multi‑Dimensional Evaluation Framework for AI‑Powered Data Analysis Platforms

Qiming AI - Digital Management Talk

Jun 23, 2025 · Operations

9 Essential Supply Chain Metrics to Transform Data‑Driven Decisions

This article outlines nine crucial supply‑chain metrics across procurement, production, logistics and overall efficiency, explains their formulas and real‑world examples, and shows how each indicator can be used to identify problems, benchmark performance, and drive data‑driven decision‑making for cost reduction and customer satisfaction.

Data-DrivenEfficiencyMetrics

0 likes · 12 min read

9 Essential Supply Chain Metrics to Transform Data‑Driven Decisions

Qunhe Technology Quality Tech

Jun 12, 2025 · Artificial Intelligence

Boosting CAD & Ad Design Algorithms with a Goldenset Review Platform

The article describes how a custom algorithm review platform, built around goldenset test cases, quantifies and visualizes CAD recognition and advertising design tool outputs, enabling rapid regression testing, objective metric tracking, and efficient manual review, ultimately improving development speed and bug detection rates.

AdvertisingCADMetrics

0 likes · 12 min read

Boosting CAD & Ad Design Algorithms with a Goldenset Review Platform

vivo Internet Technology

Jun 11, 2025 · Big Data

How Vivo Built a Scalable Pulsar Monitoring System for Trillion‑Message Workloads

This article details Vivo's end‑to‑end Pulsar observability solution, covering the challenges of Prometheus‑based monitoring, the architecture of the alerting pipeline, adaptor development, metric optimizations for subscription backlog and bundle load, and fixes for kop lag reporting issues.

Big DataMetricsMonitoring

0 likes · 12 min read

How Vivo Built a Scalable Pulsar Monitoring System for Trillion‑Message Workloads

Big Data Technology & Architecture

Jun 5, 2025 · Big Data

Flink Web UI Monitoring and End‑to‑End Latency Implementation Guide

This article explains the key monitoring items of the Flink Web UI, details task topology, operator and system metrics, checkpoint and log inspection, and provides two practical solutions—custom metrics and distributed tracing—to measure and visualize full‑chain latency in Flink jobs.

Big DataDistributed TracingFlink

0 likes · 10 min read

Flink Web UI Monitoring and End‑to‑End Latency Implementation Guide

Alibaba Cloud Observability

Jun 3, 2025 · Cloud Native

How PromQL Copilot Turns Natural Language into Precise Monitoring Queries

PromQL Copilot leverages Alibaba Cloud's observability platform and AI techniques to convert ambiguous natural‑language monitoring requests into accurate PromQL statements, addressing challenges of ambiguity, domain knowledge, and metric coverage while providing generation, explanation, diagnosis, and recommendation features for cloud‑native environments.

AICloud NativeMetrics

0 likes · 12 min read

How PromQL Copilot Turns Natural Language into Precise Monitoring Queries

Architecture Breakthrough

May 26, 2025 · R&D Management

How One KPI Can Transform R&D Efficiency: Lessons from TDengine

The article analyzes why overly complex R&D metrics often hinder productivity, proposes aligning indicators with company strategy and culture, and illustrates the approach with TDengine’s single‑KPI model and a three‑metric framework for banking, while also detailing the “Everything as Code” practices that boost development speed and quality.

Industry insightMetricsR&D efficiency

0 likes · 9 min read

How One KPI Can Transform R&D Efficiency: Lessons from TDengine

Dual-Track Product Journal

May 23, 2025 · Product Management

Essential E‑Commerce Product Manager Glossary: From GMV to AARRR

A comprehensive glossary for e‑commerce product managers that defines key metrics such as GMV, SKU, UV, CVR, AOV, CPC, and models like RFM and AARRR, while highlighting common pitfalls and practical strategies for data‑driven decision making.

Metricsconversion ratedata analysis

0 likes · 9 min read

Essential E‑Commerce Product Manager Glossary: From GMV to AARRR

Continuous Delivery 2.0

May 23, 2025 · Industry Insights

How Google’s Code Review Frequency Changes With Engineer Experience

A brief analysis of Google’s code review data shows an average of five comments per 100 lines of code and two comments per change, with comment density decreasing from eight per 100 lines for new hires to 4.5 after three years of experience.

GoogleMetricscode review

0 likes · 2 min read

How Google’s Code Review Frequency Changes With Engineer Experience

Java Architect Essentials

May 13, 2025 · Backend Development

Using @Timed Annotation in SpringBoot for Automatic Request Time Statistics

The article explains how the SpringBoot @Timed annotation can automatically record method execution times, replacing verbose manual timing code, and demonstrates basic and advanced usages with custom metric names and tags to simplify performance monitoring in backend development.

AnnotationJavaMetrics

0 likes · 6 min read

Using @Timed Annotation in SpringBoot for Automatic Request Time Statistics

Efficient Ops

May 7, 2025 · Operations

Why Choose SigNoz for Open‑Source Observability? A Deep Dive

This article introduces SigNoz, a self‑hosted open‑source observability platform that unifies metrics, logs, and traces, outlines its core capabilities, shows how to install it with Docker, and compares its resource efficiency to commercial solutions like DataDog and Elastic.

MetricsObservabilityOpenTelemetry

0 likes · 4 min read

Why Choose SigNoz for Open‑Source Observability? A Deep Dive

dbaplus Community

Apr 24, 2025 · Operations

How Ctrip Built a Scalable Observability Platform and AIOps Engine for Millions of Metrics and Logs

This article details Ctrip's end‑to‑end observability platform—covering metrics, logging, and tracing—its architecture, data governance, AIOps capabilities, and practical case studies, while addressing challenges like data volume, alert noise, and metric explosion in a massive micro‑service environment.

AIOpsCtripLogging

0 likes · 17 min read

How Ctrip Built a Scalable Observability Platform and AIOps Engine for Millions of Metrics and Logs

Raymond Ops

Apr 22, 2025 · Operations

What Is OpenTelemetry? A Complete Guide to Modern Observability

OpenTelemetry unifies tracing and metrics by merging OpenTracing and OpenCensus, offering vendor‑neutral APIs, SDKs, and a collector that standardize telemetry data collection, context propagation, and export to various back‑ends, with detailed components such as Tracer, Meter, and shared Context layers.

MetricsTelemetryTracing

0 likes · 12 min read

What Is OpenTelemetry? A Complete Guide to Modern Observability

21CTO

Apr 9, 2025 · Operations

9 Must‑Have Container Monitoring Tools and Best Practices for Modern Cloud‑Native Environments

This article reviews nine practical container‑monitoring solutions—from Last9 and Prometheus to Dynatrace and Elastic Observability—detailing their key features, pricing, and why developers prefer them, and then offers comprehensive best‑practice guidance for metrics, tagging, alerts, and advanced observability strategies in Kubernetes‑driven cloud‑native deployments.

AlertingCloud NativeMetrics

0 likes · 25 min read

9 Must‑Have Container Monitoring Tools and Best Practices for Modern Cloud‑Native Environments

FunTester

Apr 2, 2025 · Cloud Native

Using the Kubernetes Java Client: Metrics, Resource API, CRDs, Typed and Untyped Operations

This article demonstrates how to use the Kubernetes Java client to retrieve metrics, manage resources, work with custom resource definitions, and operate both typed and untyped APIs, providing code examples for creating, listing, updating, deleting, and watching Kubernetes objects.

CRDCloudNativeJava

0 likes · 11 min read

Using the Kubernetes Java Client: Metrics, Resource API, CRDs, Typed and Untyped Operations

Tencent Cloud Developer

Mar 19, 2025 · Cloud Native

Kubernetes Monitoring: Why It’s Needed, Core Components, and Metric Exposure

Monitoring Kubernetes is essential to detect resource contention, component failures, and network issues; it involves tracking core component metrics such as API server latency, etcd write times, scheduler delays, as well as node‑level CPU, memory, disk, and network statistics, pod health, and custom application metrics exposed via Prometheus exporters for comprehensive observability.

Cloud NativeExportersMetrics

0 likes · 23 min read

Kubernetes Monitoring: Why It’s Needed, Core Components, and Metric Exposure

JD Tech

Mar 6, 2025 · Operations

Building and Managing Business Monitoring Indicators: Principles, Design, and Implementation

This article explains the importance of business monitoring, distinguishes technical and business metrics, outlines a step‑by‑step process for constructing a business indicator system, and provides practical methods, tools, and common pitfalls for effective operations monitoring.

AlertingIndicator DesignMetrics

0 likes · 12 min read

Building and Managing Business Monitoring Indicators: Principles, Design, and Implementation

Model Perspective

Mar 3, 2025 · Fundamentals

When Numbers Mislead: Rethinking the Limits of Quantitative Thinking

This essay examines how our obsession with metrics—likes, reads, KPIs, and GDP—can distort reality, urging a balance between data‑driven decisions and the unquantifiable values of creativity, happiness, and freedom.

Metricsdata biasdecision making

0 likes · 8 min read

When Numbers Mislead: Rethinking the Limits of Quantitative Thinking

JD Tech Talk

Feb 26, 2025 · Operations

Business Monitoring: Importance, Metric System Design, and Practical Implementation

This article explains the significance of business monitoring, distinguishes technical and business metrics, outlines a step‑by‑step process for building a business metric system, and shares practical experiences, tools, and common pitfalls to help teams improve operational reliability and decision‑making.

Incident ManagementMetricsOperations

0 likes · 13 min read

Business Monitoring: Importance, Metric System Design, and Practical Implementation

MaGe Linux Operations

Feb 9, 2025 · Operations

Step‑by‑Step Guide to Installing, Configuring, and Using Prometheus on CentOS

This tutorial walks you through downloading and running Prometheus on CentOS, configuring its own self‑monitoring, opening firewall ports, adding Node Exporter targets, creating recording rules, and visualizing metrics with the built‑in graph UI, complete with command‑line examples and screenshots.

MetricsNode ExporterRecording Rules

0 likes · 10 min read

Step‑by‑Step Guide to Installing, Configuring, and Using Prometheus on CentOS

Bitu Technology

Jan 15, 2025 · Operations

Refactoring Playback Error Reporting, Metrics, and Recovery in Tubi Web/OTT Player

The article details how Tubi's Web/OTT team restructured player error reporting, statistical metrics, and unified handling, introduced precise error‑tracking enums, defined new recovery strategies for device decoding, network, and cache issues, and validated their impact through extensive experiments that improved user experience and key business KPIs.

MetricsOTTOperations

0 likes · 14 min read

Refactoring Playback Error Reporting, Metrics, and Recovery in Tubi Web/OTT Player

Linux Ops Smart Journey

Jan 7, 2025 · Operations

Enable Nacos Metrics in Prometheus and Visualize with Grafana

This guide shows how to enable Nacos metrics, configure Prometheus to scrape them, and visualize the data with a Grafana dashboard, providing a centralized view across different departments for enterprise monitoring and decision‑making.

MetricsMonitoringgrafana

0 likes · 4 min read

Enable Nacos Metrics in Prometheus and Visualize with Grafana

Alibaba Cloud Infrastructure

Jan 3, 2025 · Cloud Native

How to Enable LLM Traffic Observability with Alibaba Cloud Service Mesh (ASM)

This guide explains how to use Alibaba Cloud Service Mesh (ASM) to add infrastructure‑level observability for large language model (LLM) traffic, covering custom access‑log fields, new Prometheus metrics for token usage, and adding model dimensions to native Istio metrics, with step‑by‑step commands and configuration examples.

ASMLLMMetrics

0 likes · 14 min read

How to Enable LLM Traffic Observability with Alibaba Cloud Service Mesh (ASM)

Architect

Dec 31, 2024 · Operations

Integrating Prometheus with Spring Boot and Visualizing Metrics Using Grafana

This guide explains how to monitor a Spring Boot application using Prometheus, configure Spring Boot Actuator, run Prometheus (including Docker deployment), set up Grafana for visualizing metrics, and create custom metrics with Micrometer, providing step‑by‑step instructions and code examples.

DockerMetricsSpring Boot

0 likes · 10 min read

Integrating Prometheus with Spring Boot and Visualizing Metrics Using Grafana

Kuaishou Tech

Dec 11, 2024 · Frontend Development

Performance Governance and Optimization of Kuaishou Commercial Frontend Pages

This article presents a comprehensive analysis of page performance issues across Kuaishou's commercial front‑end projects, outlines the challenges of unified governance, B‑end experience measurement, and C‑end web‑native integration, and details the systematic optimization strategies and measurable results that significantly improved user experience and business metrics.

GovernanceKuaishouMetrics

0 likes · 23 min read

Performance Governance and Optimization of Kuaishou Commercial Frontend Pages

Zhuanzhuan Tech

Dec 11, 2024 · Big Data

Design and Implementation of a Data Warehouse Evaluation System for Governance and Performance

This article presents the motivation, design principles, architecture, metric system, and results of a data‑warehouse evaluation framework that quantifies efficiency, quality, cost, and model health to drive systematic governance and continuous improvement across the organization.

Big DataData GovernanceData Warehouse

0 likes · 15 min read

Design and Implementation of a Data Warehouse Evaluation System for Governance and Performance

iQIYI Technical Product Team

Nov 28, 2024 · R&D Management

Advanced Exploration and Practice of Value Delivery in Project Management

At the 12th QECon conference, iQIYI presented a systematic value‑delivery framework that tackles misaligned goals, planning‑execution gaps, and metric deficiencies by using a two‑scenario model for iterative and special projects—defining SMART goals, tight scope control, continuous monitoring, and AI‑driven automation—to accelerate rollout, quantify impact, and guide future integrated, intelligent delivery.

AIMetricsR&D Management

0 likes · 15 min read

Advanced Exploration and Practice of Value Delivery in Project Management