Tagged articles

document retrieval

13 articles · Page 1 of 1

Mar 21, 2026 · Artificial Intelligence

Turn PDFs, Word Docs, and Images into Instant Answers with WeKnora’s LLM‑Powered Search

WeKnora is a Tencent‑open‑source LLM‑based document understanding and semantic search framework that extracts structured content from PDFs, Word files and images, offers agent‑driven reasoning, multi‑modal retrieval, and a modular architecture, with step‑by‑step Docker deployment and a web UI for instant querying.

AILLMRAG

0 likes · 7 min read

Turn PDFs, Word Docs, and Images into Instant Answers with WeKnora’s LLM‑Powered Search

Architect's Alchemy Furnace

Mar 20, 2026 · Artificial Intelligence

Why Vector‑Based RAG Falls Short and How PageIndex’s Reasoning‑Based Retrieval Solves It

This article analyzes the fundamental limitations of traditional vector‑based Retrieval‑Augmented Generation, introduces Vectify AI’s reasoning‑driven PageIndex framework, and explains how hierarchical, non‑vector indexing enables more accurate, context‑aware document retrieval for complex, domain‑specific texts.

AILLMPageIndex

0 likes · 15 min read

Why Vector‑Based RAG Falls Short and How PageIndex’s Reasoning‑Based Retrieval Solves It

Architecture Digest

Jan 22, 2026 · Artificial Intelligence

Unlock AI-Powered Document Search with WeKnora: A Hands‑On Guide

WeKnora is an open‑source LLM‑driven framework that transforms complex, multi‑format documents into searchable semantic knowledge, offering features such as Agent mode, hybrid retrieval, secure private deployment, and an easy‑to‑use web UI, with step‑by‑step installation instructions and demo screenshots.

AILLMWeKnora

0 likes · 7 min read

Unlock AI-Powered Document Search with WeKnora: A Hands‑On Guide

Su San Talks Tech

Jan 21, 2026 · Artificial Intelligence

Turn PDFs into Smart Search Engines with WeKnora’s Open‑Source LLM Framework

WeKnora is an open‑source Tencent framework that leverages large language models, multimodal parsing and hybrid retrieval to let users query PDFs, Word files, images and other complex documents with natural language, offering a web UI, API and secure private‑cloud deployment options.

AgentDockerLLM

0 likes · 6 min read

Turn PDFs into Smart Search Engines with WeKnora’s Open‑Source LLM Framework

Sohu Tech Products

Jan 14, 2026 · Artificial Intelligence

Build a Zero‑Cost Open‑Source RAG Smart Document Q&A System from Scratch

This guide walks through building an open‑source Retrieval‑Augmented Generation (RAG) system that indexes local files with Everything, uses hybrid BM25‑vector search via Elasticsearch, and answers questions with a local LLM, covering architecture, core techniques, deployment steps, performance tweaks, and common pitfalls.

ElasticsearchLLMPython

0 likes · 11 min read

Build a Zero‑Cost Open‑Source RAG Smart Document Q&A System from Scratch

Tech Stroll Journey

Nov 9, 2025 · Backend Development

How to Deploy AnythingLLM Locally with Docker for Enterprise Document RAG

This guide walks through setting up a Ubuntu VM, installing Docker, pulling the AnythingLLM image, configuring storage, launching the container, and using it to ingest and query local documents with a DeepSeek‑R1 model.

AI DeploymentAnythingLLMDeepSeek

0 likes · 6 min read

How to Deploy AnythingLLM Locally with Docker for Enterprise Document RAG

Mingyi World Elasticsearch

Jul 22, 2025 · Artificial Intelligence

Zero-Code Setup: Build a Local Document Knowledge Base with Coco AI 0.7.0

This guide walks you through a completely code‑free, step‑by‑step process to download Coco AI 0.7.0, configure the server and client, set up a local connector, link Ollama models, and verify both simple and deep‑thinking AI modes for document retrieval and intelligent Q&A.

0.7.0AI SearchCoco AI

0 likes · 5 min read

Zero-Code Setup: Build a Local Document Knowledge Base with Coco AI 0.7.0

Full-Stack Cultivation Path

Sep 4, 2024 · Artificial Intelligence

Hot Open-Source RAG Tool for Document Chat: GraphRAG, Multimodal QA & Complex Reasoning

This article introduces Kotaemon, an open‑source Retrieval‑Augmented Generation platform that lets users chat with their documents, offering a self‑hosted web UI, support for local and API LLMs, hybrid retrieval, multimodal question answering, GraphRAG indexing, and advanced reasoning capabilities, along with step‑by‑step installation via App or Docker.

GraphRAGLLMRAG

0 likes · 6 min read

Hot Open-Source RAG Tool for Document Chat: GraphRAG, Multimodal QA & Complex Reasoning

Sohu Tech Products

Mar 27, 2024 · Artificial Intelligence

Building a RAG Application with Baidu Vector Database and Qianfan Embedding

This tutorial walks through building a Retrieval‑Augmented Generation application by setting up Baidu’s Vector Database and Qianfan embedding service, configuring credentials, creating a document database and vector table, loading and chunking PDFs, generating embeddings, storing them, and performing scalar, vector and hybrid similarity searches, ready for integration with Wenxin LLM for answer generation.

AI ApplicationsBaidu QianfanEmbedding

0 likes · 11 min read

Building a RAG Application with Baidu Vector Database and Qianfan Embedding

Rare Earth Juejin Tech Community

Mar 22, 2024 · Artificial Intelligence

Improving Document Search with Vector Search: From Elasticsearch Limitations to Milvus Integration

This article explains how traditional keyword search with Elasticsearch often yields inaccurate or incomplete results for document retrieval, introduces vectorization and semantic search using NLP embeddings, and demonstrates a practical workflow that combines these techniques with the Milvus vector database to achieve more accurate and efficient document search.

AIElasticsearchMilvus

0 likes · 13 min read

Improving Document Search with Vector Search: From Elasticsearch Limitations to Milvus Integration

ByteDance Web Infra

Jun 16, 2023 · Artificial Intelligence

How AIGC Transforms Document Search: Architecture, Techniques, and Future Directions

This article explains how AI‑generated content (AIGC) reshapes document search by combining traditional indexing with modern embedding and prompt‑tuning techniques, reviews key components such as LangChain and Supabase, compares existing AI‑search products, and discusses the future blend of classic and AI‑driven search.

AI SearchAIGCEmbedding

0 likes · 15 min read

How AIGC Transforms Document Search: Architecture, Techniques, and Future Directions

DataFunTalk

Jun 18, 2022 · Artificial Intelligence

Intelligent Question Answering in WeChat Search: Knowledge‑Graph QA and Document‑Based QA Techniques

This article introduces the intelligent question‑answering technology used in WeChat Search, covering background, knowledge‑graph‑based QA, document‑based QA, technical pipelines, key modules such as entity linking and relation recognition, and future research directions.

AIKnowledge GraphSearch Engine

0 likes · 20 min read

Intelligent Question Answering in WeChat Search: Knowledge‑Graph QA and Document‑Based QA Techniques

Meituan Technology Team

Aug 5, 2021 · Artificial Intelligence

Overview of Meituan's ACL 2021 Accepted Papers

Meituan’s 2021 ACL contributions comprise seven accepted papers—six long and one short—introducing novel approaches to event argument decoding, cross‑domain slot transfer, contrastive out‑of‑domain detection, novel slot discovery, self‑supervised sentence representation, unsupervised semantic parsing, and pseudo‑query‑enhanced dense retrieval, inviting further research and collaboration.

ACLEvent ExtractionMeituan

0 likes · 22 min read

Overview of Meituan's ACL 2021 Accepted Papers