跳转至

乐问学术搜索 API

Lewen — 学术论文搜索 RESTful API,支持语义检索、标题匹配、论文详情与引用关系查询。


核心能力

功能 端点 说明
语义搜索 GET /paper/search 稀疏 / 稠密 / 混合检索
标题检索 GET /paper/search/title 基于标题相似度匹配
论文详情 GET /paper/{paper_id} 支持 SHA / arXiv ID / Corpus ID / URL
引用列表 GET /paper/{paper_id}/citations 引用该论文的论文
参考文献 GET /paper/{paper_id}/references 该论文引用的论文

快速开始

发起一次搜索

curl "http://210.45.70.162:4000/paper/search?query=transformer%20attention&limit=5"
import requests

r = requests.get("http://210.45.70.162:4000/paper/search", params={
    "query": "transformer attention",
    "limit": 5,
})
print(r.json())

查询单篇论文

curl "http://210.45.70.162:4000/paper/2309.06180?fields=*"

技术栈

组件 选型 说明
Web 框架 FastAPI + uvicorn 异步 HTTP
关系数据 SQLite (WAL) 论文元数据、引用关系、ID 映射
全文检索 SQLite FTS5 BM25 排序
向量检索 Qdrant 高性能向量数据库
Embedding BGE-M3 (1024 维) title + abstract 编码
混合排序 RRF 融合 FTS5 + Qdrant 结果

数据规模

数据 规模
论文元数据 ~300 万(仅 arXiv + abstract)
引用关系 ~3000 万条边
向量索引 ~300 万 (Qdrant)

下一步