你好,我是

任春晓(Elin).

全栈工程师

新加坡国立大学(NUS)Master of Computing(CS 方向)在读。从数据建模到云端 UI 交付,端到端 ship LLM Agent、应用 ML 流水线与全栈应用。在寻找 SWE / MLE 实习。

01. 关于我

  • 气候政策证据知识图谱平台(Neo4j + GraphRAG)· 网络风险多智能体硕士论文(NUS)· Seeyon 垂直代码生成 Agent · 基于 Neo4j 疾病知识图谱的医疗问答系统。
任春晓 (Elin)

02. 研究

气候政策知识图谱主页 —— Topic → Policy Instrument → Outcome → Evidence Papers 入口卡片,可见 Drivers 四个根类目(Policy and Regulation、Physical Climate Shock、Technology and Market Shifts、Other Drivers)以及每张卡片的论文数。

研究

气候政策证据知识图谱平台

[进行中] · 2026-01 — 至今

Chunxiao Ren

研究助理 @ 新加坡国立大学

一个把气候政策领域 PDF 学术文献批量转成可查询、可溯源证据知识图谱的研究平台——让 LLM Agent 在引用经白名单校验、证据不足主动拒答、并带四层抗幻觉约束的前提下回答研究者问题。后端以 MinerU 解析 PDF、GPT-4 抽取 Finding / Evidence / Driver / Outcome 节点导入 Neo4j Aura 云图数据库,Query Router v2 将问题单次分类为 T1–T4 四类,T3 元数据查询走 26 个确定性 Cypher 模板零 LLM 成本,T1/T2 走五路并行检索(语义 / 混合 / 图扩展 / 社区摘要 / Cypher 精确兜底)后由受约束 Agent 生成结构化 Section 输出;置信度评分由程序化双轨系统独立计算,经用户反馈驱动的 OLS 离线校准,而非 LLM 自报。前端基于 React + Vite,回答以 SSE section 事件逐块渲染,内置力导向图谱可视化与交互式邻居扩展,部署于云端服务器并通过 Caddy + ngrok 对外提供 HTTPS 访问。架构细节、抗幻觉栈与截图详见 Read deep dive。

  • Python
  • Neo4j
  • MinerU (PDF parsing)
  • Vector + GraphRAG retrieval
  • GPT-5.4-mini (keyword extraction)
  • OLS calibration
  • React + Vite
  • react-force-graph-2d
  • SQLite (feedback)

研究

Domain-Specific Agents:网络安全风险分析多智能体框架

[进行中] · 2026-01 — 至今

Chunxiao Ren

硕士毕业论文 @ 新加坡国立大学计算学院

一个面向网络安全风险分析的、领域结构化、证据驱动的多智能体框架(MSc 毕业论文原型)。系统将风险推理任务分解为五个角色专精的 Agent —— Exposure / Likelihood / Impact / Coordinator / Critic —— 每个 Agent 拥有独立的 Pydantic 类型化 schema 与 prompt,并支持两种执行模式:纯 LLM 流水线 和 JELAS 神经符号流水线(在任何 LLM 调用之前注入预计算的知识图谱 + Datalog 风险事实)。 框架围绕 5 个可验证假设:(C1) 网络安全风险更应被建模为结构化推理而非单一不透明预测;(C2) 领域对齐角色比通用 planner / reviewer 角色产生更可解释的中间状态;(C3) 证据驱动推理提升一致性与可信度;(C4) 轻量级条件式校验优于无约束多智能体辩论;(C5) 跨案例「分析师经验」可以无需重训复用 —— 通过改编自 LLMTraveler 的 Jaccard × EWMA-recency CaseMemory 实现。Block 化 prompt 让每个组件廉价可消融,每个 claim 有对应 A/B 实验。

  • Python
  • Pydantic v2 (typed schemas)
  • LLM orchestration
  • JELAS neuro-symbolic engine
  • Datalog
  • CaseMemory (Jaccard × EWMA-recency)
  • Block-ablatable prompts
CyberAssessment 主页 —— 大标题「Let's start your Cyber Assessment」,右上是三步 Your Workflow 面板(1. 公司画像收集 · 2. 历史事件参照 · 3. 场景建模与损失估算),下面一块 Estimated Duration ~10m 的「从 URL 到风险报告」时长 tile,左侧一个 Get Started CTA 按钮。

研究

网络安全风险评估平台

[已完成] · 2025-09 — 2026-02

Chunxiao Ren

研究助理 / 主力开发 @ 新加坡国立大学计算学院

一个面向保险承保员与中小企业的网络安全风险评估 Web 平台,通过 "引导式录入 → 分析 → 报告" 的工作流交付评估结果。我作为团队产品侧的主力开发,端到端负责整套 Web 栈 —— 前端、后端、 数据库、用户登录与基于角色的页面分流、管理员工具、反馈收集与云端部署 —— 将团队底层的 风险引擎封装为一个承保员可以从单一公司 URL 起、约十分钟走完全流程的产品。属于团队内部的 商业化项目。

  • Python
  • Flask
  • Tailwind CSS
  • Authlib (Google OAuth)
  • bcrypt
  • SQLite
  • OpenAI API (SSE)
  • SentenceTransformers
  • Jina Reader API
  • PyKEEN / NetworkX
  • gunicorn
  • ngrok
  • Vagrant

研究

基于大语言模型的医疗问答系统 (RAG)

[已完成] · 2025-01 — 2025-05

Chunxiao Ren

研究助理 @ 拉彭兰塔工业大学

一条医疗问答流水线,用 Neo4j 知识图谱上的结构化 Cypher 检索替代向量库 RAG —— 针对 LLM 在安全关键领域的幻觉问题。底层基于 DiseaseKG(约 4.46 万实体、31.2 万边);NER 微调 chinese-roberta-wwm-ext + BiLSTM,意图识别用 34B LLM 跑 few-shot prompt,答案在检索到的三元组上由 Qwen / Llama(UI 可切换)合成。Streamlit 前端,带用户 / 管理员登录。知识图谱 schema、数据增强策略与完整检索流程详见 Read deep dive。

  • Python
  • Neo4j 5.18
  • chinese-roberta-wwm-ext
  • BiLSTM (2-layer) + Linear classifier
  • BIO tagging
  • TF-IDF entity alignment
  • 34B LLM (intent, few-shot + CoT)
  • Qwen / Llama
  • Streamlit

03. 工作经历

AI 大模型算法实习生

@ Beijing Seeyon Internet Software

2025-05 — 2025-08 · 中国 北京 · CoMi Agent / V5 PaaS

  • 通过结构化评估与 prompt 工程,对 Qwen、GLM、Llama、DeepSeek 在企业工作流代码生成任务上进行 benchmark,为致远自研模型的选型与增强提供依据。
  • 微调致远自研 LLM「CoMi」,使其在 V5 PaaS 平台上生成 Python 业务逻辑脚本,实现 OA 工作流/模板的自动化生成,可执行率达 90% 以上,人工配置工作量减少 20%。
  • 基于真实工作流文档构建高质量微调数据集,引入语义一致性 Loss 与 AST Loss,提升生成脚本的语法正确性和业务逻辑可靠性。
  • Python
  • PyTorch
  • LLM Fine-tuning
  • SFT/LoRA
  • Qwen
  • GLM
  • DeepSeek
  • Prompt Engineering

04. 一些项目

精选项目

新加坡公屋自动估值模型

2025-08 — 2025-12 · 协同开发

面向 HDB 公屋转售价格预测的端到端 ML 流水线,主数据来自 Kaggle(训练集 162,691 条 / 测试集 5 万条,2017–2025), 并通过新加坡政府开放 API 补充了 5 类地理 POI(约 774 个点:地铁站、小学、中学、商场、熟食中心)。用 sklearn BallTree + Haversine 工程化每样本约 20 个邻近度特征,含双半径密度计数与分级标记(名校、地铁核心线、旗舰商场)。 最终模型为 CatBoost + LightGBM + XGBoost 的 stacking(5 折 OOF + 无截距线性元学习器),对建筑面积与剩余租约 施加单调性约束;3-seed 平均;面向前 10% 高价房做二阶段精修。验证集 log-RMSE 从 v2 的 0.061 降到 v3 的 0.050, 约 18% 提升。

  • BallTree + Haversine 覆盖约 774 个 POI,每样本约 20 个邻近度特征(双半径密度、最近距离、KNN-3、等级标记)。
  • Stacking 集成 —— CatBoost + LightGBM + XGBoost + 5 折 OOF + 无截距线性元学习器。
  • 面向前 10% 高价房的二阶段精修;3-seed(42 / 100 / 2025)平均。
  • 验证集 log-RMSE 从 0.061 降到 0.050(约 18% 提升),覆盖 v2 → v3 的演进。
  • Python
  • CatBoost
  • LightGBM
  • XGBoost
  • scikit-learn (BallTree, Haversine)
  • Stacking + linear meta
  • pandas
  • NumPy

新加坡公屋自动估值模型

精选项目

多策略电影推荐系统

2025-01 — 2025-06 · 协同开发

系统性梳理推荐系统的五大方法族 —— 人口统计基线、基于内容召回(TF-IDF + CountVectorizer)、 KNN 协同过滤(item / user)、三种优化器的 SVD 矩阵分解(SGD / SGLD / SGHMC),以及三种混合流水线 —— 在 MovieLens ml-1m 上完成评估。单路最佳召回:User-CF,hit rate 14.54%;最佳评分预测模型: SVD-SGHMC,RMSE 0.84117。

  • 端到端实现九种推荐算法:人口统计基线、2 种内容召回、2 种 KNN-CF、3 种 SVD 优化器、3 种混合流水线。
  • User-CF 在 15% 测试集上 hit rate 14.54%(878 / 6040),是最强的单路召回。
  • SVD 配 SGHMC 优于 SGD 与 SGLD:MovieLens ml-1m 上 5 折 CV RMSE 0.84117。
  • 「召回 + 重排」混合以原始命中率换取评分感知的排序。
  • Python
  • scikit-learn
  • TF-IDF / CountVectorizer
  • KNN (item / user)
  • SVD
  • SGD / SGLD / SGHMC
  • MovieLens ml-1m
  • TMDB 5000
  • pandas
  • NumPy

多策略电影推荐系统

精选项目

TeamClaw —— 本地优先的多智能体工作台

2026-01 — 2026-03 · 开源项目贡献

参与共建 TeamClaw —— 一个本地优先的多智能体工作台:对外暴露 OpenAI 兼容的 /v1/chat/completions 端点,内部带可视化编排层 OASIS,支持 sequential / parallel / selector / DAG 四种工作流。在统一的 Team 抽象下整合三类 Agent:Stateless 专家、Stateful 会话型、External-API(含 OpenClaw)。Team Creator 可以把一段任务描述或抓取到的 SOP 页面,自动转成角色、人设与可运行的 DAG。底层是 living GraphRAG 记忆(SQLite + 可选 Zep 镜像),配合多模态 I/O、Telegram / QQ Bot 桥与 Cloudflare Tunnel 一键公开访问。

  • OpenAI 兼容的本地端点 /v1/chat/completions —— 任意 OpenAI 客户端可直连。
  • OASIS 编排引擎:sequential / parallel / selector / DAG 四种工作流,统一调度 Stateless / Stateful / External-API 三类 Agent。
  • Team Creator 把一段任务描述或 SOP 页面自动转成角色、人设与可运行的 DAG。
  • Living GraphRAG 记忆(SQLite + 可选 Zep 镜像)+ 多模态 I/O + Telegram / QQ Bot 桥 + Cloudflare Tunnel 一键公开访问。
  • Python
  • FastAPI / Flask
  • LangGraph
  • OASIS engine
  • MCP toolchain
  • OpenAI-compatible API
  • GraphRAG (Zep)
  • SQLite
  • Cloudflare Tunnel

TeamClaw —— 本地优先的多智能体工作台