

深度解析 rag-vector-agent-semantic-kernel:基于 Semantic Kernel 的 Agentic RAG 实践
是一个基于的开源 Agentic RAG(Retrieval-Augmented Generation)项目。它集成了向量数据库、检索增强生成、Agent 工作流和插件机制,支持多种大模型(如 OpenAI、Azure OpenAI、Ollama、Phi3 等),可用于构建企业级智能问答、知识管理、自动化助手等应用。支持多种 LLM(OpenAI、Azure、Ollama、Phi3 等)灵活的向量数据库集成(Chroma、Qdrant、Azure AI Search 等)

[论文阅读] 人工智能 + 软件工程 | 当LLMs遇上顺序API调用:StateGen与StateEval如何破解测试难题?
本文解析了论文《Evaluating LLMs on Sequential API Call Through Automated Test Generation》的核心内容。论文针对LLMs在顺序API调用中的能力评估难题,提出了自动测试框架StateGen和基准StateEval。StateGen能根据API文档生成含顺序调用的可执行程序,并转换为自然语言指令;StateEval包含120个测试案例,覆盖三个真实场景。实验显示,闭源LLM(如GPT-4.1)表现优于开源模型
