本地 MCP 服务器用于代理就绪的 Web UI 上下文
viewgraph,来自Sourjya Sankar Sen,是一个MCP服务器,将实时网页转换为紧凑的、适合代理的UI上下文,以供AI编码助手使用。它捕获DOM结构、视觉布局和交互元素映射,以便代理可以以更低的令牌开销引用界面控件。该项目捆绑了一个浏览器扩展、会话捕获工具和本地存储。目标用户是将代理工具集成到开发和测试工作流程中的软件工程师和QA测试人员。
它为代理启用哪些实际任务?
服务器将实时页面转换为结构化的、适合代理的用户界面上下文,以便模型可以执行面向界面的工作,而不是解析原始 HTML。捕获包括布局、DOM 选择器、样式和索引的交互元素,使得可以执行诸如用户界面审计、程序化导航和可重现的错误重放等任务。输出旨在减少模糊性,当代理在自动化测试中必须选择激活哪个控件时。
- 用户界面审计和可访问性检查
- 端到端测试的脚本导航
- 可重现的错误捕获以供报告
生成的用户界面上下文有多可靠和紧凑?
该工具生成令牌高效的捕获,使用操作清单格式将捕获大小减少多达 85% 相较于原始 HTML。空间索引通过坐标提供 O(log n) 元素查询,支持在密集布局中进行精确选择。录制的会话将 HTML 快照与屏幕截图配对,以便多步骤流程在分析过程中保留结构和视觉参考以供验证。
团队能否在不进行大量重工作的情况下将其集成到现有的代理工作流程中?
服务器作为 MCP 兼容的 Node.js/NPM 服务运行,并包括一个用于手动捕获的 Chrome 扩展,适合支持 MCP 的代理设置。它支持多达四个项目的自动 URL 路由,并将捕获本地存储在 .viewgraph 目录中。开发者的目标是软件工程师和质量保证测试人员;使用 MCP 兼容客户端的团队可以直接附加代理,而独立测试人员可以导出带注释的报告。
为嵌入自主工作流程的工程团队提供的专业工具
该服务器适合已经依赖自主工具并需要更高保真度界面上下文的工程和质量保证团队;社区反馈指出其技术重点和代币节省是其优势。预计将有一个面向开发者的设置,并计划手动验证代理操作,因为输出提供的是结构化上下文,而不是关于正确性的权威决策。