跳转至内容
  • 版块
  • 最新
  • 热门
  • 标签
  • 搜索
  • 成员
皮肤
  • 浅色
  • Brite
  • Cerulean
  • Cosmo
  • Flatly
  • Journal
  • Litera
  • Lumen
  • Lux
  • Materia
  • Minty
  • Morph
  • Pulse
  • Sandstone
  • Simplex
  • Sketchy
  • Spacelab
  • United
  • Yeti
  • Zephyr
  • 深色
  • Cyborg
  • Darkly
  • Quartz
  • Slate
  • Solar
  • Superhero
  • Vapor

  • 默认(不使用皮肤)
  • 不使用皮肤
折叠
LocalAIHub 中文社区

LocalAIHub 中文社区

陈

陈小舟

@陈小舟
取消关注 关注
关于
帖子
14
主题
3
分享
0
群组
0
粉丝
0
关注
0

帖子

最新 最佳 有争议的

  • 生产环境要不要允许管理员后台直接改 Prompt
    陈 陈小舟

    我准备把后台改成草稿发布,不能直接上线。

    AI 工程讨论 prompt production governance

  • 生产环境要不要允许管理员后台直接改 Prompt
    陈 陈小舟

    管理员后台可以直接改系统 Prompt,业务方很喜欢,工程很怕。你们会开吗?

    AI 工程讨论 prompt production governance

  • WebSocket 断了以后,页面还以为自己在线
    陈 陈小舟

    这像 WebSocket 断了。浏览器控制台看 socket.io 有没有 reconnect 或 transport close。

    实践复盘 websocket nginx realtime

  • RAG 资料员是不是应该自己打开浏览器核验
    陈 陈小舟

    我们让审校员检查 source-grounding:每个关键断言能不能在来源里找到。

    AI 工程讨论 rag browser researcher-agen source

  • 主控、审校、资料员,三类角色怎么分才不乱
    陈 陈小舟

    这个线程有用。我准备把审校输出改成 pass/block 两档,加 block_reason,不让它重写整段。

    AI 工程讨论 supervisor reviewer researcher handoff

  • 浏览器自动化能干活,但别把网页当 API
    陈 陈小舟

    浏览器自动化和 RPA 的边界在哪?

    AI 工程讨论 browser-automat playwright selenium agent

  • 长任务恢复别靠“继续刚才”
    陈 陈小舟

    JSON 够吗?会不会模型看不懂?

    AI 工程讨论 long-task checkpoint recovery logs

  • 提示词评审要不要像代码评审一样走 PR
    陈 陈小舟

    我准备先把后台直接编辑关掉,改成 Git 管理。

    AI 工程讨论 prompt-review governance git

  • 提示词评审要不要像代码评审一样走 PR
    陈 陈小舟

    cases 是人工写的吗?

    AI 工程讨论 prompt-review governance git

  • 主控、审校、资料员,三类角色怎么分才不乱
    陈 陈小舟

    想问下三角色工作流:主控负责计划,资料员找资料,审校员检查答案。这个边界听起来清楚,实际跑起来很容易互相抢活。

    AI 工程讨论 supervisor reviewer researcher handoff

  • 提示词评审要不要像代码评审一样走 PR
    陈 陈小舟

    我们现在改系统提示词是产品在后台直接改。出了问题才知道。要不要像代码一样走 PR?

    AI 工程讨论 prompt-review governance git

  • Gemma 适合放在什么位置?
    陈 陈小舟

    我们把小模型当前置摘要器,压缩检索段落,再给大模型。好处是省 token,坏处是小模型摘要错了后面救不回来。

    AI 工程讨论 gemma google 小模型 边缘部署

  • KV cache 到底帮什么,为什么不是所有请求都变便宜?
    陈 陈小舟

    我们做过一个优化:把固定工具说明放最前,检索内容放后面。这样前缀缓存更容易命中。

    AI 工程讨论 kv-cache vllm llama.cpp 成本控制

  • Token 预算怎么拆,别让系统提示被业务内容挤掉
    陈 陈小舟

    比例不如优先级。系统和工具协议不可删,当前用户消息不可删,证据按相关度删,历史要先摘要再删。

    AI 工程讨论 token预算 系统提示 成本控制
  • 登录

  • 没有帐号? 注册

  • 登录或注册以进行搜索。
Powered by NodeBB Contributors
  • 第一个帖子
    最后一个帖子
0
  • 版块
  • 最新
  • 热门
  • 标签
  • 搜索
  • 成员