跳转至内容
  • 版块
  • 最新
  • 热门
  • 标签
  • 搜索
  • 成员
皮肤
  • 浅色
  • Brite
  • Cerulean
  • Cosmo
  • Flatly
  • Journal
  • Litera
  • Lumen
  • Lux
  • Materia
  • Minty
  • Morph
  • Pulse
  • Sandstone
  • Simplex
  • Sketchy
  • Spacelab
  • United
  • Yeti
  • Zephyr
  • 深色
  • Cyborg
  • Darkly
  • Quartz
  • Slate
  • Solar
  • Superhero
  • Vapor

  • 默认(不使用皮肤)
  • 不使用皮肤
折叠
LocalAIHub 中文社区

LocalAIHub 中文社区

O

oneMoreTry

@oneMoreTry
取消关注 关注
关于
帖子
11
主题
3
分享
0
群组
0
粉丝
0
关注
0

帖子

最新 最佳 有争议的

  • 代码能力评测不能只让模型写算法题
    O oneMoreTry

    我们先做只读问答和 PR 建议,不自动提交。

    AI 工程讨论 coding evaluation agent

  • 代码能力评测不能只让模型写算法题
    O oneMoreTry

    那怎么打分?

    AI 工程讨论 coding evaluation agent

  • 代码能力评测不能只让模型写算法题
    O oneMoreTry

    我们准备用模型做代码助手,评测时大家拿 LeetCode 题测。这样有意义吗?

    AI 工程讨论 coding evaluation agent

  • WebSocket 长轮询回退,把 Postgres 拖慢了
    O oneMoreTry

    修 Nginx 后 polling 请求下降了 80%,Postgres 活跃连接也稳了。

    实践复盘 websocket postgres proxy

  • WebSocket 长轮询回退,把 Postgres 拖慢了
    O oneMoreTry

    我们之前只有在线人数,没有连接方式。

    实践复盘 websocket postgres proxy

  • WebSocket 长轮询回退,把 Postgres 拖慢了
    O oneMoreTry

    Nginx 访问日志里 /socket.io/ 很多,200 和 400 混着来。

    实践复盘 websocket postgres proxy

  • WebSocket 长轮询回退,把 Postgres 拖慢了
    O oneMoreTry

    我们修 WebSocket 前,socket.io 一直回退到 polling。站没完全坏,但数据库查询变多。

    实践复盘 websocket postgres proxy

  • 单 agent 够用时,别急着拆成多智能体
    O oneMoreTry

    我们给资料员输出加了格式:事实、来源、置信度、未覆盖问题。别让它写建议。

    AI 工程讨论 agent multi-agent workflow evaluation

  • 模型评测里“代码能力”到底测什么?
    O oneMoreTry

    我会用历史 issue 回放,指标加测试通过、diff 大小、风格一致、是否泄露敏感。

    AI 工程讨论 代码能力 deepseek qwen claude gpt

  • 模型评测里“代码能力”到底测什么?
    O oneMoreTry

    我看很多模型都说代码能力强。生产里评测代码能力,除了算法题还要测什么?

    AI 工程讨论 代码能力 deepseek qwen claude gpt

  • 代码助手场景,DeepSeek、Qwen、Claude、GPT 谁更像同事?
    O oneMoreTry

    评测别用 HumanEval 单项。真实场景要有“读旧代码、按风格修改、跑失败测试、再修”的链路。

    AI 工程讨论 deepseek qwen claude gpt 代码能力
  • 登录

  • 没有帐号? 注册

  • 登录或注册以进行搜索。
Powered by NodeBB Contributors
  • 第一个帖子
    最后一个帖子
0
  • 版块
  • 最新
  • 热门
  • 标签
  • 搜索
  • 成员