ChatGPTNextWeb/NextChat

[Feature Request] 更灵活的视觉模型判别

Open

#5,843 opened on Nov 18, 2024

View on GitHub
 (4 comments) (1 reaction) (0 assignees)TypeScript (59,717 forks)batch import
enhancementgood first issuehelp wanted

Repository metrics

Stars
 (87,992 stars)
PR merge metrics
 (No merged PRs in 30d)

Description

🥰 需求描述

当前项目采用固定的关键词、排除关键词的方案进行视觉模型判别(isVisionModel),加上各模型厂商并没有采取一致的命名方案,导致模型视觉判别滞后和频繁修改,如最新的 gemini-exp-1114 也支持视觉能力了,但是当前的视觉判别不能直接适配,急需优化更灵活的视觉模型判别方法

🧐 解决方案

可能的解决方案:

  1. 允许通过环境变量给指定的模型加上视觉能力,如: VisionModel=model_1,model_2,model_3
  2. 允许前端网页配置、后台解析支持视觉能力的模型
  3. ...

📝 补充信息

No response

Contributor guide