
Medical Realities
医疗领域扩展现实体验,用于教育和培训。
一个开源的AI网关,用于管理多个大型语言模型(LLM)提供商,如OpenAI、Anthropic、Gemini、Ollama、Mistral和Cohere。它提供内置分析、保护措施、速率限制、缓存和管理控制。支持HTTP和gRPC接口。
1. 配置Config.toml文件,填写您的API密钥和模型设置。
2. 运行Docker容器,挂载Config.toml文件。
3. 使用curl命令向网关发起API请求,指定LLM提供商。
多提供商支持
HTTP和gRPC接口
智能故障转移
智能缓存
速率限制
管理员仪表板
内容保护措施
企业日志记录
系统提示注入
#1 根据可用性或成本管理和路由请求到不同的LLM提供商。
#2 实施速率限制以防止滥用和控制成本。
#3 缓存响应以减少延迟和成本。
#4 通过管理员仪表板监控LLM使用情况和性能。
#5 过滤内容以确保安全和合规。