基于大模型的高并发轻量级数据通道自适应负载均衡方法

首页 AI资讯 AI技术研报 AI监管政策 AI产品测评 AI商业项目 arena全球大模型排行榜 AI产品热榜 AI 源力市场 AI专利库 AI需求对接 AI新闻日报
下载 AITNT APP
🍎 iOS 下载 🤖 Android 下载
正文
推荐专利
基于大模型的高并发轻量级数据通道自适应负载均衡方法
申请号:CN202511475706
申请日期:2025-10-16
公开号:CN120980082B
公开日期:2025-12-26
类型:发明专利
摘要
本发明涉及分布式计算技术领域,尤其涉及一种基于大模型的高并发轻量级数据通道自适应负载均衡方法,该方法在当前LLM推理请求到达均衡负载器时,根据任一服务器的历史请求记录集合中每个历史请求与当前LLM推理请求的硬度相似性,对利用项进行初始优化,得到任一服务器处理当前LLM推理请求的初始优化利用项;构建预期残差补偿因子,利用预期残差补偿因子对初始优化利用项进行再次优化,得到最佳利用项;根据任一服务器的最佳利用项,得到任一服务器的决策得分,根据每个服务器的决策得分,对当前LLM推理请求进行自适应负载均衡,使得在长期运行中保持高效的负载均衡能力。
技术关键词
负载均衡方法 服务器 语义向量 因子 预测残差 决策 分布式计算技术 时效性 时间差 基准 分子
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号