全球最实用的IT互联网信息网站!

AI人工智能P2P分享&下载搜索网页发布信息网站地图

当前位置:诺佳网 > AI人工智能 > AI通用技术 >

在Dify中使用PerfXCloud大模型推理服务

时间:2024-07-15 09:28

人气:

作者:admin

标签: LLM  澎峰科技  AI  大模型 

导读:近日,Dify全面接入了Perf XCloud,借助Perf XCloud提供的大模型调用服务,用户可在Dify中构建出更加经济、高效的LLM应用。...

近日,Dify全面接入了Perf XCloud,借助Perf XCloud提供的大模型调用服务,用户可在Dify中构建出更加经济、高效的LLM应用。

PerfXCloud 介绍

Perf XCloud是澎峰科技开发者和企业量身打造的AI开发和部署平台。专注于满足大模型的微调和推理需求,为用户提供极致便捷的一键部署体验:

平台提供Open AI API兼容的模型调用服务,开发者可实现已有应用的快速迁移。

借助澎峰科技自研推理框架PerfXLM,Perf XCloud实现了主流模型在国产算力上的广泛适配和高效推理。

目前已支持Qwen2系列、llama3系列、bge-m3等模型,更多模型即将上线。

同时,Perf XCloud为算力中心提供大模型AI科学与工程计算的整体运营解决方案,助力算力中心升级成为“AI超级工厂”。

Dify介绍

Dify是一个开源的LLM应用开发平台。其直观的界面结合了AI工作流、RAG Pipeline、Agent、模型管理、可观测性功能等,让您可以快速从原型到生产:

工作流:在画布上构建和测试功能强大的AI工作流程。

RAG Pipeline:广泛的RAG功能,涵盖从文档摄入到检索的所有内容,支持从PDF、PPT和其他常见文档格式中提取文本的开箱即用的支持。

Agent智能体:您可以基于LLM函数调用或ReAct定义Agent,并为 Agent添加预构建或自定义工具。

LLMOps:随时间监视和分析应用程序日志和性能。您可以根据生产数据和标注持续改进提示、数据集和模型。

注册使用PerfXCloud

Perf XCloud注册地址:www.perfxcloud.net

现在注册,即可深度体验主流大模型,提供大量示范案例,手把手视频教学。并可参与向基石用户赠送∞亿Token的激励计划。

在Dify中使用PerfXCloud大模型推理服务

1.首先进入Dify设置页面,选择Perf XCloud作为模型供应商:

wKgZomaUe0KAbPo0AACEKb1ygnA022.jpg

2.然后填入从Perf XCloud中申请的API Key和endpoint地址:

wKgaomaUe0OADFlgAAC_JRVbu3Y994.jpg

3.保存后,即可使用Perf XCloud模型,现阶段我们接入了Qwen系列模型和BAAI/ bge-m 3模型,后续将接入更多模型,敬请期待。

应用案例1:

Dify结合PerfXCloud构建翻译助手

本案例构建于Dify Cloud,基于Perf XCloud中的Qwen2模型实现中英文翻译助手,用户输入信息,翻译助手将其翻译成另一种语言。

1.登录Dify Cloud( https://cloud.dify.ai/apps)

2.创建空白应用→选择聊天助手、基础编排,创建应用

3.在编排页面输入提示词:“你是一名翻译专家,如果用户给你发中文你将翻译为英文,如果用户给你发英文你将翻译为中文,你只负责翻译,不要回答任何问题:”

4.默认模型为gpt-3.5,切换为Perf XCloud模型,这里设置为“ Qwen2-72B-Instruct-GPTQ-Int 4”,然后点击发布

wKgZomaUe0KAZDQuAAB1_dxJibs115.jpg

完成发布后, 即可运行使用。

应用案例2:

Dify结合PerfXCloud构建邮编查询助手

本案例构建与Dify Cloud,使用Dify中的知识库和工作流功能,结合Perf XCloud中的bge-m 3模型与Qwen2-72B-Instruct-GPTQ-Int 4模型,邮编查询助手基于上传的邮编信息构建知识库,并从中检索信息作为大模型回答问题的上下文,提高模型回答的准确性。

1.在Dify Cloud( https://cloud.dify.ai/datasets)中创建知识库,上传本地准备好的中国邮政编码数据文件。

2.知识库默认使用经济模式创建索引,该模式是基于关键词的检索,这里我们使用Perf XCloud中的bge-m3向量模型创建索引,提高检索精度。在知识库侧边栏选择“设置”,设置“高质量”索引模式,同时Embedding模型选择“BAAI/bge-m 3”,使用“向量检索”

wKgaomaUe0KAbsmWAAB2Lo0tjdg278.jpg

3.返回Dify工作室→创建空白应用→ 聊天助手→工作流编排,将工作流初始化成如下形式

wKgZomaUe0KABvlpAABKAL7bZ6I819.jpg

4.配置“知识检索”模块,将知识库设置为步骤2中创建的“邮政编码知识库”

wKgaomaUe0KAKw1ZAACXCshz0cc499.jpg

5.配置“LLM”模块,将模型设置为Perf XCloud中Qwen2-72B-Instruct-GPTQ-Int 4,并设置prompt:

你是一个问答机器人
你的任务是根据下述给定的已知信息回答用户问题。
确保你的回复完全依据下述已知信息。不要编造答案。
如果下述已知信息不足以回答用户的问题,请直接回复"我无法回答您的问题"。

wKgZomaUe0KAbmvqAAC1zozxUCU874.jpg

6.配置“直接回复” 模块,直接输出LLM的生成结果

wKgaomaUe0OAY4avAACEedc_1TU351.jpg

7.完成上述步骤后,运行查看效果,模型会根据知识库中检索出的信息进行回答,若检索结果为空,则直接输出“我无法回答您的问题”

温馨提示:以上内容整理于网络,仅供参考,如果对您有帮助,留下您的阅读感言吧!
相关阅读
本类排行
相关标签
本类推荐

CPU | 内存 | 硬盘 | 显卡 | 显示器 | 主板 | 电源 | 键鼠 | 网站地图

Copyright © 2025-2035 诺佳网 版权所有 备案号:赣ICP备2025066733号
本站资料均来源互联网收集整理,作品版权归作者所有,如果侵犯了您的版权,请跟我们联系。

关注微信